掌桥专利:专业的专利平台
掌桥专利
首页

高保真度限制性内切核酸酶

文献发布时间:2023-06-19 12:04:09



本申请是申请日为2008年07月14日、申请号为200880106647.5(PCT/US2008/069997)、题为“高保真限制性内切核酸酶”的专利申请的分案申请(其申请日为2008年07月14日、申请号为201610041448.7、题为“高保真限制性内切核酸酶”)的分案申请。

背景技术

限制性内切核酸酶是以序列特异性方式切割双链DNA的酶(Roberts,R.J.,ProcNatl Acad Sci U S A,102:5905-5908(2005);Roberts,et al.,Nucleic Acids Res,31:1805-1812(2003);Roberts,et al.,Nucleic Acids Res,33:D230-232(2005);Alves,etal.,

大约3,000种已知的限制性内切核酸酶对它们的超过250种不同靶序列的特异性可以被考虑为它们最令人感兴趣的特性。在发现第一种限制性内切核酸酶的序列特异性性质(Danna,et al.,Proc Natl Acad Sci U S A,68:2913-2917(1971);Kelly,et al.,JMol Biol,51:393-409(1970))之后,科学家们没有花费太长时间发现了某些限制性内切核酸酶在非最适条件下切割与其限定识别序列相似但不相同的序列(Polisky,et al.,ProcNatl Acad Sci U S A,72:3310-3314(1975);Nasri,et al.,Nucleic Acids Res,14:811-821(1986))。该松弛的特异性(relaxed specificity)被称为限制性内切核酸酶的星号活性(star activity)。已提出,限制性内切核酸酶和DNA之间水介导的相互作用是特异性复合物和星复合物(star complexes)之间的主要差异(Robinson,et al.,J Mol Biol,234:302-306(1993);Robinson,et al.,Proc Natl Acad Sci U S A,92:3444-3448(1995),Sidorova,et al.,Biophys J,87:2564-2576(2004))。

星号活性是分子生物学反应中的问题。星号活性在克隆载体或其他DNA中引入不希望的切割。在例如法医应用的情况中,在这种情况下某些DNA底物需要被限制性内切核酸酶切割以产生独特的指纹图谱,星号活性将改变切割图案特性,从而使分析复杂化。避免星号活性在例如链置换扩增技术(Walker,et al.,Proc Natl Acad Sci U S A,89:392-396(1992))和基因表达的系列分析(Velculescu,et al.,Science,270:484-487(1995))的应用中也是关键的。

发明概述

在本发明的一个实施方式中,提供组合物,所述组合物包含具有至少一个人工引入突变和至少2的总保真度指数(FI)改进因子(overall fidelity index improvementfactor)的限制性内切核酸酶,在预定的缓冲液中所述限制性内切核酸酶能以与不存在所述人工引入突变的限制性内切核酸酶的切割活性至少相似的切割活性切割底物,所述人工引入突变是靶向突变、饱和诱变或通过PCR扩增过程引入的突变的至少一个的产物。

在本发明的进一步的实施方式中,人工引入突变中的至少一个是靶向突变,其是由用带相反电荷的残基置换天然存在的残基产生的。丙氨酸或苯丙氨酸可以置换靶位点处的天然存在的残基。

在本发明的进一步的实施方式中,上面描述类型的组合物包括选自下列的不存在人工引入突变的限制酶:BamHI、EcoRI、ScaI、SalI、SphI、PstI、NcoI、NheI、SspI、NotI、SacI、PvuII、MfeI、HindIII、SbfI、EagI、EcoRV、AvrII、BstXI、PciI、HpaI、AgeI、BsmBI、BspQI、SapI、KpnI和BsaI。

本发明进一步的实施方式包括在表4中列出的组分。

在本发明的进一步的实施方式中,提供编码在表4中列出的酶的任一种的DNA,包含该DNA的载体和从该载体表达蛋白质的宿主细胞。

在本发明的一个实施方式中,提供具有下列步骤的方法:(a)鉴定在具有星号活性的限制性内切核酸酶的氨基酸序列中,哪些氨基酸残基是带电荷的氨基酸;(b)在编码该限制性内切核酸酶的基因序列中,突变编码一个或更多个带电荷的残基的一个或更多个密码子;(c)产生在不同的带电荷的残基具有一个或更多个不同密码子突变的基因序列文库;(d)获得突变的基因序列表达的蛋白质组(a set of proteins);和(e)测定每一表达蛋白质在预定缓冲液中的FI和切割活性。

该方法的一个实施方式包括在限定的缓冲液组中对属于该蛋白质组的蛋白质测定总FI改进因子的步骤,其中例如,缓冲液组包含NEB1、NEB2、NEB3和NEB4缓冲液。

该方法的一个实施方式包括上面描述的步骤和另外地,在突变带电荷的氨基酸的密码子的同一步骤或随后步骤中,突变编码羟化氨基酸或酰胺氨基酸的密码子。

在上面描述的本发明的一个实施方式中,将除了酪氨酸以外的密码子突变为丙氨酸,将酪氨酸突变为苯丙氨酸。

在一个进一步的实施方式中,使用对一个或更多个突变密码子的饱和诱变,改进总FI改进因子。

附图简述

对于图1-32:

*标记表示其左侧的泳道含有最低浓度的观察到星号活性的酶。

#标记指示出不完全切割的泳道,该泳道与含有足够完全切割底物的浓度的酶的泳道相邻并位于其右侧。

灰色三角形表示限制性内切核酸酶浓度的连续减少(serial decrease)。

“U”表示酶单位。

在图1-32中描述的每一反应中,反应混合物含有3μl体积的——除非另外规定——来自New England Biolabs,Inc.(NEB),Ipswich,MA的缓冲液(参见表1和NEB目录),3μl体积的——除非另外规定——来自NEB,Ipswich,MA的稀释剂中的指定限制性内切核酸酶(参见表1和NEB目录),以及不定体积的指定底物(含有0.6μg)和使反应混合物达到总共30μl的体积的水。在37℃下进行反应,温育时间为1小时。在0.8%琼脂糖凝胶上分析结果。当反应混合物总体积、底物量、反应温度或温育时间与上述不同时,在图的说明中提供数值。

在图1、5、8、11-18和20-32中,在凝胶的右侧提供理论消化图谱。那些仅具有一个限制性内切核酸酶位点的底物应该从超螺旋形式消化为一个线性带。

图1显示通过在NEB3缓冲液中使用稀释剂A对WT ScaI(1,200U)制剂进行两倍连续稀释而消化1.2μlλDNA底物(0.6μg)、并在琼脂糖凝胶上检查消化产物,对野生型(WT)ScaI的FI进行的测定。没有星号活性的限制性内切核酸酶的最高浓度用实心箭头显示;和引起底物完全消化的最小浓度用空心箭头示出。

图2A-D示出用WT BamHI或BamHI(E86P)酶消化0.5μl pUC19底物(0.5μg)1小时的结果,所述WT BamHI或BamHI(E86P)酶是用稀释剂A三倍连续稀释的,其起始浓度为172U或512U。中间的泳道是NEB 1kb标记(New England Biolabs,Inc.(NEB),Ipswich,MA)。

图2A示出使用NEB1缓冲液的结果。

图2B示出使用NEB2缓冲液的结果。

图2C示出使用NEB3缓冲液的结果。

图2D示出使用NEB4缓冲液的结果。

图3A-B示出在两个时间期间BamHI(E86P)活性的比较,其在NEB2缓冲液使用0.6μlpBR322底物(其仅包含1个BamHI切割位点),使用初始浓度600U、用稀释剂A以2-倍连续稀释的酶。

图3A示出1小时的结果。

图3B示出14小时的结果。

图4A-B示出在琼脂糖凝胶上,在两种不同的缓冲液中温育14小时后,使用以稀释剂A 2倍连续稀释的BamHI-HF(E163A/E167T),对0.6μl pBR322底物的切割。

图4A示出使用NEB2缓冲液和600U初始浓度酶的结果。

图4B示出使用NEB1缓冲液和2,400U初始浓度酶的结果。

图5A-B示出在NEB4缓冲液中应用BamHI-HF和WT BamHI的切割反应的比较。该反应在NEB4缓冲液中进行,使用1.2μlλDNA底物,处于使用稀释剂A的2-倍连续稀释中。

图5A示出起始浓度1,200U的WT BamHI,其中FI等于4。

图5B示出起始浓度2,400U的BamHI-HF,其中FI≥4000。

图6A-D示出在使用NEB稀释剂C 3-倍连续稀释下,在NEB1-4缓冲液中WT EcoRI和EcoRI(K62A)的比较。反应混合物包含在NEB1-4缓冲液中的2μlλDNA底物(1μg)。

图6A示出两倍连续稀释后,在NEB2缓冲液中120U WT EcoRI和240U的EcoRI(K62A)的切割结果。

图6B示出两倍连续稀释后,在NEB4缓冲液中120U WT EcoRI和240U的EcoRI(K62A)的切割结果。

图6C示出两倍连续稀释后,在NEB1缓冲液中60U WT EcoRI和120U的EcoRI(K62A)的切割结果。

图6D示出两倍连续稀释后,在NEB3缓冲液中120U WT EcoRI和60U的EcoRI(K62A)的切割结果。

图7A-C示出用两种不同的EcoRI突变体和WT EcoRI的切割结果。示出100,000U酶和其在稀释剂C中的10倍连续稀释物在10小时中的消化,其在各种缓冲液中使用0.6μl的Litmus28底物进行。在Litmus28底物中仅存在一个EcoRI切割位点。

图7A:在NEB4缓冲液中的EcoRI突变体K62E。

图7B:在NEB4缓冲液中的EcoRI突变体K62A。

图7C:在EcoRI缓冲液中的WT EcoRI(参见NEB目录2007-8)。

图8A-B示出在NEB4缓冲液中EcoRI-HF和WT EcoRI的比较。反应使用1.2μlλDNA底物,其处于使用稀释剂C的2-倍连续稀释下。

图8A:在NEB4缓冲液中,具有19,200U起始浓度的WT EcoRI显示FI=4。

图8B:在NEB4缓冲液中,具有38,400起始浓度的UEcoRI-HF显示FI=16,000。

图9A-B示出WT ScaI(4.8U)、ScaI(H193A)(9.6U)、ScaI(S201F)(19.2U)和ScaI(H193A/S201F)(19.2U)的连续稀释的比较。每一样品最初稀释1/10,然后在具有指定百分比甘油的NEB2缓冲液中2-倍连续稀释。每一反应混合物包含2μl的λDNA底物(1μg)。

图9A:5%甘油。

图9B:37%甘油。

图10A-D示出WT ScaI和ScaI-HF(H193A/S201F)的比较。酶(如规定的单位浓度)各自用稀释剂A以2.5-倍连续稀释。该反应混合物含有2μlλDNA底物和NEB1-4缓冲液。

图10A:在NEB2缓冲液中切割。

图10B:在NEB4缓冲液中切割。

图10C:在NEB1缓冲液中切割。

图10D:在NEB3缓冲液中切割。

图11A-H示出对SalI-HF和WT SalI的FI测定。两种酶都使用稀释剂A以2-倍连续稀释。该反应混合物含有2μl HindIII-消化的λDNA底物。

图11A、B、C和D示出1,200U、1,200U、300U和1,200U的SalI-HF的连续稀释,其分别在NEB1、2、3和4缓冲液中显示FI≥1,000、FI≥2,000、FI≥500和FI≥2,000。

图11E、F、G和H示出19.2U、150U、9,600U和38.4U的WT SalI的连续稀释,其分别在NEB1、2、3和4缓冲液中显示FI=8、FI=1、FI=32和FI=1。

图12A-B示出在NEB 4缓冲液中与1.2μlλDNA底物反应的、在稀释剂A中的SphI-HF(19,200U)和在稀释剂B中的WT SphI(143,600U)的2-倍连续稀释的结果。

图12A示出WT SphI的切割。

图12B示出SphI-HF的切割。

图13A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的PstI-HF(300U和150U)和2-倍连续稀释的WT PstI(2,400U和4,800U)对1.2μlλDNA底物的切割。连续稀释在稀释剂C中进行。

图13A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中PstI-HF的切割。

图13B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT PstI的切割。

图14A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NcoI-HF(4,800U和600U)和2-倍连续稀释的WT NcoI(4,800U和1,200U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。

图14A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NcoI-HF的切割。

图14B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NcoI的切割。

图15A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NheI-HF(287,200U和76.8U)和2-倍连续稀释的WT NheI(9,600U和300U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂A中进行。

图15A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NheI-HF的切割。

图15B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NheI的切割。

图16A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的SspI-HF(9,600U和38.4U)和2-倍连续稀释的WT SspI(19,200U和19,200U)对1.2μlλDNA底物的切割。连续稀释在稀释剂C中进行。

图16A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中SspI-HF的切割。

图16B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT SspI的切割。

图17A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NotI-HF(287,200U和19,200U)和2-倍连续稀释的WT NotI(19,200U和76,800U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂C中进行。

图17A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NotI-HF的切割。

图17B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NotI的切割。

图18A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的SacI-HF(4,800U和76.8U)和2-倍连续稀释的WT SacI(19,200U和1200U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂A中进行。

图18A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中SacI-HF的切割。

图18B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT SacI的切割。

图19A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的PvuII-HF(9,600U和19.2U)和2-倍连续稀释的WT PvuII(19,200U和300U)对0.6μl pBR322DNA底物的切割。连续稀释在稀释剂A中进行。

图19A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中PvuII-HF的切割。

图19B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT PvuII的切割。

图20A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的MfeI-HF(300U和19.2U)和2-倍连续稀释的WT MfeI(2,400U和38.4U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。

图20A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中MfeI-HF的切割。

图20B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT MfeI的切割。

图21A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的HindIII-HF(4,800U和1,200U)和2-倍连续稀释的WT HindIII(9,600U和4,800U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。

图21A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中HindIII-HF的切割。

图21B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT HindIII的切割。

图22A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释SbfI-HF(起始浓度:76,800U)和WT SbfI(起始浓度:76,800U),对1.2μlλDNA底物的切割。

图22A示出通过WT SbfI的切割。

图22B示出通过SbfI-HF的切割。

图23A-B示出分别在NEB2和NEB1缓冲液中,使用2-倍连续稀释的EagI-HF(1,200U和600U)和2-倍连续稀释的WT EagI(150U和38.4U)对1.2μl pXba DNA底物的切割,其应用稀释剂C。

图23A示出NEB2缓冲液(上图)和NEB1缓冲液(下图)中EagI-HF的切割。

图23B示出NEB2缓冲液(上图)和NEB1缓冲液(下图)中WT EagI的切割。

图24A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释EcoRV-HF(起始浓度:38,400U)和WT EcoRV(起始浓度:2400U),对1.2μl pXba DNA底物的切割。

图24A示出通过WT EcoRV的切割。

图24B示出通过EcoRV-HF的切割。

图25A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释AvrII-HF(起始浓度:1,200U)和WT AvrII(起始浓度:1,200U),对1.2μl T7 DNA底物的切割。

图25A示出通过WT AvrII的切割。

图25B示出通过AvrII-HF的切割。

图26A-B示出在NEB4缓冲液中,在稀释剂A中2倍连续稀释BstXI-HF(起始浓度:300U)和WT BstXI(起始浓度:38.4U),对1.2μlλDNA底物的切割。该反应在55℃进行。

图26A示出通过WT BstXI的切割。

图26B示出通过BstXI-HF的切割。

图27A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释PciI-HF(起始浓度:600U)和WT PciI(起始浓度:300U),对1.2μl pXba DNA底物的切割。

图27A示出通过WT PciI的切割。

图27B示出通过PciI-HF的切割。

图28A-B示出在NEB2缓冲液中,使用稀释剂A以2倍连续稀释HpaI-HF(起始浓度:4,800U)和WT HpaI(起始浓度:9,600U),对1.2μlλDNA底物的切割。

图28A示出通过WT HpaI的切割。

图28B示出通过HpaI-HF的切割。

图29A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释AgeI-HF(起始浓度:600U)和WT AgeI(起始浓度600U),对1.2μl pXba DNA底物的切割。

图29A示出通过WT AgeI的切割。

图29B示出通过AgeI-HF的切割。

图30A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释BsmBI-HF(起始浓度:300U)和WT BsmBI(起始浓度4,800U),对1.2μlλDNA底物的切割。该反应在55℃下进行。

图30A示出通过WT BsmBI的切割。

图30B示出通过BsmBI-HF的切割。

图31A-B分别示出MluCIM的DNA序列(SEQ ID NO:1)和蛋白序列(SEQ ID NO:2),用于EcoRI和MfeI的表达。

图32示出Hpy166IIM的DNA序列(SEQ ID NO:3),用于SalI的表达。

图33A-B分别示出MfeI的DNA序列(SEQ ID NO:4)和蛋白序列(SEQ ID NO:5)。

图34A-B分别示出BstXI的DNA序列(SEQ ID NO:6)和蛋白序列(SEQ ID NO:7)。

图35A-B分别示出M.BstXI的DNA序列(SEQ ID NO:8)和蛋白序列(SEQ ID NO:9)。

图36A-B分别示出S.BstXI的DNA序列(SEQ ID NO:10)和蛋白序列(SEQ ID NO:11)。

图37A-B分别示出PciI的DNA序列(SEQ ID NO:12)和蛋白序列(SEQ ID NO:13)。

图38A-B分别示出M.PciI的DNA序列(SEQ ID NO:14)和蛋白序列(SEQ ID NO:15)。

图39示出编码MI.EarI的DNA序列(SEQ ID NO:17),所述MI.EarI识别CTCTTC并且在N4胞嘧啶或N6腺嘌呤处甲基化,用于克隆SapI和BspQI。

图40示出编码M2.EarI的DNA序列(SEQ ID NO:18),所述M2.EarI识别CTCTTC并且在N4胞嘧啶或N6腺嘌呤处甲基化,用于克隆SapI和BspQI。

图41A-B示出测定1μl WT BspQI和1μl突变体(K279P/R388F)BspQI(起始浓度分别为512U和1,024U)的FI的琼脂糖凝胶,其通过使用稀释剂A和NEB1缓冲液加10%甘油以2倍连续稀释来切割1μl pUC19 DNA底物进行。该反应在50℃进行。

图42示出测定5μl WT SapI和5μl突变体(K273A)SapI(起始浓度分别为32U和16U)的FI的琼脂糖凝胶,其通过使用稀释剂A和NEB2缓冲液加25%DMSO以2倍连续稀释来切割pUC19 DNA底物进行。

图43A-B示出通过5μl WT KpnI和5μl D16N/E132A/D148E KpnI(初始浓度分别为32U和256U)得到的pXba的催化活性和星号活性。使用含有10mM pH 7.4的Tris-HCl、50mMKCl、0.1mM EDTA、1mM DTT和50%甘油的稀释剂在NEB2缓冲液中,以2-倍连续稀释的该酶消化2μl pXba DNA底物(0.5μg),其中使用水补充至50μl的总体积。

图44A-G示出表1中的酶的氨基酸序列,和以前没有公开的表1中酶的DNA序列。

发明详述

本发明的实施方式提供选择具有希望特性的限制性内切核酸酶的一般方法。该一般方法依赖于适当的分析测定希望的限制性内切核酸酶是否已经产生。特别地,该一般方法的一个实施方式提供具有一组步骤的系统筛查方法。通过使用多种限制性内切核酸酶实施数百个反应,已经推导出该方法。本文提供的实例的大多数涉及鉴定具有降低星号活性但是其切割活性至少与WT限制性内切核酸酶相似的限制性内切核酸酶。然而,期望可以成功地运用同一方法以改变(修饰)限制性内切核酸酶的其他性质,例如涉及在期望缓冲液中的改进的切割活性、热稳定性、在限定条件中的反应速率等。

如上所述,所关心的终点是将具有星号活性的限制性内切核酸酶转化为具有显著减少星号活性的高保真度限制性内切核酸酶。星号活性指单个限制性内切核酸酶在切割特异性方面的混乱。术语“星号活性降低”和“保真度增加”在本文可互换使用。尽管限制性内切核酸酶特征为其在特定序列处切割DNA的性质,但是一些限制性内切核酸酶另外地在该DNA的第二(次级)位点处无效率地切割DNA。该种次级切割可以一贯地发生或者可以仅仅在某些条件例如下列条件之一下出现:浓度增加、某些缓冲液、温度、底物类型、存储和温育时间。

通常承认对由构成蛋白质和决定特异性的数以百计的氨基酸产生的复杂环境所知甚少。现有技术的一个方法已经利用晶体学来鉴定酶和其底物之间的接触点。但是,晶体学对于在非自然化学环境中及时冷冻结构方面具有局限性。

使用现有的分析技术,已经证明确定蛋白质中任何位点处氨基酸的贡献和底物分子结构所起的作用的规则是难以捉摸的。例如,这里显示,突变限制性内切核酸酶中的一个氨基酸可以引起所有或部分的活性损失。

在本文中,没有提出结构解释以说明为什么星号活性可以随着高甘油浓度(>5%v/v)、高的酶与DNA比例(通常每μg DNA>100单位的酶)、低离子强度(<25mM的盐)、高pH(>8.0)、存在有机溶剂(例如DMSO、乙醇)和用其他的二价阳离子(Mn

本发明的实施方式涉及产生具有特定提高性质的修饰的限制性内切核酸酶,即具有增强的切割保真度而没有总切割活性的显著减少或从制造该蛋白质的宿主细胞的显著产量下降。本文已经发展用于发现具有提高性质的突变体的方法是详尽试验的结果,并且生成酶的性质已经在指定条件的背景中限定。本文描述的方法可用来在预定条件下改变任何限制性内切核酸酶的酶促性质,但是不限于所述具体的限定条件。

该方法从负责同源活性和星号活性的氨基酸是不同的这一认识而得出。本文描述的高保真度限制性内切核酸酶的工程化显示同源活性和星号活性可以分开,并且存在影响这些不同活性的不同的关键氨基酸残基。被发现影响星号活性的氨基酸的位置不一定在蛋白质的活性部位内发现。通过发展在确定FI(也参见Wei et al.Nucleic Acid Res.,36,9,e50(2008))和总保真度指数改进因子的形式方面成功的标准,本文已经第一次确定任何限制性内切核酸酶的切割性质。

“总保真度指数改进因子(overall fidelity index improvement factor)”指在选择的缓冲液组中具有最大切割活性的突变体的最高FI除以具有最大切割活性的相应WT内切核酸酶的最高FI。选择的组可以是大于1的任何大小,但是实际上将含有小于10种不同的缓冲液,并且更优选地含有4种缓冲液。该组也可包括小于4种缓冲液。另外地而不仅仅对于由NEB1、NEB2、NEB3和NEB4组成的缓冲液组,至少2的总FI改进因子应优选地适用于要求保护的发明的任何突变限制性内切核酸酶。

通过将相同量的酶与相同量和类型的底物在相同条件下反应,并且视觉上比较电泳后凝胶上的切割图,以便切割产物的量表现在误差的标准容限内是相同的并且其中定量相似性大于10%,可以测量“相似的切割活性”。

“人工的”指“人造的”。

“标准条件”指从在NEB1-4缓冲液中获得的结果计算的总FI改进因子。

本文描述的一般方法已经用27种限制性内切核酸酶示例:AgeI、AvrII、BamHI、BsaI、BsmBI、BspQI、BstXI、EagI、EcoRI、EcoRV、HindIII、HpaI、KpnI、MfeI、NcoI、NheI、NotI、PciI、PstI、PvuII、SacI、SalI、SapI、SbfI、ScaI、SphI和SspI限制性内切核酸酶。然而,如上所述,预期该方法对工程化具有显著星号活性的任何限制性内切核酸酶是有效的。

该方法的实施方式利用一般的方法产生具有减少星号活性的突变体限制性内切核酸酶。对于某些酶,已经证明突变被确定在两个同切点酶之间保守的带电荷的残基是有用的(参见例如实施例25中的SapI)。然而,一般而言,该方法包括鉴定内切核酸酶的蛋白序列内所有的带电荷和极性残基的第一步骤。例如,带电荷的氨基酸和极性残基包括酸性残基Glu和Asp;碱性残基His、Lys和Arg;酰胺残基Asn和Gln;芳族残基Phe、Tyr和Trp;和亲核残基Cys。各残基被靶向并突变为Ala,并且针对希望的保真度增加的性质,筛查这些靶向突变的产物。如果获得的突变体没有一个提供令人满意的结果,下一步是靶向突变所有的羟化氨基酸,即Ser、Thr和Tyr,优选的突变是Ser和Thr突变为Ala和Tyr突变为Phe。也可能同时靶向突变两类残基,如在实施例16-23中所做的。突变为Ala可以被突变为Val、Leu或Ile所取代。

在这些分析之后,如果上述步骤中产生的一种或更多种优选的突变体在选择的检验下仍然具有低于标准的性能,这些突变体可以被选择并再次突变为另外可能的18种氨基酸的每一种。这被称为饱和诱变。饱和诱变提供EcoRI(实施例2)、部分BamHI(实施例1)和PvuII(实施例12)的优选的高保真度突变体。依赖饱和诱变的结果,下一步将以靶向或随机或者这两种方式将另外的突变引入限制性内切核酸酶。在实施例11中,SacI-HF包括在反向PCR期间偶然产生的随机突变。在实施例20中,PciI-HF是随机突变的结果,而不是靶向突变的结果。在实施例26中,BspQI-HF含有被发现在增强保真度中协同作用的两个突变。

不同的靶向诱变方法例如反向PCR的应用可包括在蛋白质的第二位点引入非靶向突变。这些第二突变可偶然地提供需要的性质(参见实施例20)。检查那些具有多突变的突变酶是希望的,以确定是否所有的突变对观测的效果是必需的。在实施例11中,双突变体中Q117H对活性没有影响。在实施例20中,另外的自发突变表现独自为观察到的提高的保真度的原因,而在实施例24中,各个突变协同地作用。

在一些情况中,突变可提供除了提高的保真度之外的另外的优点(参见例如BamHI,其中E163A或P173A引起酶变得更热不稳定)。

根据其在一组标准缓冲液中的功能,选择实施例中提供的突变体的高保真度/减少星号活性的性质。如果选择不同的缓冲液组合物,那么其他的突变可以是优选的。然而,可以运用相同的方法来发现突变体。表4列出运用于每一限制性内切核酸酶并在标准缓冲液中提供总FI改进因子的突变。

提供至少2的总FI改进因子的高保真度限制性内切核酸酶的工程化包括一个或更多个下列步骤:

1.WT限制性内切核酸酶的星号活性的评估

在本发明的一个实施方式中,限制性内切核酸酶的星号活性的程度通过下列方法检测:对于适当的底物,使用高初始浓度的原液(stock)内切核酸酶和其连续稀释物(例如2倍或3倍稀释),测定内切核酸酶活性。限制性内切核酸酶的初始浓度是不重要的,只要其足以使在至少一个浓度中观察到星号活性,这样通过稀释,不再检测到星号活性。

适当的底物含有被同源内切核酸酶活性切割的核苷酸序列,并且在其中可以观察到星号活性。该底物可以是含有限制性内切核酸酶基因的载体或第二DNA底物。在表2中使用的底物的实例是pBC4、pXba、T7、lambda和pBR322。

原液限制性内切核酸酶的浓度最初被选择,以便星号活性可以容易地在WT和突变限制性内切核酸酶中识别和分析。根据2007-08NEB目录的指导,选择适当的稀释缓冲液例如NEB稀释剂A、B或C进行连续稀释。连续稀释的限制性内切核酸酶与预定浓度的适当的底物以反应容器大小确定的总反应体积进行反应。例如,在微量滴定板中进行多个反应是方便的,在微量滴定板中,30μl反应混合物是每孔适当的体积。因此,实例通常应用30μl中0.6μg的底物,其相当于50μl中的1μg底物。反应混合物中的底物的量不是关键的,但是优选其在反应之间为恒定。切割反应在预定温度(例如25℃、30℃、37℃、50℃、55℃或65℃)下进行标准时间例如一小时。可以通过任何标准技术例如通过0.8%琼脂糖凝胶电泳测定切割产物,以测定上面定义的保真度指数。

不是所有的限制性内切核酸酶都具有显著的星号活性,如从它们的FI确定的。然而,如果内切核酸酶具有不超过大约250的最高FI和小于100的最低FI,那么该限制性内切核酸酶被分类为具有显著的星号活性。这样的内切核酸酶被选为酶工程的标靶以增加对单一底物的保真度。在一些情况中,具有FI大于约500和FI小于约100的限制性内切核酸酶也被工程化以获得更好的切割活性。

下面表2列出一些工程化限制性内切核酸酶在工程化之前的FI。所有的样品在0.8%琼脂糖凝胶上进行分析。

表2

*底物:λ是λ噬菌体DNA;λ(H3)是HindIII-消化的λ噬菌体DNA;pXba是pUC19,具有XbaI-消化的腺病毒片段;pBC4:较短形式的pXba;T7:T7 DNA

**FI-1到FI-4:NEB缓冲液1、2、3和4中的酶的保真度指数。括号中的数是与缓冲液组的任何缓冲液中突变体限制性内切核酸酶的“最好”切割活性相比,在该缓冲液组的指定缓冲液中同一突变体限制性内切核酸酶的相对切割活性的值。

NEB缓冲液的组成如下:

NEB1:10mM Bis Tris丙烷-HCl、10mM MgCl

NEB2:50mM NaCl、10mM Tris-HCl、10mM MgCl

NEB3:100mM NaCl、50mM Tris-HCl、10mM MgCl

NEB4:50mM乙酸钾、20mM Tris-乙酸盐、10mM乙酸镁、1mM二硫苏糖醇(25℃下,pH7.9)。

***NEB稀释剂的组成如下。(在稀释中使用稀释剂代替水将保持反应中甘油浓度为常数。)

稀释剂A:50mM KCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、200mg/ml BSA。50%甘油(25℃下,pH7.4);

稀释剂B:300mM NaCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、500mg/mlBSA、50%甘油(25℃下,pH7.4);

稀释剂C:250mM NaCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、0.15%Triton X-100、200mg/ml BSA、50%甘油(25℃下,pH 7.4)。

2.高表达宿主细胞株的构建

如果宿主细胞能过表达针对其寻找减少星号活性的突变体限制性内切核酸酶,这是方便的。如果该限制酶在大肠杆菌中高度表达,那么星号活性可以容易在粗提物中检测到,这简化了高保真度限制性内切核酸酶的筛查。然而,突变的限制性内切核酸酶可以在任何宿主细胞中表达,条件是宿主细胞以某些方式被保护免于从酶切割产生的毒性。这可能包括:甲基化酶的存在;在提供接近基因组的屏障的细胞区室(例如包含体或周质)中产生;体外合成;在缺少宿主基因组中的切割位点的情况下在乳液(参见美国专利申请序列号12/035,872)中产生;在经受内含肽介导的连接的构成部件中制造酶,等。

为了生产,突变限制性内切核酸酶的过表达可以使用标准克隆技术来实现,例如使用大肠杆菌(E.coli)宿主,将内切核酸酶插入pUC19-衍生的表达载体,这是高拷贝的;和使用相对小的质粒,其能持续表达重组蛋白质。该载体可优选地含有适当的启动子例如lac启动子和邻近该启动子定位的多拷贝插入位点。可选地,可以选择需要基因表达的IPTG诱导的启动子。如果粗提物中的活性不是足够的,那么在粗提物中限制性内切核酸酶的柱纯化步骤可被进行。

3.限制性内切核酸酶的诱变

编码限制性内切核酸酶内的每个带电荷的基团或极性基团的DNA可以被单独靶向,并且突变的DNA被克隆并制备进行检测。可将多突变引入单独的限制性内切核酸酶基因。限制性内切核酸酶的靶向诱变可通过本领域已知的方法完成。本文使用的一个便利的方法是反向PCR。在该方法中,合成含有靶向密码子加在该密码子5’和3’侧上的多个核苷酸(例如18nt)的互补引物对。通过评估目的氨基酸残基周围的目的内切核酸酶的基因序列,可容易地完成适当引物的选择。通过REBASE和GenBank提供对基因序列的访问。本文在实施例中描述的内切核酸酶的序列在图31到38和44中提供。PCR的模板是含有限制性内切核酸酶基因的质粒。优选地,聚合酶为高保真度聚合酶,例如

4.筛查具有减少的星号活性的突变体限制性内切核酸酶

条件例如缓冲液组成、温度和稀释剂应该被限定,以测定突变体限制性内切核酸酶中的星号活性。表2和3示出重组内切核酸酶在37℃下使用三种不同的稀释剂在四种不同的缓冲液中突变之前和之后的FI。因此,可能确定哪些突变体具有至少2、超过10、至少50或超过500的总的希望提高的保真度指数因子并且选择酶作为优选的高保真度突变体。

在本发明的一个实施方式中,首先,在正常缓冲液条件下(不超过5%甘油),筛查突变体限制性内切核酸酶的活性。对于那些具有至少大约10%的WT限制性内切核酸酶活性的突变体,在促进星号活性的星号活性提高条件下——例如高甘油浓度和任选地高pH下,也测定活性。优选地,选择在正常的缓冲液中具有最小星号活性但是具有可接受的同源活性的突变体。然后,可提取质粒并测序,以验证该突变体。在一些情况中,星号活性不容易测量——甚至在高甘油和高pH条件下。替代地,测量和比较不同缓冲液中的活性,并且NEB4与NEB3切割活性比率最高的突变体可进一步针对星号活性改进进行检测。

5.对一个单个残基的饱和诱变

如前面部分所述的,第一步是将限制性内切核酸酶中的靶氨基酸突变为Ala。如果该结果不令人满意,那么进行饱和诱变。优选地,这通过两个方法之一进行。一个方法是将意图密码子改为NNN。诱变后,在正常条件下和促进星号活性的条件下分析多个菌落。可选地,可以选择不同的密码子,用于进行下列靶氨基酸的每一个的诱变,例如:Ala:GCT;Cys:TGC;Asp:GAC;Glu:GAA;His:CAC;Ile:ATC;Lys:AAA;Leu:CTG;Met:ATG;Asn:AAC;Pro:CCG;Gln:CAG;Arg:CGT;Ser:TCC;Thr:ACC;Val:GTT;Trp:TGG和Tyr:TAC。

6.组合

如果单一突变不充分减少星号活性,那么可以将超过一个的突变引入限制性内切核酸酶基因。突变组合和饱和诱变可以以任何顺序进行。

7.突变体纯化和改进的评估

高保真度突变体可以以多种方式纯化,其包括使用不同的色谱柱。对于常规的质量评估,一个FPLC肝素柱足以从该制品除去DNA和非特异性核酸酶。包括离子交换柱、疏水柱、大小排阻柱和亲和柱的多个柱可被用于进一步纯化。

在四种NEB缓冲液中,测量纯化的高保真度限制性内切核酸酶的FI,并且将其与WT限制性内切核酸酶的FI进行比较。高保真度限制性内切核酸酶在其最佳缓冲液中的FI与WT的FI的比率是总改进因子。

表3–示例性限制性内切核酸酶的FI*

*FI是不示出星号活性的最高浓度与完全消化底物的最低浓度的比率。

**括号中的数是与缓冲液组的任何缓冲液中突变体限制性内切核酸酶的最大切割活性相比,在该缓冲液组的指定缓冲液中同一突变体限制性内切核酸酶的相对切割活性的值。

表4–提供具有高保真度的限制性内切核酸酶的突变

对每种酶的突变通过分号分开。

所有上面和下面引用的参考文献,以及美国临时申请序列号60/959,203,被通过引用并入。

实施例

在氨基酸用单字母代码表示时,这拟为标准命名。该代码的解答例如在NEB目录2007/2008第280页上提供。

被用来克隆和作为底物的质粒具有如下序列:

pLaczz2(SEQ ID NO:102)、pSyx20-lacIq(SEQ ID NO:105)、pBC4(SEQ ID NO:103)、pXba(SEQ ID.NO:104)和pAGR3(SEQ ID NO:106)。pACYC在GenBank XO 6403中描述,T7在GenBank NC001604中描述,pUC18在GenBank L09136中描述,和pRRS在Skoglund etal.Gene,88:1-5(1990)中描述。pSX33通过将lacI基因插入pLG339中EcoRI位点处进行构建。pLG339在Stoker,et al.Gene 19,335-341(1982)中描述。

本文使用的称为NEB缓冲液的所有缓冲液可从New England Biolabs,Inc.(NEB),Ipswich,MA获得。

1.提取包含BamHI甲基化酶和BamHI内切核酸酶的质粒

用pUC18-BamHIR和pACYC184-BamHIM转化感受态大肠杆菌宿主细胞,并且通过使用标准小量制备技术的标准Qiagen小量制备方法(Qiagen,Valencia,CA)提取BamHIR。

2.诱变靶的选择

克隆并测序BamHI和相关的限制性内切核酸酶OkrAI。如果反应在37℃下、在NEB缓冲液(1、2和4)中进行,那么发现OkrAI具有显著的星号活性。本分析检验如此假设:作为星号活性原因的氨基酸残基(一个或更多个)在BamHI和OkrAI内切核酸酶之间是相似的。

BamHI的完整蛋白序列(SEQ ID NO:19)为:

OkrAI的完整蛋白序列(SEQ ID NO:20)为:

通过GCG对BamHI和OkrAI内切核酸酶的蛋白序列的“最佳拟合(Bestfit)”相似性分析示出下列结果,其中上面的蛋白序列是BamHI,下面的蛋白序列是OkrAI:

bamhir.pep x okrair.pep

发现BamHI中相似的带电荷的残基(D、E、H、K、R)是E28、K30、K52、K61、E77、K84、E86、K88、D94、K97、K106、E111、E113、H121、R122、K126、K146、D154、R155、E161、E163、E170、E182、K193、D196和R201。在上面的比较中,这些残基被加下划线。已知的突变体E77K、D94N、E111K和E113K以前被报道为失活的(Xu,Shuang-yong et al.J.Bacteriol.266:4425-4429(1991)),所以排除它们。最初的诱变选择靶向22个共有的带电荷的氨基酸残基,将其突变为丙氨酸:E28A、K30A、K52A、K61A、K84A、E86A、K88A、K97A、K106A、H121A、R122A、K126A、K146A、D154A、R155A、E161A、E163A、E170A、E182A、K193A、D196A和R201A。

3.BamHI的诱变

选择突变的点诱变通过反向PCR进行。将相应密码子全部变为GCA(丙氨酸)。下列引物用于诱变:

E28A

5’ATTCAACAAGCATACAAT

5’ACAAATAGATGTTTTAAC

K30A

5’CAAGCATACAATGAAGTT

5’AGGTGAACAAATAGATGT

K52A

5’ACGATTAACAACACCGAA

5’TACTACACCGTTACAATT

K61A

5’AACGGTGTAGTACCAATT

5’TAAGGTGTAACATAGTTC

K84A

5’AACCCCCTTGATATACTT

5’ACCTTTTTTCTTTTCAAG

E86A

5’GATATACTTAAACTT

5’CGGACCACCTTTTTTCTT

K88A

5’ATACTTAAACTTGAAAAG

5’ATCAATCGGACCACCTTT

K97A

5’GGTCCGATTGATGTTTAT

5’ACTGTTTTCTATGAACTC

K106A

5’ATAGAAAAACAGTGAACTT

5’AAATTCCATACCTACACG

H121A

5’GGAAATATTAGTTCTGCC

5’AAGTTTGTTCATTGAAACG

R122A

5’AATATTAGTTCTGCCCAC

5’TAGAAGTTTGTTCATTGA

K126A

5’GCCCACCGTTCAATGAAC

5’ATGTTTTAATCCTAATAGAAG

K146A

5’ATTATCCTTATGCCTATT

5’AAGATAATAGGCCAATTG

D154A

5’TTGGCCTATTATCTTACA

5’CTCGAAATTGGTAACACG

R155A

5’GCCTATTATCTTACAGAT

5’TTCCTCGAAATTGGTAAC

E161A

5’CGTGTTACCAATTTCGAG

5’TTCAAAATAAGGTTCTAA

E163A

5’ACCAATTTCGAGGAATTA

5’AGTAAGTTCAAAATAAGG

E170A

5’CCTTATTTTGAACTTACT

5’AATAAAAATAAATGGTTG

E182A

5’TTTATTTTTATTGGATTTAAT

5’GACATTAGAATTATAAGCTGC

K193A

5’AATGTCCCTTTAATTCCC

5’TGACATACCGTCAGAACC

D196A

5’TTAATTCCCAAAGGTTCT

5’TGAGCGTTTTGACATACC

R201A

5’TCTGACGGTATGTCAAAA

5’TTTCCATTTCTTAATTGA

PCR反应的反应体积为100μl,包含2μl的每种PCR引物、1μl pUC18-bamhiR、400μMdNTP、4单位的Deep Vent

PCR反应条件是94℃进行5min,然后25个循环的94℃30sec、55℃30sec、72℃4min,并且在72℃下最后延伸时间为7mins。PCR产物在标准Qiagen离心柱(Qiagen,Valencia,CA)上纯化。用20单位的DpnI消化6到16μl的PCR产物1小时。将消化的产物转化入大肠杆菌(pACYC-bamHIM)。

6个PCR反应后,获得工程化的22种突变中的14种:E28A、K30A、K61A、E86A、K97A、H121A、K126A、K146A、E161A、E163A、E170A、E182A和R201A。从过夜培养物中的细胞溶胞产物中提取突变体蛋白质,并且将其活性与WT BamHI比较。在有或者没有5%甘油的NEB2缓冲液中,分析正常的酶活性,而在具有39.2%甘油的NEB2中测定星号活性,尽管最初可以使用较低百分比的甘油。用于不同的反应的底物是pBR322、pUC19或λDNA。切割反应在37℃下进行30分钟或1小时。发现突变体K97A、H121A、K126A、E161A、E182A、R201A是失活的(小于1%的WT BamHI活性),而E28A、K146A、E163A、E170A突变体具有与WT酶相似水平的包括星号活性在内的活性。发现与WT BamHI相比,三种突变体K30A、E86A和K126A具有显著减少的星号活性。也发现K30A和E86A具有与WT酶相似的总切割活性,同时其示出星号活性明显减少。相反,K126A仅具有25%的总WT酶切割活性,并且与对K30A和E86A观察到的星号活性相比具有较不显著的改进。

对pUC18-bamHIR质粒再检查显示正常的高拷贝质粒已突变为低拷贝质粒。设计引物对以将bamHIR基因转移入高拷贝质粒:

5’GGTGGT

5’GGTGGT

模板是pUC18-bamhIR WT,其在K30A、E86A或K126A处带有突变。PCR组合物包含:5μl模板、2μl每种引物、400μM dNTP、10μl 10x Thermopol缓冲液、4单位2μl Deep Vent

使用pUC19-BamHI(K30A)载体重复那些在pUC18-BamHIR中不成功的突变。PCR混合物包含:1μl模板和含有2μl每种引物、400μM dNTP、10μl 10 x Thermopol缓冲液、4单位2μlDeep Vent

使用反向PCR,组合在K30、E86和K106位点上的突变:K30A/E86A、E86A/K106A、K30A/K106A和K30A/E86A/K106A。K30A/E86A表现为优选的突变体。纯化后,发现BamHI突变体的FI在所有NEB缓冲液中提高25%。

在K30和E86位点上,随机进行进一步诱变:

对K30:

5’CAAGCATACAATGAAGTTNNNACATCTATTTGTTCACCT3’(SEQ ID NO:69)

5’AGGTGAACAAATAGATGTNNNAACTTCATTGTATGCTTG3’(SEQ ID NO:70)

对E86:

5’GATATACTTAAACTTNNNAAGAAAAAAAGGTGGTCCG3’(SEQ ID NO:71)

5’CGGACCACCTTTTTTCTTNNNAAGTTTAAGTATATCAAG3’(SEQ ID NO:72)

PCR组合物是:1μl模板(pUC19-BamHIR(K30A)或pUC19-BamHIR(E86A))并且使用如上描述的扩增混合物。进行PCR:94℃5min,然后94℃30sec、55℃30sec和72℃3分30秒25个循环和7分钟的最终延伸时期。通过DpnI消化PCR产物,并将其转化入大肠杆菌(pACYC-BamHIM)。

对K30随机突变选取共155个菌落,和对E86位点选取158个菌落。将菌落生长过夜并制成细胞提取物。在具有42.5%甘油的NEB2缓冲液中用1μl细胞提取物在37℃下,消化0.5μg pUC19,1小时。在具有39.2%甘油的NEB2缓冲液中,具有明显更少星号活性的细胞提取物在37℃下在1、4、16倍稀释下对0.5μg pUC19进行重新分析30分钟。对于观察到具有减少星号活性的那些突变体,提取相应的质粒并且测序以证实突变。总共3个克隆(#12、#66和#82)含有K30突变,并且总过33个克隆(#5、#15、#16、#19、#29、#47、#51、#55、#56、#58、#61、#69、#71、#73、#76、#82、#86、#88、#93、#94、#97、#98、#100、#104、#107、#113、#117、#118、#129、#132、#136、#139和#151)被测序。测序后,发现#12和#66含有K30G突变,和#82含有K30N突变。令人惊奇地,所有33个突变是E86P突变,恰好在不同的密码子中(CCA、CCT、CCC、CCG)。在这些密码子中,CCG在大肠杆菌以最高频率发生(克隆#98、#136和#139)。

相应于K30G、K30N和K30A的细胞提取物被连续稀释为1、2、4、8、16和32倍,而E86P和E86A被连续稀释1、2、4、8、16、32、64、128和256倍。连续稀释的提取物与0.5μg pUC19在具有39.2%甘油的NEB2中在37℃下反应30分钟。在极端的条件下,E86P显示比其他突变体更优良。在上至32倍消化下,没有明显星号活性带。E86P和K30突变体(K30G、K30N和K30A)之间的差异是如此大以致不另外需要在E86P突变体中组合这些突变中的任一个。

对1μgλDNA——底物——测定BamHI(E86P)活性(也用于WT BamHI活性测定)。在NEB1缓冲液中,在37℃下,进行分析1小时。

4.BamHI(E86P)和WT BamHI的详细比较

A.不同NEB缓冲液中BamHI(E86P)的活性

使用λDNA底物在37℃下,在NEB1、NEB2、NEB3、NEB4和NEB BamHI缓冲液中测定纯化的BamHI(E86P)的活性1小时。BamHI(E86P)在NEB1缓冲液和NEB2中是最有活性的,而在NEB3、NEB4和BamHI缓冲液中具有50%、50%和25%的活性水平。

B.比较BamHI(E86P)和WT BamHI对pUC19的切割活性

在pUC19中具有一个GGATCC位点(BamHI位点)和6个AGATCC位点(BamHI星号活性位点),所以pUC19被选择作为比较BamHI(E86P)和WT BamHI的优选底物。

在不同的缓冲液中,用NEB稀释缓冲液A以1、3、9、27、81、243、729、2181、6561和19683倍连续稀释的WT BamHI和BamHI(E86P)消化0.5mg pUC19。WT BamHI示出每种NEB正常缓冲液中的星号活性,而BamHI(E86P)根本没有示出星号活性带(图2-5)。这证明BamHI(E86P)已经极大地减少星号活性,同时保持同源切割活性。

C.BamHI(E86P)和WT BamHI对λDNA底物切割活性的比较

为了计算保真度指数,用稀释缓冲液稀释限制酶,并且将甘油浓度恒定保持在5%。在本文使用的标准反应条件中,λDNA底物浓度为1μg,并且总反应体积为50μl。为了保持酶体积为10%,酶以5μl的体积加入。这等于在30μl总体积中3μl限制酶消化的0.6μg的底物。在NEB1、NEB2、NEB3、NEB4和NEB BamHI缓冲液中,从1到32768的1:2连续稀释的3μl WTBamHI和BamHI(E86P)在37℃下对0.6mgλDNA消化1小时。

表5:在不同缓冲液中,WT和突变体BamHI的保真度指数

5.针对高保真度突变体的BamHI的进一步改进

在一小时水平,BamHI(E86P)表现为好的高保真度BamHI突变体。然而,尽管E86P的星号活性在一小时没有检测到,但是当延长反应时间时(例如过夜或14小时),星号活性带出现。(图3)。继续进行对改进高保真度BamHI的研究。

6.其他带电荷的和极性残基的突变

在SEQ ID NO:19中位置2、4、5、6、10、11、13、14、18、19、20、43、51、62、69、70、76、77、78、81、87、89、94、98、101、104、107、111、113、132、133、135、137、160、167、200、204、205、207、208、209、211、213处,将其他带电荷的残基(Arg、Lys、His、Asp、Glu)突变为Ala。在pUC19-BamHI(K30A)的模板上进行突变。

在SEQ ID NO:19的位置9、17、26、32、36、41、42、44、46、50、65、66、71、72、75、96、103、114、118、119、123、150、151、153、157、165、169、184、186、195、199、202处,将其他极性残基(Ser、Thr和Tyr)突变为Ala,而将Tyr突变为Phe。

通过使用相似的突变和筛查方法,发现下列突变具有减少的星号活性:K30A/K87A、E86P/K87E、E86A/Y165F和K30A/E167A。鉴定E86P/K87E为在存在另外的DMSO情况下具有改进性质的突变体。然而,在正常反应缓冲液中该突变体的活性比WT BamHI的活性低得多。

进行下列突变组合:E86P/Y165F、E86P/E167A、E86P/Y165F/E167A、K30A/Y165F/E167A、K30G/Y165F/E167A、K30A/Y165F/E167A、E86A/Y165F/E167A。它们都具有低活性。

到现在为止,发现对BamHI星号活性,E167A和Y165F具有强效果,K87A具有中等效果,以及K30A和E86A具有弱效果。E86P是在1小时水平而非过夜地减少星号活性的特异性突变。

7.将E167和Y165突变为所有其他残基

在pUC19-BamHI中,将E167突变为所有其他的残基,这通过将密码子改变为GCA——Ala、TGC——Cys、GAC——Asp、TTC——Phe、GGT——Gly、CAC——His、ATC——Ile、AAA——Lys、CTG——Leu、ATG——Met、AAC——Asn、CCG——Pro、CAG——Gln、CGT——Arg、TCC——Ser、ACC——Thr、GTT——Val、TGG——Trp和TAC——Tyr进行。

在比较所有的突变体之后,优选E167T突变,而与E167A相比,E167R、E167K、E167L和E167I突变示出在减少星号活性方面的改进。

也将Y165突变为所有其他氨基酸残基,这通过将相应的密码子改变为GCT——Ala、TGC——Cys、GAC——Asp、GAA——Glu、GGT——Gly、CAC——His、ATC——Ile、AAA——Lys、CTG——Leu、ATG——Met、AAC——Asn、CCG——Pro、CAG——Gln、CGT——Arg、TCC——Ser、ACC——Thr、GTT——Val、TGG——Trp进行。

在比较所有的突变体之后,Y165F的存在导致显著的切割活性,而刚刚在上文列出的其他突变示出低活性或没有切割活性。

8.对BamHI(E167T)进一步突变

在puc19-BamHI(E167T)的模板上,将所有带电荷的和极性残基突变为Ala,方法同上。

作为优选突变,将E163A/E167T鉴定为BamHI-HF。

9.BamHI-HF与WT BamHI的比较

在E163处引入突变产生减少热稳定性的BamHI突变体,这与突变P173A被加入其他负责减少星号活性的突变时一样。

与BamHI(E86P)不同,BamHI-HF在NEB1-4缓冲液中过夜反应没有显著的星号活性。图4示出在NEB1和NEB2中的结果。因此,选择BamHI(E163A/E167T)为优选的高保真度BamHI。

在37℃下,在所有四种NEB缓冲液中,用稀释剂A,在λDNA底物上,测量BamHI-HF的保真度指数,并且与WT酶比较。

表6:BamHI-HF和WT BamHI的比较

在NEB1中,BamHI-HF具有最高的活性,保真度指数为≥8000,在NEB2和NEB3中,WTBamHI具有最高的活性,并且最高的FI为32。总FI改进因子——其为每种突变体和WT酶在最好的缓冲液中的FI的比率,是≥8000/32=250倍。

10.BamHI的另外突变

预测E163A/E167T/P173A具有优选的星号活性减少,并且另外是热不稳定的。

检测(E86P/K87S/K88P/E163S/E170T/P173A)。该突变体在比活性方面显示10倍减少,而具有来自宿主细胞的补偿增加的蛋白质产率。

共享减少的热稳定性、减少的星号活性和可接受的比活性的其他BamHI突变体包括:

E86P/K87R/K88G/E163S/E170T/P173A

E86P/K87P/K88R/E163S/E170T/P173A/E211K

E86P/K87T/K88R/E163S/E170T/P173A/N158S

E86P/K87S/K88P/E163S/E170T/P173A

E86P/K87G/K88S/E163S/E170T/P173A

E86P/K87R/K88Q/E163S/E170T/P173A

1.EcoRI的表达

对EcoRI的PCR使用下列引物:

GGTGGT

GGTGGT

然后,用第二对限制性内切核酸酶——SphI和Acc65I——消化PCR产物,并且连接入用同样的第二对限制性内切核酸酶消化的pUC19。然后,连接的质粒被转化入用pACYC-MlucIM预修饰的感受态大肠杆菌。

2.EcoRI的诱变

靶氨基酸残基的最初选择是EcoRI与其同切点酶RsrI比较的结果,RsrI的星号活性也是已知的。

EcoRI对RsrI

除了D91、E111和K113——其为已知的活性中心残基,在两种内切核酸酶中,42个带电荷的残基是相同或相似的。带电荷的残基如下:

K4、R9、K15、K29、H31、D32、E37、E49、R56、R58、K63、E68、K71、D74、K89、E96、K98、K99、R105、H114、D118、K130、D133、D135、E144、R145、H147、K148、E152、E160、H162、E170、E177、R183、D185、R200、D202、R203、E253、R264、D269。

将所有这些带电荷的残基突变为Ala(密码子GCA、GCT、GCC或GCG),并且突变的基因被如下扩增和克隆:

扩增混合物与在实施例1中使用的扩增混合物相同(2μl每种PCR引物,400mMdNTP,4单位Deep Vent DNA聚合酶,具有另外0、2、6μl MgSO

PCR反应条件为94℃持续5min,然后25个循环的94℃30sec、55℃30sec、72℃3分30秒,并且在72℃下最后延伸时间为7min。PCR后,产物通过标准Qiagen离心柱(Qiagen,Valencia,CA)纯化。用20单位的DpnI消化16μl的PCR产物1小时。将消化的产物转化入甲基化酶保护的感受态大肠杆菌制品。

3.筛查EcoRI高保真度突变体

对每一突变选取3个菌落,并且在具有氨苄青霉素和氯霉素的LB中生长过夜。对pBR322和λDNA进行活性分析以确保突变体与WT EcoRI至少具有相似的活性。然后,使用2倍连续稀释的3μl的细胞抽提物、12μl 50%甘油、3μl NEB1缓冲液、0.5μl pBR322和11.5μl水,检测这些突变体,其在37℃下反应1小时。然而,没有突变改进星号活性的性能。

从该结果,推导出在同切点酶之间有效突变不总是被识别为同源残基。

4.对剩余的32个带电荷的残基重复诱变

如在步骤2中所述的,通过靶向氨基酸残基5、12、14、26、40、43、44、59、62、65、72、76、100、103、117、123、131、192、221、225、226、227、228、242、244、245、247、249、257、268、272和277,将所有剩余的32个带电荷的残基突变为Ala。

上面的数字相应于EcoRI蛋白序列(SEQ ID NO:83)中的氨基酸位置。

5.重复选择

从含有不同类型突变的每种样品中选取四个菌落,并且在4ml具有CAM的LB中生长。超声处理后,在NEB1缓冲液中在正常甘油条件下,在λDNA底物上检测细胞提取物。通过在3μl NEB2缓冲液中加入2倍连续稀释的3μl细胞提取物至0.5μl的pUC19和23.5μl 50%甘油以在反应混合物中提供39.2%甘油的终浓度,具有相似活性的那些提取物在pUC19底物上再次检测。

在所有这些突变体中,发现K62A是具有最少星号活性和高FI的突变。R9A、K15A、R123A、K130A、R131A、R183A突变体都示出星号活性的部分减少。令人感兴趣地,含有靶向突变K5A的一个克隆示出部分改进。另外地,测序后,发现第二突变S2Y。分离这两个突变显示该分离物有效的突变是S2Y。D135A和R187A EcoRI也具有少得多的星号活性。然而,这些突变体的切割活性不是最佳的。

6.EcoRI(K62A)与WT EcoRI的比较

通过在四种不同NEB缓冲液中消化0.6μg的λDNA,在使用NEB稀释缓冲液C进行3倍连续稀释中进行并行比较(图6)。EcoRI(K62A)具有实质上比WT EcoRI小的星号活性。

通过测定EcoRI(K62A)和WT EcoRI的保真度指数量度,进行更定量的比较。保真度指数测量的条件与表2相同,其使用λDNA作为底物并使用稀释缓冲液C。该反应在37℃温育1小时,并且在0.8%琼脂糖凝胶上分析消化产物。

表7:EcoRI(K62A)和WT EcoRI的保真度指数

7.EcoRI的进一步突变

尽管对于λDNA底物,EcoRI(K62A)并不明显具有星号活性,但是使用Litmus28底物在10小时消化之后观察到星号活性。与EcoRI缓冲液中的WT EcoRI相比,NEB4中的EcoRI(K62A)具有显著减少的星号活性(图7)。

研究进一步的改进。通过如在实施例1中将K改变为相应密码子,将EcoRI(K62)突变为所有其他的氨基酸残基。K62S和K62L与K62A相似。当与EcoRI(K62A)相比时,EcoRI(K62E)具有≥100倍总保真度指数改进因子,如在图6中所示。EcoRI(K62E)被命名为EcoRI-HF。

8.EcoRI-HF和WT EcoRI的比较

通过在稀释剂C中EcoRI-HF和WT EcoRIA上的FI测量,进行定量比较。FI测量的条件与表2中相同,其使用λDNA作为底物。反应条件是37℃持续1小时,并且在0.8%琼脂糖凝胶上分析结果(图8)。

表8:EcoRI-HF和WT EcoRI的比较

发现总保真度指数改进因子为64倍(EcoRI-HF在NEB4中的16000比NEB3中WTEcoRI的250)。

1.ScaI的表达

ScaI限制性内切核酸酶和甲基化酶的序列在REBASE和GenBank中描述,并且在图44(SEQ ID NO:97)中提供。将表达这些酶的基因插入质粒以分别产生pRRS-ScaI和pACYC184-ScaIM。然后,将pACYC184-ScaIM转化入感受态大肠杆菌宿主细胞。pRRS载体从pUC19得到,并且差异仅仅为存在多克隆位点。将pRRS-ScaIR转化入大肠杆菌(pACYC-ScaIM)以制造表达菌株。铺板和细胞培养在30℃下进行。

2.ScaI的诱变

ScaI具有两种测序的同切点酶:LlaDI和NmeSI。然而,没有已知的关于LlaDI或NmeSI的星号活性的信息,也没有关于这些酶活性位点的任何信息。因此,最初选择在该蛋白质的位置4、8、11、12、14、18、25、27、30、37、39、40、43、46、51、57、61、68、72、74、80、86、97、103、108、112、114、119、120、121、127、128、129、133、135、139、140、141、147、152、156、158、159、161、162、171、172、175、179、182、184、187、172、175、192、193、195、200、222、227处所有58个带电荷的残基进行靶向突变。

上面的数字相应于ScaI蛋白序列(SEQ ID NO:97)中的氨基酸位置。

引物设计方法和PCR方法与对实施例1中BamHI和实施例2中EcoRI描述的相似。通过改变退火温度和DNA聚合酶,实现诱变。用DpnI消化PCR产物,并转化入感受态大肠杆菌(pACYC184-ScaIM)。

3.ScaI高保真度突变体的选择

选取来自ScaI突变体的每个突变体的4个菌落,并且在30℃下、4ml具有100μg/mlAmp和33μg/ml Cam的LB中生长过夜。将每个细胞培养物进行超声处理,并且在NEB2缓冲液中对λDNA检测活性。明显具有活性的那些以10、100和1000倍稀释再次检验。因为ScaI具有非常显著的星号活性,所以对于突变体对WT限制性内切核酸酶,星号活性带容易比较。具有减少的星号活性的那些用使用NEB稀释缓冲液A进行2倍连续稀释再次检验。对每一突变体测量FI。对于NEB 2缓冲液中的WT ScaI,FI为1/8。发现具有相似活性水平的四种突变体与WT ScaI相比具有大量减少的星号活性。突变体#6-3ScaI与WT ScaI相比具有2倍的活性并且FI为4或32倍。#26-2ScaI与WT相比具有2倍的活性并且FI为8或64倍;#28-2ScaI与WT相比具有2倍的活性并且FI为120或1000倍;#54-3与WT具有相似的活性,并且FI为WT的250或2000倍。

四种突变体:#6-3、#26-2、#28-2和#54-3ScaI在存在36.7%甘油的情况下进一步检测消化λDNA底物。#54-3在减少星号活性方面示出比其他3种突变体更大的提高。

在提取质粒后,测序#6-3,并且发现其具有R18A的突变。测序#26-2,并且发现其具有R112A的突变。测序#28-2,并且发现其具有E119A的突变。这些突变被预测到。然而,发现#54-3具有双突变体——H193A/S201F。S201F是在PCR期间发生的自发第二突变,并且位于H193A突变的引物区域外。

为了理解哪个残基主要负责星号活性的减少,使用下列引物,将单一突变(S201F)引入ScaI:

5’-GATTGGGTGGCGCAGAAATTTCAAACGGGCCAGCAGTCG-3’(SEQ ID NO:77)

5’-CGACTGCTGGCCCGTTTGAAATTTCTGCGCCACCCAATC-3’(SEQ ID NO:78)。

证实ScaI(H193A)、ScaI(S201F)和ScaI(H193A/S201F)的序列。在5%和37%甘油水平下,比较三种突变体和WT ScaI(图9)。与仅微弱有助于FI的H193A相反,S201F明显有助于FI。然而,这两种突变在提高FI方面表现是加和的。在5%甘油中,S201F没有显示星号活性,但是在37%甘油中显示一些星号活性。在5%甘油中,H193A具有一些星号活性,在37%甘油中具有显著的星号活性。然而,对于这两种突变的组合,在5%或37%甘油中,都没有检测到星号活性。该发现不但示出具有羟基的氨基酸可以是星号活性的主要活性残基,而且该突变的正确组合可以推动保真度提高到非常高的水平。如果带电荷的残基的突变不能改进星号活性,这里观察到对Ser、Thr和Tyr的突变可成功提高保真度指数。将ScaI(H193A/S201F)标记为ScaI-HF。

4.ScaI-HF和WT ScaI的比较

37℃下,在不同的NEB缓冲液中,用NEB稀释缓冲液A进行的2.5倍连续稀释下,对4种不同的NEB稀释液中的1μgλDNA,比较ScaI-HF和WT ScaI,1小时(图10)。

表9:ScaI-HF与WT ScaI的保真度指数的比较

在NEB2和NEB4缓冲液中,ScaI-HF表现最好,其中最好的FI为250;在NEB2缓冲液中,WT ScaI表现最好,其中FI为1/8。总FI改进因子为250/(1/8)=4000。

1.SalI的表达

SalI在用placzz1-SalIR和pACYC-Hpy166IIM转化的大肠杆菌中表达,其中placzzI是pUC19质粒,其利用lac启动子表达插入到邻近多拷贝位点的限制性内切核酸酶基因。Hpy166IIM保护SalI的外部4个碱基。

2.SalI的诱变

使用在先前实施例中相似的PCR方法,将SalI的86个带电荷的残基突变为Ala:5、6、8、9、12、13、19、27、31、34、35、37、42、43、45、50、60、63、65、67、73、82、83、84、90、93、97、100、101、103、107、109、111、114、116、119、126、129、131、134、140、143、145、147、148、156、157、164、168、172、173、174、180、181、186、190、191、193、210、218、226、232、235、237、238、244、246、250、256、257、258、259、260、261、264、266、271、275、297、300、304、305、306、308、309、311。

上面的数字相应于SalI蛋白序列(SEQ ID NO:94)中的氨基酸位置。

突变体在30℃下,在具有Amp和Cam的LB中生长过夜。

3.SalI-HF的选择

SalI-HF的选择如在前面实施例中描述的进行。主要差别是SalI的星号活性在粗提物中不能容易地分析——不论在5%甘油或更高甘油浓度中。甘油不仅促进SalI的星号活性,而且极大地抑制同源活性。

在5%甘油和37%甘油中,对HindIII消化的λDNA分析活性突变体。在所有4种NEB缓冲液中,检测突变体#22、#26、#29、#31、#43和#51的切割活性。在不同条件和底物中数轮比较后,发现#31——SalI(R107A)——是优选的突变体,其保留高的切割活性,但是显示大量减少的星号活性。将SalI(R107A)标记为SalI-HF。

4.SalI-HF和WT SalI的比较

测定SalI-HF和WT SalI的FI(图11)。结果如在表10(下面)中所示出的:

表10:SalI-HF和WT SalI的比较

在NEB 2和NEB 4缓冲液中,SalI-HF表现最好,其中FI都≥2000;WT SalI在NEB 3缓冲液中表现最好,其中FI为4。总FI改进因子为≥2000/4=≥500。

1.SphI的表达

在大肠杆菌(placzz1-SphIR、pACYC184-CviAIIM)中表达SphI。CviAIIM保护SphI的内部四个碱基。转化的细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.SphI的诱变

使用在实施例1至实施例4中描述的方法,将SphI的所有带电荷的残基突变为Ala。进行共71个突变:3、5、12、18、21、24、25、30、31、35、43、46、51、54、57、58、60、61、72、75、77、78、87、90、91、95、100、104、107、108、110、113、120、123、124、125、129、130、131、139、140、142、146、147、155、157、159、164、170、172、173、175、178、184、186、190、194、196、197、198、206、207、209、212、215、221、227、230、231、232、235。

上面的数字相应于SphI蛋白序列(SEQ ID NO:98)中的氨基酸位置。

3.SphI-HF的选择

每种突变的四个菌落在在37℃下,在具有Amp和Cam的LB中生长过夜。活性选择主要针对NEB2中的5%甘油和30%甘油中的pBR322。使用前面实施例的经验,高保真度SphI的选择是简单的。发现SphI突变体D91A、K100A、D139A和D164A显著减少SphI中的星号活性。在它们中,K100A是具有最小星号活性的优选突变。SphI(K100A)被命名为SphI-HF。

4.SphI-HF和WT SphI的比较

在它们各自优选的缓冲液中,并行进行SphI-HF和WT SphI的比较。使用NEB稀释缓冲液A,将SphI-HF 2倍连续稀释,并且在NEB4中反应,使用NEB稀释缓冲液B,将WT SphI 2倍连续稀释。对λDNA的消化在图12中进行比较。

表11:SphI-HF和WT SphI的FI的比较

在NEB4中,SphI-HF表现最好,其中FI≥2000;WT SphI在NEB1或NEB2中表现最好,其中优选的FI是64。总FI改进因子为≥32。

1.PstI的表达

从大肠杆菌(pACYC-HpyCH4VM、pPR594-PstIR)表达PstI。HpyCH4VM保护PstI的内部四个碱基。pPR594是具有Amp抗性和ptac启动子的表达载体。细胞在30℃下,在具有Amp和Cam的LB中生长,然后通过IPTG诱导培养物过夜。

2.PstI的诱变

使用在先前实施例中描述的方法,将92个带电荷的残基突变为Ala。这些是:8、10、11、14、25、26、38、40、41、44、45、47、58、61、63、66、67、69、73、74、77、78、82、85、88、91、92、94、95、99、104、105、116、119、127、128、136、142、145、146、150、151、152、156、159、169、170、174、176、179、180、184、188、191、197、202、204、207、212、214、217、218、226、227、228、231、236、237、238、239、240、246、251、257、258、261、263、273、282、284、286、287、295、297、302、305、306、309、313、314、319和320。

上面的数字相应于PstI蛋白序列(SEQ ID NO:91)中的氨基酸位置。

在用DpnI消化PCR产物后,将样品转化入感受态大肠杆菌(pACYC-HpyCH4VM),并且在具有Amp和Cam的LB板上生长。

3.PstI-HF的选择

PstI-HF的选择与前面的样品相似。在5%甘油下,在λDNA上检测正常活性酶活性,并且在NEB4缓冲液和20%DMSO的条件下在pBR322底物上检测星号活性。DMSO比相同浓度的甘油更显著地增强星号活性。在选择期间,#26、#56和#65与WT相比,具有减少的星号活性。当对每一个测序时,发现突变为D91A、E204G和K228A/A289V。将突变体#26PstI(D91A)标记为PstI-HF。

4.PstI-HF和WT PstI的比较

在NEB1-4缓冲液中,对λDNA底物,分别测量PstI-HF和WT PstI的FI。稀释缓冲液是NEB稀释缓冲液C。比较如在图13中所示,并且结果在表12(下面)中列出。

表12:PstI-HF和WT PstI的比较

在NEB2和NEB4缓冲液中,PstI-HF表现最好,其中优选的FI为≥2000;WT PstI在NEB 3缓冲液中表现最好,其中FI为120。总FI改进因子为≥2000/120=16倍。

1.NcoI的表达

在大肠杆菌(pSYX20-NcoIM、pRRS-NcoIR)中实现NcoI的表达。pRRS是pUC19衍生质粒,并且pSYX20是与pRRS载体相容的低拷贝数质粒。细胞在30℃下,在具有Amp和卡那霉素(Kan)的LB中生长过夜。

2.NcoI的诱变

将NcoI中所有66个带电荷的残基突变为Ala。这些残基是:7、8、19、22、27、30、31、32、33、37、39、42、46、55、56、61、62、64、68、69、75、84、88、89、92、93、95、97、100、116、136、144、146、162、166、170、178、183、185、187、188、189、196、199、202、204、209、211、212、213、216、219、227、229、237、241、244、250、251、257、259、261、268、279、282、285。

上面的数字相应于NcoI蛋白序列(SEQ ID NO:88)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pSYX20-NcoIM)。

3.NcoI-HF的选择

NcoI-HF的选择与PstI-HF的选择相似。如上所述,在5%甘油下,用λDNA作为底物,检测活性。使用pBR322或λ在19%DMSO中测定星号活性。发现下面的突变改进星号活性:A2T/R31A、D56A、H143A、E166A、R212A和D268A。在这些突变体中,选择NcoI(A2T/R31A)为NcoI-HF。

4.NcoI-HF和WT NcoI的比较

在NEB1-4缓冲液中,对λDNA,分开测定NcoI-HF和WT NcoI的FI。比较在图14中示出,并且结果在表13(下面)中列出。

表13:NcoI-HF和WT NcoI的比较

在NEB4中,NcoI-HF示出最大的星号活性减少,其中优选的FI为≥16000;WT NcoI在NEB1、NEB2和NEB4中表现最好,其中优选的FI为120。总FI改进因子为≥16000/120=125。

1.NheI的表达

NheI在用pACYC-NheIM和placzz1-NheIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。

2.NheI的诱变

将NheI中所有92个带电荷的残基突变为Ala,其为下面的残基:5、6、7、14、17、19、22、25、28、31、38、39、42、47、49、52、56、58、59、60、64、74、75、76、77、80、91、93、104、105、110、112、116、117、123、126、130、131、133、135、137、147、149、152、159、160、165、167、170、171、174、179、183、195、202、205、207、209、210、211、214、216、218、221、225、231、241、243、244、250、252、256、257、259、264、266、267、281、285、287、288、289、291、297、300、307、313、315、318、321、324、325。

上面的数字相应于NheI蛋白序列(SEQ ID NO:89)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-NheIM)。

3.NheI-HF的选择

根据前面的实施例,进行NheI-HF的选择。标准和星号活性分析包含NEB4缓冲液以及分别5%甘油和39%甘油中的pBR322作为底物。发现仅一种突变显著改进NheI。这是E77A。选择NheI(E77A)作为NheI-HF。

4.NheI-HF和WT NheI的比较

在NEB1-4缓冲液的每一种中,在pXba上,分开测定NheI-HF和WT NheI的FI,pXba是含有来自腺病毒的XbaI消化片段的质粒底物。比较在图15中示出,并且结果在表14(下面)中列出。

表14:NheI-HF和WT NheI的比较

在NEB1缓冲液中,NheI-HF示出最佳活性,其中其FI为≥128,000。WT NheI在NEB1和NEB4缓冲液具有最大的活性,其中其最佳FI是32。所以,总FI改进因子为≥128,000/32=≥4000。

1.SspI的表达

从用pACYC-SspIM和placzz1-SspIR转化的大肠杆菌表达SspI。placzz1是pUC19衍生质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。

2.SspI的诱变

将SspI中所有81个带电荷的残基突变为Ala;这些是:3、8、12、13、18、19、20、35、40、42、44、47、52、60、62、65、68、69、72、74、76、77、78、79、83、85、88、89、90、96、100、108、109、118、119、127、128、129、131、132、137、144、153、154、155、156、158、165、168、170、172、177、178、179、181、185、186、187、191、194、195、197、202、204、215、222、229、237、240、246、250、256、257、259、260、264、265、267、268、269、274。

上面的数字相应于SspI蛋白序列(SEQ ID NO:99)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-SspIM)。

3.SspI高保真度突变体的选择

在NEB4缓冲液以及分别5%甘油和39%甘油中,使用ΦX174底物,进行NheI的标准同源和星号活性分析。突变体#16(H65A)、#20(K74A)、#23(E78A)、#26(E85A)、#28(E89A)、#33(K109A)、#34(E118A)、#52(R177A)、#62(K197A)、#67(D229A)都示出减少的星号活性。K109A示出星号活性的最大减少。决定寻求星号活性的进一步改进。

4.进一步突变

将最初鉴定为Tyr的所有残基突变为Phe,而将其他残基Cys、Phe、Met、Asn、Gln、Ser、Thr和Trp突变为Ala。该组包括在下列位置处的95个残基突变:2、6、7、9、10、13、22、25、26、27、29、30、32、33、34、39、41、51、53、55、56、57、58、59、61、63、71、75、81、84、87、91、94、98、104、106、107、110、111、113、114、123、125、134、136、139、140、141、142、143、146、152、157、159、160、164、173、175、180、183、190、192、193、196、198、199、201、205、207、211、214、218、219、220、221、223、225、226、227、228、230、232、233、235、238、239、241、249、254、255、272、275、276、277、280。

上面的数字相应于SspI蛋白序列(SEQ ID NO:113)中的氨基酸位置。

通过上面相同的方法,进行PCR和选择。在这些突变体中,发现Y98F具有最少的星号活性,并且其在这方面比SspI(K109A)好。将SspI(Y98F)标记为SspI-HF,并且作为生产株储存。

5.SspI-HF和WT SspI的比较

在NEB1-4缓冲液中,使用λDNA底物,分开测定SspI-HF和WT SspI的FI。稀释剂是NEBC。比较在图16中示出,并且结果在表15(下面)中列出。

表15:SspI-HF和WT SspI的比较

在NEB4中,SspI-HF表现最好,其中优选的FI是500;WT SspI在NEB1、NEB2和NEB4中表现最好,其中优选的FI是64。总FI改进因子为500/64=8。

1.NotI的表达

NotI在NEB4缓冲液中具有显著的星号活性,并且在NEB3缓冲液中具有较少的星号活性。工程化NotI以在任何NEB缓冲液中减少星号活性。NotI在用pACYC184-EagIM和placzz2-NotIR转化的感受态大肠杆菌中表达。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.NotI的诱变

将NotI中所有97个带电荷的残基突变为Ala,如下列残基:2、4、8、10、17、21、22、26、31、34、35、36、49、52、57、59、62、72、74、75、77、84、87、96、97、105、117、121、122、125、126、129、130、133、140、141、145、150、152、156、160、165、167、174、176、177、182、187、189、193、194、200、205、208、210、219、224、225、227、236、237、245、251、253、267、271、272、280、283、290、292、294、296、304、306、308、310、314、319、321、323、327、331、335、336、339、353、354、356、358、361、365、367、368、369、370、378、382。

上面的数字相应于NotI蛋白序列(SEQ ID NO:90)中的氨基酸位置。

将突变体引入酶的方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入含有pACYC-EagIM的大肠杆菌。

3.NotI-HF的选择

如在前面实施例中描述的,进行NotI-HF的选择。标准同源和星号活性分析使用pXba底物,在NEB4缓冲液以及分别5%甘油和NEB ExoI缓冲液(67mM甘氨酸-KOH,pH 9.5,6.7mM MgCl

4.NotI-HF和WT NotI的比较

在NEB1-4缓冲液中,使用pXba底物,分开测定NotI-HF和WT NotI的FI。比较在图17中示出,并且结果在表16(下面)中列出。

表16:NotI-HF和WT NotI的比较

ND:不可检测,因为两个FI都是超出限度的不确定数。

在NEB2中,NotI-HF表现最好,其中优选的FI是≥128000;WT NheI在NEB3中表现最好,其中优选的FI是4000。总保真度指数改进因子为≥128000/4000=≥32。工程化NotI不但进一步提高NotI的FI,而且改变最佳缓冲液。

1.SacI的表达

SacI在用pLG-SacIM和pRRS-SacIR转化的大肠杆菌中表达。pRRS是pUC19衍生质粒,pLG是低拷贝相容性质粒。细胞在30℃下,在具有Amp和Kan的LB中生长过夜。

2.SacI的诱变

将SacI中所有101个带电荷的残基突变为Ala,如下列残基:6、7、11、15、16、19、24、25、29、30、39、40、42、45、58、61、62、63、65、67、70、71、72、74、75、76、81、85、94、98、104、105、114、116、120、123、127、129、133、134、141、143、144、145、146、150、151、154、169、170、172、181、187、196、197、200、201、211、216、220、221、224、227、228、232、238、240、246、248、250、258、270、271、277、281、288、289、295、296、297、299、303、306、313、314、321、322、324、332、336、337、340、342、344、345、347、349、350、353、357。

上面的数字相应于SacI蛋白序列(SEQ ID NO:93)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pLG-SacIM)。

3.SacI-HF的选择

使用与前面实施例相似的方法,完成SacI-HF的选择。标准活性检查使用pUC19、在NEB4中、具有5%甘油,并且星号活性检查在39%甘油下、在NEB4缓冲液中对pUC19进行。#52SacI(Q117H/R154A/L284P)和#60SacI(Q117H/R200A)都具有减少的星号活性,和SacIQ117H/R200A证明是优选的突变。Q117H是来自模板的遗留突变,其不影响SacI的活性。选择SacI(Q117H/R200A)为SacI-HF。

4.SacI-HF和WT SacI的比较

在NEB1-4缓冲液中,对pXba底物,分开测定SacI-HF和WT SacI的FI。比较在图18中示出,并且结果在表17(下面)中列出。

表17:SacI-HF和WT SacI的比较

在NEB4中,SacI-HF表现最好,其中FI是4000;WT SacI在NEB1和NEB4中表现最好,其中优选的FI是120。总FI改进因子为4000/120=32。

1.PvuII的表达

PvuII在用pACYC-PvuIIM和placzz2-PvuIIR转化的大肠杆菌中表达。Placzz2是pUC19衍生质粒;pACYC是低拷贝相容性质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。

2.PvuII的诱变

将PvuII中所有47个带电荷的残基突变为Ala,如下列残基:3、5、8、11、15、18、21、25、26、30、34、38、54、55、58、61、66、68、70、75、78、83、84、85、93、95、105、110、114、116、118、119、121、125、126、128、129、130、134、136、137、138、143、147、151、152和155。

上面的数字相应于PvuII蛋白序列(SEQ ID NO:92)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PvuIIM)。

3.PvuII高保真度突变体的选择

PvuII-HF的选择与前面的实施例相似。标准活性检查使用λDNA底物、在NEB4中、具有5%甘油,并且星号活性检查在39%甘油下、在NEB4缓冲液中对pBR322进行。没有突变体具有高保真度PvuII的资格。

4.另外的诱变步骤

另外的诱变步骤是在PvuII中将所有Ser、Thr突变为Ala,将Tyr突变为Phe。突变的位置是:2、19、46、49、67、71、77、81、82、94、104、113、123、124、132、133、148、154和157。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PvuIIM)。

PvuII(T46A)表现具有比WT PvuII更少的星号活性,然而,期望进一步改进。

将T46突变为所有其他氨基酸残基,这通过将密码子改变为相应氨基酸进行。在所有这些突变中,T46H、T46K、T46Y、T46G都比T46A更好。选择T46G作为PvuII-HF。

5.PvuII-HF和WT PvuII的比较

在NEB1-4缓冲液中,使用稀释剂A,分开测定PvuII-HF和WT PvuII对pBR322的FI。比较在图19中示出,并且结果在表18(下面)中列出。

表18:PvuII-HF和WT PvuII的比较

在NEB4中,PvuII-HF表现最好,其中FI是500;WT PvuII在NEB1和NEB4中表现最好,其中优选的FI是250。总FI改进因子为500/250=2。尽管总FI改进因子对PvuII不高,但是在NEB4中FI提高2000倍。

1.MfeI的表达

MfeI在用pACYC-MluCIM和pRRS-MfeIR转化的大肠杆菌中表达。pRRS是pUC19衍生质粒;pACYC是低拷贝相容性质粒。MluCIM甲基化AATT,其是MfeI的内部四个核酸序列。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.MfeI的诱变

分三批进行MfeI的诱变。第一批是所有的带电荷的残基,将其突变为Ala,如下列氨基酸位置:5、9、19、24、36、39、44、45、47、48、50、60、61、64,65、72、83、87、90、92、93、98、100、101、103、107、109、110、115、119、120、121、124、132、135、142、143、144、153、155、158、159、161、162、164、165、171、172、175、181、184、187、188、192、195、196、198、199、200;第二批是具有羟基的所有残基:Ser、Thr和Tyr,其中Ser和Thr被改变为Ala,并且Tyr被改变为Phe。所述残基是在:4、7、21、28、38、40、43、53、74、75、76、81、89、91、112、122、127、134、136、157、167、170、173、177、185和200。第三批是残基Cys、Phe、Met、Asn、Gln、Trp,都改变成Ala,所述残基是在:10、12、13、25、26、29、31、32、35、51、55、67、68、77、78、84、88、96、102、105、117、123、126、141、148、149、152、168、169、174、176、178、179、180、183、191、193、194。

上面的数字相应于MfeI蛋白序列(SEQ ID NO:5)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-MluCIM)。

3.MfeI-HF的选择

使用与前面实施例相似的方法,完成MfeI-HF的选择。在NEB4中,应用5%甘油、使用ΦX174底物测定切割活性,并且在NEB4中,应用39%甘油、使用ΦX174底物测定星号活性。该酶的显著困难是许多突变改进了酶的切割活性且星号活性减少,但是比WT酶需要更高的甘油浓度。MfeI(K50A)是一个实例,其在高浓度甘油中具有减少的星号活性和高切割活性,而在较低甘油浓度中,所述活性是低的。MfeI(Y173A)也减少星号活性。优选的突变为Q13A/F35Y。F35Y的突变来自模板,并且Q13A是靶向突变。将MfeI(Q13A/F35Y)标记为MfeI-HF。

4.MfeI-HF和WT MfeI的比较

在NEB1-4缓冲液中,对λDNA底物,分开测定MfeI-HF和WT MfeI的FI,其中在NEB稀释剂A中进行稀释。比较在图20中示出,并且结果在表19(下面)中列出。

表19:MfeI-HF和WT MfeI的比较

在NEB1和NEB4中,MfeI-HF表现最好,其中优选的FI为≥1000;在NEB1和NEB4中,WTMfeI表现最好,其中优选的FI为32。总FI改进因子是≥1000/32=32倍。

1.HindIII的表达

HindIII在用pUC19-HindIIIRM转化的大肠杆菌中表达,所述pUC19-HindIIIRM含有HindIII内切核酸酶和甲基化酶基因。细胞在30℃下,在具有Amp的LB中生长过夜。

2.HindIII的诱变

将HindIII中88个带电荷的残基突变为Ala。这些是:2、3、7、8、14、20、22、34、37、39、42、45、52、55、61、62、66、69、74、84、87、89、94、100、101、109、111、114、117、120、123、124、126、128、132、134、135、136、137、138、153、158、162、163、171、172、180、182、183、190、197、198、201、202、207、209、214、215、218、222、225、227、228、229、237、238、243、244、245、249、250、251、254、255、261、265、266、267、270、274、275、281、283、286、290、293、296、297。

在位置4、11、15、17、18、19、21、23、26、27、30、31、36、38、46、57、58、59、60、63、64、76、77、80、82、83、88、91、99、102、103、104、112、113、116、118、121、122、125、131、133、139、143、146、147、148、149、151、152、154、155、157、159、160、164、168、169、170、178、184、185、187、188、189、191、193、194、195、199、200、203、204、206、210、211、212、213、216、217、219、220、221、224、230、232、233、236、240、241、246、252、253、256、258、262、263、264、277、278、279、280、284、287、288、294、295、299处,将所有残基Cys、Met、Asn、Gln、Ser、Thr、Trp改变为Ala,而将Tyr改变为Phe。

上面的数字相应于HindIII蛋白序列(SEQ ID NO:85)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER3081。

3.HindIII-HF的选择

使用与前面的实施例相似的方法,完成HindIII-HF的选择。标准活性检查使用λDNA、在NEB4中并具有5%甘油,并且星号活性在具有39%甘油的NEB4缓冲液中使用λDNA底物测量。发现HindIII的两个突变体具有减少的星号活性。这些是HindIII(K198A)和S188P/E190A。将HindIII(K198A)标记为HindIII-HF。

4.HindIII-HF和WT HindIII的比较

在NEB1-4缓冲液中的每一种中,使用λDNA底物,用稀释剂B,分开测定HindIII-HF和WT HindIII的FI。比较在图21中示出,并且结果在表20(下面)中列出。

表20:HindIII-HF和WT HindIII的比较

在NEB2中,HindIII-HF表现最好,其中优选FI是≥64000;WT HindIII在NEB2中表现最好,其中优选的FI是250。总FI改进因子是4000/120=32。

1.SbfI的表达

SbfI在用pUC19-SbfIRM转化的大肠杆菌中表达。细胞在30℃下,在具有Amp的LB中生长过夜。

2.SbfI的诱变

将SbfI中78个带电荷的残基突变为Ala。这些残基是:5、8、15、18、23、27、30、34、46、49、50、53、58、63、66、70、71、74、81、82、83、85、86、87、90、94、103、115、120、121、127、132、135、136、143、144、147、150、152、154、164、169、170、183、184、187、188、192、196、204、206、208、213、214、215、218、219、226、228、230、233、237、238、239、241、248、251、253、257、258、259、260、262、266、282、284、285、288、293、297、299、304、305、307、311、316和322。

也将SbfI中的Ser和Thr残基突变为Ala。将Tyr突变为Phe。靶向下列位置:3、4、5、10、13、16、31、35、38、54、55、56、68、76、78、80、88、109、111、116、119、129、131、137、146、162、174、197、198、201、205、210、224、252、263、270、272、286、298、315、321。

也将下列位置的另外55个Cys、Phe、Met、Asn、Gln、Trp残基突变为Ala:2、24、26、29、32、51、62、65、67、72、84、91、92、95、97、101、104、106、110、112、114、117、124、134、140、157、160、171、178、179、185、189、193、212、217、225、231、243、245、247、256、265、268、277、279、280、281、283、287、289、290、296、301、313和317。

上面的数字相应于SbfI蛋白序列(SEQ ID NO:96)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将突变的产物转化入大肠杆菌菌株ER2984。

3.SbfI-HF的选择

如在前面的实施例中描述的,完成SbfI-HF的选择。标准活性检查使用λDNA、在NEB4中并具有5%甘油,并且星号活性检查针对λDNA在核酸外切酶I缓冲液中进行。将SbfI(K251A)标记为SbfI-HF。

4.SbfI-HF和WT SbfI的比较

在NEB1-4缓冲液中,对λDNA,用稀释剂C,分开测定SbfI-HF和WT SbfI的FI。比较在图22中示出,并且结果在表21(下面)中列出。

表21:SbfI-HF和WT SbfI的比较

在NEB1和NEB4中,SbfI-HF表现最好,其中优选FI是1000;WT SbfI在NEB1中表现最好,其中优选的FI是8。总FI改进因子是1000/8=125倍。

1.EagI的表达

EagI在用pBR322-EagIRM转化的大肠杆菌中表达。细胞在30℃下,在具有20μg/ml四环素的LB中生长过夜。

2.EagI的诱变

将Asp、Glu、His、Lys、Arg、Ser、Thr、Asn和Gln残基突变为Ala。将Tyr突变为Phe。这些是下列残基:2、3、4、5、6、9、13、14、17、19、21、23、27、35、36、37、40、42、43、44、45、46、49、51、53、55、56、58、60、66、67、69、71、72、73、74、75、77、78、80、82、86、87、92、93、94、95、98、99、100、102、103、104、105、112、113、114、116、117、119、122、125、127、132、134、135、137、139、140、141、145、147、148、150、152、154、155、156、157、160、162、163、164、166、169、172、173、176、177、178、179、182、185、187、188、189、193、196、197、201、202、203、204、205、206、208、209、212、217、220、221、222、224、225、230、235、236、237、238、239、240、241、243、245、246、247、248、251、255、257、258、259、260、263、264、265、266、270、272、273、275、276、277、279、280、283、286、288、289、291、295、296。

上面的数字相应于EagI蛋白序列(SEQ ID NO:82)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER 3081中,并且在具有四环素的LB琼脂平板上生长。

3.EagI-HF的选择

使用与前面实施例不同的方法,完成EagI-HF的选择,所述方法使用高浓度甘油、高浓度DMSO或高pH。在粗提物中,因为表达太低而不能示出星号活性,纯化每一突变体以检查星号活性会是非常冗长的。根据前面的实施例,推断与NEB3相比,在NEB4中HF内切核酸酶倾向具有增加的切割活性。因此,粗提物中EagI的活性在NEB3和NEB4中都测量;选择具有最高NEB4/NEB3比率的一个。将EagI(H43A)标记为EagI-HF。

4.EagI-HF和WT EagI的比较

在NEB1-4缓冲液的每一个中,对pXba底物,分开测定EagI-HF和WT EagI的FI。比较在图23中示出,并且结果在表22(下面)中列出。

表22:EagI-HF和WT EagI的比较

在NEB2和NEB4中,EagI-HF表现最好,其中优选FI是500;WT EagI在NEB3和NEB4中表现最好,其中优选的FI是250。总FI改进因子是500/250=2。

1.EcoRV的表达

EcoRV在用pACYC-EcoRVM和placzz1-EcoRV转化的大肠杆菌中表达。Placzz1是pUC19衍生质粒,并且pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.EcoRV的诱变

将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr和Trp残基改变为Ala。将Tyr改变为Phe。这些是:2、4、5、6、9、12、13、14、15、16、17、18、19、21、25、27、29、31、35、36、37、38、41、42、44、45、47、48、49、53、54、57、58、59、61、64、65、67、68、69、70、71、72、74、75、76、78、79、81、82、84、85、86、90、92、93、94、95、96、97、98、99、100、101、102、104、105、106、110、111、112、113、114、115、116、117、118、119、120、123、125、126、127、128、131、132、136、138、139、140、143、144、145、146、147、149、150、151、152、154、155、157、158、161、163、164、167、169、171、172、173、174、179、183、185、186、187、188、191、193、195、196、197、198、199、201、203、206、207、208、209、210、211、212、214、215、216、217、218、219、220、221、222、223、224、226、227、228、229、230、231、232、234、235、236、237、238、239、241、242、244和245。

上面的数字相应于EcoRV蛋白序列(SEQ ID NO:84)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-EcoRVM)。

3.EcoRV-HF的选择

使用与前面实施例相似的方法,完成EcoRV-HF的选择。标准活性检查在NEB4中、应用5%甘油使用pXba进行,并且星号活性检查针对pXba、应用39%甘油在核酸外切酶I缓冲液中进行。发现EcoRV(D19A/E27A)与WT EcoRV相比具有减少的星号活性。将该突变体标记为EcoRV-HF。对于该突变体,E27A是靶向突变,并且D19A是自发突变。双突变体比D19A和E27A单突变体在星号活性方面具有更大的减少。

4.EcoRV-HF和WT EcoRV的比较

在NEB1-4缓冲液中的每一种中,对pXba底物,分开测定EcoRV-HF和WT EcoRV的FI。比较在图24中示出,并且结果在表23(下面)中列出。

表23:EcoRV-HF和WT EcoRV的比较

在NEB2和NEB4中,EcoRV-HF表现最好,其中优选FI是≥64000;WT EcoRV在NEB3中表现最好,其中优选的FI是1000。总FI改进因子为≥64000/1000=64。

1.AvrII的表达

AvrII在用pUC19-AvrIIRM转化的大肠杆菌中表达。细胞在30℃下,在具有Amp的LB中生长过夜。

2.AvrII的诱变

将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr和Trp残基突变为Ala。将Tyr改变为Phe。这些是:2、3、4、6、8、9、10、12、15、17、19、20、22、23、27、29、30、31、32、34、36、40、41、42、43、44、46、47、48、50、51、53、55、56、57、58、59、60、65、68、70、72、74、75、76、77、79、80、82、83、84、86、87、88、94、95、96、97、100、104、105、106、107、108、110、112、113、116、117、119、120、121、122、123、124、126、127、129、130、131、132、134、136、139、142、143、144、145、150、151、152、153、154、156、157、158、161、163、164、165、166、168、169、173、174、177、178、181、182、184、186、187、188、189、190、191、192、195、198、200、202、206、207、211、215、216、220、223、224、226、229、230、231、232、233、234、235、236、237、239、243、244、245、246、248、249、253、255、256、260、262、264、265、266、267、268、269、270、272、274、276、277、278、279、280、281、284、285、286、288、289、290、291、299、302、303、304、305、306、308、310、312、314、315、316、318、321、322、324、325、328、331、333、335、337、338、339、340、342、343、346、347、348、350、351、353、354、355、356、358。

上面的数字相应于AvrII蛋白序列(SEQ ID NO:80)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER2984中。

3.AvrII-HF的选择

使用与前面实施例相似的方法,完成AvrII-HF的选择。切割活性在NEB4中应用5%甘油使用pBC4测定,并且星号活性在具有39%甘油的ExoI缓冲液中应用pBC4测定。突变体#16(M29A)、#57(E96A)、#60(Y104F)、#62(K106A)、#154(S127A)、#170(F142A)都示出改进。将AvrII(Y104F)标记为AvrII-HF。

4.AvrII-HF和WT AvrII的比较

在NEB1-4缓冲液中的每一种中,对T7 DNA底物,使用稀释剂B,分开测定AvrII-HF和WT AvrII的FI。比较在图25中示出,并且结果在表24(下面)中列出。

表24:AvrII-HF和WT AvrII的比较

在NEB1和NEB4中,AvrII-HF表现最好,其中优选FI是1000;WT AvrII在NEB1和NEB4中表现最好,其中优选的FI是64。总FI改进因子是1000/64=16。

1.BstXI的表达

BstXI在用pACYCBstXIMS和pUC19-BstXIR转化的大肠杆菌中表达。pACYC是低拷贝相容性质粒。BstXI必须具有甲基化酶基因和特异性基因以具有甲基化酶功能。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.BstXI的诱变

如下,在BstXI中,进行237个氨基酸突变。将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr、Trp突变为Ala。将Try突变为Phe。这些是:4、6、7、9、11、12、14、15、17、18、20、21、22、23、24、26、27、29、30、31、32、33、34、35、36、37、39、40、42、43、46、48、50、53、54、57、58、59、60、62、63、64、65、66、71、72、73、75、76、78、80、81、82、83、84、86、89、91、93、94、95、96、97、98、103.105、106、108、110、111、112、114、117、118、120、123、124、125、126、127、128、129、130、131、137、138、139、141、142、144、145、146、148、151、152、153、154、155、156、159、162、163、166、168、169、171、172、173、174、175、176、177、178、182、185、188、189、191、193、194、195、196、198、199、201、204、208、209、210、211、212、214、215、216、217、218、219、220、221、223、228、229、230、233、235、236、238、239、240、244、245、248、249、250、253、254、255、258、259、260、261、263、264、265、267、268、269、272、276、277、278、279、280、282、285、286、287、288、289、291、293、294、295、300、301、302、304、305、306、308、309、312、314、317、318、319、320、323、324、325、326、330、331、333、334、335、337、343、344、345、346、347、349、353、355、356、357、358、359、360、362、363、364、365、367、369、371、373、374、376、377、378、379、380、381、382和383。

上面的数字相应于BstXI蛋白序列(SEQ ID NO:7)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BstXIMS)。

3.BstXI-HF的选择

使用与前面实施例相似的方法,完成BstXI-HF的选择。切割活性在NEB4中应用5%甘油使用pBC4测定,并且星号活性在具有39%甘油的NEB4缓冲液中使用pBC4 DNA底物测定。突变体#36(Y57F)、#44(N65A)、#48(E75A)、#49(N76A)和#124(K199A)都具有减少的星号活性。将BstXI(N65A)标记为BstXI-HF。

4.BstXI-HF和WT BstXI的比较

在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定BstXI-HF和WT BstXI的FI。比较在图26中示出,并且结果在表25(下面)中列出。

表25:BstXI-HF和WT BstXI的比较

在NEB2和NEB4中,BstXI-HF表现最好,其中优选FI是≥250;WT BstXI在NEB2、NEB3和NEB4中表现最好,其中优选的FI是32。总FI改进因子为≥250/32=8。

1.PciI的表达

PciI在用pACYC-PciIM和placzz1-PciIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒,pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.PciI的诱变

利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr突变PciI中151个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:2、3、4、6、8、9、10、11、12、14、17、18、19、21、24、25、26、28、29、30、31、33、34、35、36、38、39、41、44、46、47、49、50、51、54、55、56、58、59、60、63、67、68、69、71、74、75、78、80、81、82、85、86、91、92、95、97、98、101、103、104、107、109、113、114、115、118、119、120、121、122、124、126、127、129、130、131、132、133、135、136、137、138、143、145、146、147、148、149、151、152、153、154、155、157、158、159、161、164、165、167、172、175、178、179、180、182、184、185、186、190、192、193、196、197、198、199、200、202、203、206、207、209、210、215、218、221、222、228、229、230、231、232、233、234、235、237、238、239、241、242、243、244、246、247、248、253、254、255、256。

上面的数字相应于PciI蛋白序列(SEQ ID NO:15)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PciIM)。

3.PciI-HF的选择

使用与前面实施例相似的方法,完成PciI-HF的选择。切割活性在NEB4中应用5%甘油使用SalI-切割pBR322测定,并且星号活性在具有39%甘油的ExoI缓冲液中使用SalI-切割pBR322测定。双突变体PciI(E78A/S133A)具有减少的星号活性和强的切割活性。该突变体不是上面描述的靶向突变之一,而是偶然随机事件。

4.PciI-HF和WT PciI的比较

在NEB1-4缓冲液中的每一种中,对pXba底物,使用稀释剂A,分开测定PciI-HF和WTPciI的FI。比较在图27中示出,并且结果在表26(下面)中列出。

表26:PciI-HF和WT PciI的比较

在NEB2、NEB3和NEB4中,PciI-HF表现最好,其中优选FI是≥2000;WT PciI在NEB3中表现最好,其中优选的FI是120。总FI改进因子为≥2000/120=16。

1.HpaI的表达

HpaI在用pACYC-MseIM和placzz1-HpaIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒,pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。

2.HpaI的诱变

利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变HpaI中的156个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:7、8、9、13、14、16、17、19、20、21、22、23、26、27、29、30、33、34、35、36、37、38、40、41、42、46、47、48、50、51、56、57、59、60、65、67、69、71、72、74、75、78、79、80、81、82、83、84、85、86、89、91、93、94、95、99、100、104、105、106、108、109、110、113、115、117、119、121、122、123、124、127、128、130、131、133、135、136、137、138、139、141、142、146、147、149、150、152、156、158、159、160、162、164、165、166、167、168、169、170、172、173、176、177、180、181、182、184、185、187、188、190、191、192、193、195、196、197、202、204、206、208、209、211、212、214、215、216、217、218、219、220、221、222、223、224、225、228、230、231、233、234、235、236、237、238、240、241、242、243、244、245、247、248、249。

上面的数字相应于HpaI蛋白序列(SEQ ID NO:86)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-MseIM)。

3.HpaI-HF的选择

使用与前面实施例不同的方法,完成HpaI-HF的选择。在NEB2缓冲液中,使用λDNA底物,测定切割活性和星号活性。在NEB2中,该HpaI具有比在NEB4中多得多的星号活性,并且可在5%甘油中明显观察到。

HpaI(Y29F)和HpaI(E56A)都是优选的具有减少星号活性的突变。将HpaI(E56A)标记为HpaI-HF。

4.HpaI-HF和WT HpaI的比较

在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定HpaI-HF和WTHpaI的FI。比较在图28中示出,并且结果在表27(下面)中列出。

表27:HpaI-HF和WT HpaI的比较

在NEB2中,HpaI-HF表现最好,其中优选FI是≥2000;WT PciI在NEB4中表现最好,其中优选FI是16。总FI改进因子为≥2000/16=120。

1.AgeI的表达

AgeI在用pRRS-AgeIRM和psyx20-lacIq转化的大肠杆菌中表达。pRRS是pUC19衍生质粒,psyx20-lacIq是低拷贝相容性质粒,其带有在lacIq启动子下表达的lacI。细胞在37℃下,在具有Amp和Kan的LB中生长至200Klett单位,然后用0.5mM IPTG在25℃下诱导过夜。AgeI的表达极难实现,因为它是不稳定的。

2.AgeI的诱变

利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变AgeI中149个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:2、4、6、7、9、14、16、18、19、21、22、23、24、25、26、27、29、30、31、32、37、38、40、42、43、44、45、49、51、53、55、56、58、60、62、64、65、67、68、69、72、73、75、77、78、79、82、83、85、86、87、88、90、91、92、94、96、97、102、103、104、105、110、111、114、116、119、120、122、123、128、129、130、134、135、138、139、140、142、144、146、147、148、152、153、155、157、159、166、168、170、173、174、176、177、178、182、183、185、186、188、192、195、198、200、201、206、211、212、214、217、219、220、222、223、224、225、226、227、229、231、233、234、235、237、238、239、240、241、243、245、247、248、250、251、253、255、256、258、260、262、265、266、267、268、269、271、272。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(psyx20-lacIq)。

上面的数字相应于AgeI蛋白序列(SEQ ID NO:79)中的氨基酸位置。

3.AgeI-HF的选择

使用与前面实施例相似的方法,完成AgeI-HF的选择。标准活性检查在NEB4中应用5%甘油使用pXba进行,并且星号活性检查在具有39%甘油的NEB4缓冲液中对pXba进行。因为表达系统的困难性,在获得有意义的突变体之前,重复该选择八次。两个突变体——S201A和R139A——具有减少的星号活性,并且将R139A标记为AgeI-HF。

4.AgeI-HF和WT AgeI的比较

在NEB1-4缓冲液中的每一种中,对pXba底物,使用稀释剂A,分开测定AgeI-HF和WTAgeI的FI。比较在图29中示出,并且结果在表28(下面)中列出。

表28:AgeI-HF和WT AgeI的比较

在NEB1和NEB4中,AgeI-HF表现最好,其中优选FI是≥500;WT AgeI在NEB3中表现最好,其中优选的FI是16。总FI改进因子为≥500/16=32。

1.BsmBI的表达

BsmBI在用pACYC-BsmAIM、ptaczz2-BsmBIR和psyx20-lacIq转化的大肠杆菌中表达。Ptaczz2是pUC19衍生质粒,其携带诱导型ptac启动子,pACYC是低拷贝相容性质粒。BsmAIM(GTCTC)遮盖(cover)BsmBI(CGTCTC)特异性。psyx20-lacIq是低拷贝载体,其具有强的lacI表达。细胞在37℃下生长,然后,在具有Amp、Cam和Kan的LB中诱导。

2.BsmBI的诱变

利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变BsmBI中358个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:8、9、12、13、14、15、17、18、19、20、21、24、25、26、27、28、29、31、33、37、38、40、42、43、44、46、47、49、50、51、52、53、54、55、56、57、58、60、61、62、63、64、65、66、67、69、70、72、76、78、79、80、81、82、83、84、88、91、93、95、96、98、99、101、103、104、105、106、109、110、111、113、114、115、117、118、119、120、121、122、124、126、127、128、130、131、132、133、134、135、138、141、143、144、145、147、149、150、154、155、157、158、160、162、163、164、165、166、167、168、169、172、174、175、176、177、179、180、181、182、184、185、186、188、189、191、194、195、197、200、201、203、205、206、207、208、211、212、213、214、215、216、217、220、221、222、223、224、225、226、228、229、230、231、232、233、235、236、237、238、239、240、242、243、247、250、251、252、257、258、260、262、263、264、265、266、268、269、271、273、274、279、280、282、283、284、287、288、289、292、294、295、296、297、299、300、301、302、303、304、305、306、307、309、310、313、314、315、316、317、318、320、321、324、325、326、328、331、332、333、334、335、336、339、340、341、342、343、344、345、348、349、351、352、353、355、356、357、358、360、361、363、364、366、367、368、370、372、375、376、377、379、381、382、384、385、386、388、389、390、393、394、395、396、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、418、421、424、425、426、428、430、431、432、433、434、436、437、438、439、442、443、444、445、446、446、448、449、450、451、452、453、454、457、458、460、461、462、464、466、467、468、470、471、472、473、474、477、478、479、480、482、483、484、485、486、487、488、489、491、492、495、496、497、498、499、500、502、503、504、505、506、507、510、511、515、516、517、518、519、522、523。

上面的数字相应于BsmBI蛋白序列(SEQ ID NO:81)中的氨基酸位置。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BsmAIM,psyx20-lacIq)。

3.BsmBI-HF的选择

使用与前面实施例相似的方法,完成BsmBI-HF的选择。切割在NEB4中应用5%甘油使用λDNA测定,并且星号活性在具有39%甘油的NEB4缓冲液中使用Litmus28i测定。优选的突变体包括H230A、D231A和N185Y/R232A。标记N185Y/R232A为BsmBI-HF。

4.BsmBI-HF和WT BsmBI的比较

在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定BsmBI-HF和WT BsmBI的FI。比较在图30中示出,并且结果在表29(下面)中列出。

表29:BsmBI-HF和WT BsmBI的比较

在NEB1、NEB2和NEB4中,BsmBI-HF表现最好,其中优选FI是≥500;WT BsmBI在NEB3中表现最好,其中优选的FI是120。总FI改进因子为≥500/120=4。

1.BspQI限制性内切核酸酶的位点定向诱变

用Km

将BspQI中122个带电荷的或不带电荷的氨基酸残基(Arg、Lys、His、Glu、Asp、Gln、Asn、Cys)通过位点定向诱变改变为Ala。在下列条件下,进行PCR:DNA变性,98℃持续30sec,1个循环;DNA变性/引物退火/延伸,98℃持续10sec,55℃到65℃进行30sec,72℃持续2min,进行18个PCR循环;72℃持续15min,1个循环。在100μl反应中,2单位的Phusion

用DpnI消化PCR DNA,以破坏模板DNA(Dam甲基化的)并与pSX33-earIM1M2共转化入大肠杆菌。培养各转化体过夜(5ml LB、50μg/ml Km

BspQI星号活性分析条件:1μg pUC19 DNA、5μl 10x NEB缓冲液1、25%DMSO、2.5μl澄清细胞提取物、无菌去离子水至50μl总体积,并且在50℃下温育1小时。通过电泳,在0.8到1%琼脂糖凝胶中,解析消化的DNA。

收获第二份细胞培养物(未诱导的),并通过Qiagen离心柱纯化方法(Qiagen,Valencia,CA)制备质粒DNA。通过大-染料双脱氧-终止子-测序方法(Big-dye dideoxy-terminator sequencing method),测序bspQIR等位基因,以证实期望的突变。在鉴定减少星号活性突变体之后,获得新转化体,并且制造IPTG-诱导的培养物。再次分析限制性活性和星号活性,以证实在所有四种缓冲液中与WT酶相比减少的星号活性。

在通过位点定向诱变构建的122个BspQI突变体中,两种BspQI变体——R388A和K279A——显示减少的星号活性。在缓冲液1和10%甘油中,R388A的星号活性减少大约16倍。然而,R388A在高酶浓度下仍旧显示星号活性。BspQI变体K279A也显示减少的星号活性(在减少星号活性方面>8-倍改进)。

为了进一步在高酶浓度下减少星号活性,将R388和K279取代为Phe、Pro、Tyr、Glu、Asp或Leu。分析各种R388X和K279X突变体的IPTG-诱导的细胞提取物的限制性活性和星号活性。发现R388F或K279P在细胞提取物或纯化酶中显示最小的星号活性。氨基酸取代不影响比活性。

为了仍进一步减少BspQI星号活性,通过位点定向诱变,将两种氨基酸取代组合进一个突变体酶中(双突变体,K279P/R388F)。该双突变体在具有10%甘油的缓冲液1和缓冲液2中缺少星号活性(图41B)。

表30:BspQI-HF对WT BspQI

在BspQI中发现保守的K279和R388氨基酸残基,其中在SapI中相应位置是K273和R380。6x His标记SapI表达克隆首先在pUC19中构建。SapI表达菌株是用Km

PCR、转化、质粒DNA制备和酶活性分析如对BspQI描述的进行,除了在37℃下,测定SapI活性。6x His-标记SapI变体K273P/R380F通过Ni-NTA柱色谱纯化,并且示出在存在25%DMSO或5%甘油情况下,显示减少的星号活性。

包含两种活性的KpnI已被改变为具有较低星号活性的突变体(国际公开号WO07/027464)。下面的实施例描述具有改进的星号活性和与野生型相似的切割活性的新的突变体。

将除了催化残基的带电荷的氨基酸残基(Asp、Glu、Arg、Lys和His)或极性氨基酸(Ser、Thr、Tyr、Asn、Gln、Phe、Trp、Cys和Met)单独突变为丙氨酸。

通过反向PCR,使用具有希望突变的引物,进行诱变。一般而言,在100μL终体积中,使用0.4mM的每种4dNTP、1x ThermoPol缓冲液(NEB)、20ng的模板DNA、40μmol的每种引物和4U的Vent DNA聚合酶(NEB),实施反向PCR。

分别含有Plac或Ptac启动子控制下的KpnIR的质粒pUC19或pAGR3被用作模板。使用下列温度方案进行PCR:94℃持续4分钟,然后94℃持续30秒进行变性、55℃持续30秒进行退火和72℃持续5分钟进行延伸的25个循环。循环后在72℃下温育7分钟,然后用20U的DpnI(NEB)在37℃下处理反应1小时,以降解模板DNA。在80℃下失活DpnI 20分钟后,使用2μl反应物转化用pSYX20-KpnIM预转化的50μL化学感受态NEB5alpha(NEB)。将转化的细菌铺板在含有100μg/ml氨苄青霉素和30μg/ml卡那霉素的LB板上,并且在37℃下温育12到15小时。每种构建物的3到4个菌落在1ml含有100μg/ml氨苄青霉素和30μg/ml卡那霉素的LB中,在37℃下培养12到15小时,并伴随200rpm的摇动。将培养物离心(spin down),并且重新悬浮在0.2ml的超声处理缓冲液(20mM Tris-HCl,pH 8.3,50mM NaCl,1mM EDTA,1mM PMSF)中。将重新悬浮的细胞超声处理20秒,然后在4℃下以13,000rpm离心5分钟。进行上清液稀释,并且分析其中5μL的KpnI切割活性。

对于筛查突变体,使用50μL总体积中5μL以10-或100-倍稀释的溶胞产物上清液、0.5μg的pXba DNA(NEB)和1x NEBuffer 4,进行活性分析反应。在37℃下温育1小时后,通过加入10μl的6x DNA上样染料停止分析反应,并且通过1xTBE中0.8%琼脂糖凝胶电泳分析。分析示出与亲代酶(KpnI D148E)相比具有增加的总切割活性的突变体在含有25%DMSO的缓冲液中减少的星号活性。

在1x NEBuffer 4中存在5%甘油和0.2mg/ml BSA的情况下(总体积=50μL),使用5μL用1μg的pXba DNA(NEB)温育的酶稀释物,进行分析。在37℃下温育1小时后,用20μg蛋白激酶K(NEB)在37℃下处理反应15分钟,然后通过1x TBE中0.8%琼脂糖凝胶电泳分析。使用50U的酶和1μg pXba DNA,在含有20mM Tris HCl、50mM NaCl,pH 7.9、1mM DTT和增加浓度的MgSO

随机诱变的结果是优选的突变体KpnI D148E,其示出比野生型酶和前面描述的KpnI D163I/K165A突变体(国际公开号WO 07/027464)低的星号活性。然而,KpnI D148E在高酶浓度下显示星号活性。在D148E背景中,构建双或三突变体以减少该观察到的星号活性。发现KpnI(D16N/E132A/D148E)具有比突变体D148E低的星号活性和高的比活性。通过位点定向诱变,引入氨基酸取代D148到E和E132到A。通过PCR引入D16到N的突变。在标准反应条件中,将纯化酶与底物DNA pXba(含有6个KpnI位点),在37℃下)温育1小时产生表31中示出的减少的星号活性。

表31:KpnI突变体的保真度指数

对于突变体D16N/E132A/D148E,上至4000U,没有观察到pXba的星号活性。当用KpnI D148E和D16N/E132A/D148E切割时,对于pBR322底物——其不含有KpnI位点——观察到的星号活性也被减少。

1.BsaI的表达

BsaI在用pACYC-BsmAIM、pUC19-BsaIR和psyx20-lacIq转化的大肠杆菌中表达。pACYC是低拷贝相容性质粒。BsmAIM(GTCTC)遮盖BsmBI特异性(CGTCTC)。psyx20-lacIq是具有强lacI表达的低拷贝载体。细胞在37℃下生长,然后在具有Amp、Cam和Kan的LB中诱导。

2.BsaI的诱变

BsaI的氨基酸与BsmBI的氨基酸相似。在相应的前述有效位点周围和相应的前述有效位点处的11个氨基酸被突变为R229A、S230A、Y231F、T232A、T233A、D234A、R235A、R236A、F238A、E239A、Y240F。

方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BsmAIM、psyx20-lacIq)。

3.BsaI-HF的选择

使用与前面实施例相似的方法,完成BsaI-HF的选择。标准活性检查在NEB4中应用5%甘油使用λDNA进行,并且星号活性检查在具有39%甘油的NEB4缓冲液中对litmus28i进行。在11种设计的突变体中的一种突变体Y231F减少星号活性,并将其标记为BsaI-HF。

4.BsaI-HF和WT BsaI的比较

在NEB1-4缓冲液中,对λDNA,使用稀释剂A,分开测定BsaI-HF和WT BsaI的FI。结果在表32(下面)中列出。

表32:BsaI-HF和WT BsaI的比较

在NEB2、NEB3和NEB4中,BsaI-HF表现最好,其中最好FI是≥8000;WT BsaI在NEB2和NEB4中表现最好,其中最好的FI是120。所以,总FI改进因子为≥8000/120=≥64。

序列表

<110> 新英格兰生物实验室公司

<120> 高保真度限制性内切核酸酶

<130> NEB-293-PCT

<160> 106

<170> PatentIn version 3.4

<210> 1

<211> 1089

<212> DNA

<213> 藤黄微球菌(Micrococcus luteus)

<400> 1

atgatcaagt acttgggtag caagcggacg ctcgtgcccg tcctcggtga catcgcttcg 60

gcctctgaag caacagaggc ggttgacctg ttcactggca cgacgcgtgt ggcgcaagag 120

ttcaagcgtc gcgggcttcg agttcttgct aacgacatag cgacgtactc cgaggtttta 180

gcccagtgct atatcgccac caacggccag gaagttgacc gccgtgcgct cgaggccgct 240

ctggcggagc tgaacgcctt gcccggcgaa cctggatact tcacggaaac cttctgtgag 300

gcttctcgct acttccagcc caagaacggg gctcgggtgg atgcaatcag gaatgcgatc 360

gacgaccggt acgcggactc atggatgcga ccgatcctcc tcacgagctt gatgcttgcg 420

gccgaccgcg tcgactccac taccggagtg cagatggctt acctgaagca gtgggccgcg 480

cgtgcgcaca atgatctaga gttgcggctt ccagacctaa tcgcaggtga cggtgacgct 540

gctcgtgagg atgcggtgac tctcgcacaa gagctgcctc gcgtccagct gatgtacctt 600

gatcctccct ataaccagca caggtacttc accaactacc atatttggga gaccctgatt 660

cgttgggatg cccctgagag ttatgggatc gcctgtaagc gcattgactc tcgagatgat 720

gccaccaaga gcccctataa tatgaagcgg cgaatgcccg acgagatgcg tcgcctgctg 780

atgaccatca aggcggacct cgcggttgta tcttacaaca atgagtcgtg gattgatccg 840

gagacgatga tgtcgaccct gcgcgatgcg ggatatgagg acgtgcgtct gctcgctttc 900

gactataagc gctacgttgg ggctcaaatc gggatctaca atccctccgg ggaaaaggtc 960

ggtcgtgtga gtcacctccg aaacatcgag tatctctttc ttgcgggacc aacggagcgc 1020

gttgaggtgt gcgccgcgag tgttgaacac cgagcactac ccaaggaacc ggaactcacc 1080

gcgttctag 1089

<210> 2

<211> 362

<212> PRT

<213> 藤黄微球菌

<400> 2

Met Ile Lys Tyr Leu Gly Ser Lys Arg Thr Leu Val Pro Val Leu Gly

1 5 10 15

Asp Ile Ala Ser Ala Ser Glu Ala Thr Glu Ala Val Asp Leu Phe Thr

20 25 30

Gly Thr Thr Arg Val Ala Gln Glu Phe Lys Arg Arg Gly Leu Arg Val

35 40 45

Leu Ala Asn Asp Ile Ala Thr Tyr Ser Glu Val Leu Ala Gln Cys Tyr

50 55 60

Ile Ala Thr Asn Gly Gln Glu Val Asp Arg Arg Ala Leu Glu Ala Ala

65 70 75 80

Leu Ala Glu Leu Asn Ala Leu Pro Gly Glu Pro Gly Tyr Phe Thr Glu

85 90 95

Thr Phe Cys Glu Ala Ser Arg Tyr Phe Gln Pro Lys Asn Gly Ala Arg

100 105 110

Val Asp Ala Ile Arg Asn Ala Ile Asp Asp Arg Tyr Ala Asp Ser Trp

115 120 125

Met Arg Pro Ile Leu Leu Thr Ser Leu Met Leu Ala Ala Asp Arg Val

130 135 140

Asp Ser Thr Thr Gly Val Gln Met Ala Tyr Leu Lys Gln Trp Ala Ala

145 150 155 160

Arg Ala His Asn Asp Leu Glu Leu Arg Leu Pro Asp Leu Ile Ala Gly

165 170 175

Asp Gly Asp Ala Ala Arg Glu Asp Ala Val Thr Leu Ala Gln Glu Leu

180 185 190

Pro Arg Val Gln Leu Met Tyr Leu Asp Pro Pro Tyr Asn Gln His Arg

195 200 205

Tyr Phe Thr Asn Tyr His Ile Trp Glu Thr Leu Ile Arg Trp Asp Ala

210 215 220

Pro Glu Ser Tyr Gly Ile Ala Cys Lys Arg Ile Asp Ser Arg Asp Asp

225 230 235 240

Ala Thr Lys Ser Pro Tyr Asn Met Lys Arg Arg Met Pro Asp Glu Met

245 250 255

Arg Arg Leu Leu Met Thr Ile Lys Ala Asp Leu Ala Val Val Ser Tyr

260 265 270

Asn Asn Glu Ser Trp Ile Asp Pro Glu Thr Met Met Ser Thr Leu Arg

275 280 285

Asp Ala Gly Tyr Glu Asp Val Arg Leu Leu Ala Phe Asp Tyr Lys Arg

290 295 300

Tyr Val Gly Ala Gln Ile Gly Ile Tyr Asn Pro Ser Gly Glu Lys Val

305 310 315 320

Gly Arg Val Ser His Leu Arg Asn Ile Glu Tyr Leu Phe Leu Ala Gly

325 330 335

Pro Thr Glu Arg Val Glu Val Cys Ala Ala Ser Val Glu His Arg Ala

340 345 350

Leu Pro Lys Glu Pro Glu Leu Thr Ala Phe

355 360

<210> 3

<211> 1146

<212> DNA

<213> 幽门螺旋杆菌(Helicobacter pylori) J166

<400> 3

ttggagaatt ttttgaataa tttagatatt aaaaccttag ggcaggtttt cacccctaaa 60

aagatagtgg atttcatgct cactctcaag cacaatcatg ggagtgtttt agagccaagc 120

gcgggcgatg ggagtttttt aaagcgctta aaaaaggctg tagggattga aatcgatcct 180

aaaatctgcc ctaaaaatgc cctttgcatg gacttttttg actacccttt agaaaatcaa 240

tttgacacga ttattggcaa tccgccctat gtcaagcaca aggatattgc gccaagcacg 300

aaagaaaaac tccattacag cctttttgat gaaaggagta atctatactt gtttttcata 360

gaaaaagcga tcaagcattt aaagcctaaa ggcgaattga ttttcatcac cccaagggat 420

tttttaaaat ccacttctag cgtgaaatta aacgaatgga tttacaaaga aggcacgata 480

acgcattttt ttgaattagg cgatcaaaag attttcccaa acgccatgcc taattgcgtg 540

atttttcgtt tttgtaaagg tgatttcagt agaatcacca acgatggttt gcaatttgtg 600

tgcaaaaaag gcattttgta tttcctcaac caatcttaca cgcaaaaatt aagcgaggtt 660

tttaaggtta aggtgggggc agtgagcggg tgcgataaga tttttaaaaa tgaaacatac 720

gggaatttag aatttgtcac ctcaatcacc aaaagaacca atgttttaga aaaaatggtt 780

tttgtcaata aacctaatga ttatttactc cagcataaag acagcttgat gcaaagaaag 840

attaaaaaat tcaatgaaag taattggttt gaatggggga ggatgcatca catatcccct 900

aaaaaacgca tttatgttaa cgccaaaacg cgccaaaaaa accccttttt catccaccaa 960

tgccctaatt atgacggctc tattttagcg ctattccctt ataaccaaaa tttggattta 1020

caaaacctct gcgataaact caacgctatc aactggcaag aattaggctt tgtgtgcggc 1080

gggcgttttt tgttttcgca gcgctcttta gaaaacgccc ttttgcctaa agacttttta 1140

aattag 1146

<210> 4

<211> 609

<212> DNA

<213> 发酵支原体(Mycoplasma fermentans)

<400> 4

atgggtaaat ctgaattaag tggaagatta aattggcaag cattggctgg attaaaagct 60

agtggtgctg aacaaaactt atataacgtg tttaacgctg tttttgaagg aactaaatac 120

gttttatacg agaagccaaa gcaccttaaa aatctatacg ctcaagtagt cttacctgat 180

gatgttatta aagaaatttt taatccttta attgatttat caactactca atggggtgtt 240

tctccagatt tcgcaataga aaatacagaa acgcataaaa ttctttttgg tgaaattaaa 300

agacaagatg gatgggtaga aggtaaagat cctagtgctg gcaggggtaa tgcacatgag 360

agatcttgta aattatttac tcctggatta ttaaaagctt atagaacaat tggtggaatt 420

aacgatgaag agatattgcc attctgggtt gtattcgaag gtgatataac acgagatccc 480

aaaagagtaa gagaaattac tttctggtat gaccactatc aagataatta tttcatgtgg 540

cgaccaaatg aatcaggcga aaaattagtt caacacttca atgaaaaatt aaaaaaatat 600

ttagattaa 609

<210> 5

<211> 202

<212> PRT

<213> 发酵支原体

<400> 5

Met Gly Lys Ser Glu Leu Ser Gly Arg Leu Asn Trp Gln Ala Leu Ala

1 5 10 15

Gly Leu Lys Ala Ser Gly Ala Glu Gln Asn Leu Tyr Asn Val Phe Asn

20 25 30

Ala Val Phe Glu Gly Thr Lys Tyr Val Leu Tyr Glu Lys Pro Lys His

35 40 45

Leu Lys Asn Leu Tyr Ala Gln Val Val Leu Pro Asp Asp Val Ile Lys

50 55 60

Glu Ile Phe Asn Pro Leu Ile Asp Leu Ser Thr Thr Gln Trp Gly Val

65 70 75 80

Ser Pro Asp Phe Ala Ile Glu Asn Thr Glu Thr His Lys Ile Leu Phe

85 90 95

Gly Glu Ile Lys Arg Gln Asp Gly Trp Val Glu Gly Lys Asp Pro Ser

100 105 110

Ala Gly Arg Gly Asn Ala His Glu Arg Ser Cys Lys Leu Phe Thr Pro

115 120 125

Gly Leu Leu Lys Ala Tyr Arg Thr Ile Gly Gly Ile Asn Asp Glu Glu

130 135 140

Ile Leu Pro Phe Trp Val Val Phe Glu Gly Asp Ile Thr Arg Asp Pro

145 150 155 160

Lys Arg Val Arg Glu Ile Thr Phe Trp Tyr Asp His Tyr Gln Asp Asn

165 170 175

Tyr Phe Met Trp Arg Pro Asn Glu Ser Gly Glu Lys Leu Val Gln His

180 185 190

Phe Asn Glu Lys Leu Lys Lys Tyr Leu Asp

195 200

<210> 6

<211> 1152

<212> DNA

<213> 嗜热脂肪芽胞杆菌(Bacillus stearothermophilus) X1

<400> 6

atggctatta cattatgtga cataaatggt tgtagacttg agagaggaca tactggtaaa 60

cataataaat ttcctgaatt tgtatggact tctcaattta ataaaaaaga tattgataag 120

gtcaataaag caggatatgc aacaccaaga ggtggggaca aaggagccta tcagaaccat 180

gtttacagaa ataataaagt aattattcct tttgaaaggt tggaaaatgt taatttaaat 240

aactatcaag atggatatgt tattaggtta ttccctaatc agtactttga atcagccggg 300

gtagttaagc cggaattctt acaaccaaat tcatttgtta aagttgggga caatgcattt 360

attttatatc gcacacattc atcttttgag gaattacctc ctctaccaga ctgggaggtt 420

agacatctaa aaaagaacgg taatatagtt accagaagaa gtaaggacgt aatcgatgct 480

ggacattatg tcttacgatt atcatcaatt agtaacaaaa aagaaagaaa agagggccct 540

cctcaaggta tttttgcacc tgaatatgca aatgcagaga ctaattatct gtcaaaagca 600

tttttagcct ggttaattat taaaactcaa aatagtccgt ataatgaaga acaattccaa 660

cacttaagag cgatcttaat tagtcataat ctcatcaata tttctcaact tgaagaaaag 720

gctattctaa agaatggtat cacatgctgc cctttatgcg agcaaattat tttttacgaa 780

cagctacacg aaatggtttc ttttgaaggt gcgtctggcc ttgcgaattc acaagaacag 840

gttgagggtg caactaggtc aacatcagtt aatttattcc atatggtacc attagtatat 900

gaaaccttgg aacacaaacc tgatcaaata gcatggggcc atgccatttg taatactaga 960

cttggtcaaa gagagtgcct gcctcttagt agactaaaac aagaaggtac gcccgttggt 1020

cttcttgatg aagattcgaa tcttgaagta ttaggatgga ttagtaaaga taagcaattt 1080

attcgtacag aaaatgggga agtttggatt aaaattacag atattgaatt taacgatgac 1140

tttgaagaat aa 1152

<210> 7

<211> 383

<212> PRT

<213> 嗜热脂肪芽胞杆菌 X1

<400> 7

Met Ala Ile Thr Leu Cys Asp Ile Asn Gly Cys Arg Leu Glu Arg Gly

1 5 10 15

His Thr Gly Lys His Asn Lys Phe Pro Glu Phe Val Trp Thr Ser Gln

20 25 30

Phe Asn Lys Lys Asp Ile Asp Lys Val Asn Lys Ala Gly Tyr Ala Thr

35 40 45

Pro Arg Gly Gly Asp Lys Gly Ala Tyr Gln Asn His Val Tyr Arg Asn

50 55 60

Asn Lys Val Ile Ile Pro Phe Glu Arg Leu Glu Asn Val Asn Leu Asn

65 70 75 80

Asn Tyr Gln Asp Gly Tyr Val Ile Arg Leu Phe Pro Asn Gln Tyr Phe

85 90 95

Glu Ser Ala Gly Val Val Lys Pro Glu Phe Leu Gln Pro Asn Ser Phe

100 105 110

Val Lys Val Gly Asp Asn Ala Phe Ile Leu Tyr Arg Thr His Ser Ser

115 120 125

Phe Glu Glu Leu Pro Pro Leu Pro Asp Trp Glu Val Arg His Leu Lys

130 135 140

Lys Asn Gly Asn Ile Val Thr Arg Arg Ser Lys Asp Val Ile Asp Ala

145 150 155 160

Gly His Tyr Val Leu Arg Leu Ser Ser Ile Ser Asn Lys Lys Glu Arg

165 170 175

Lys Glu Gly Pro Pro Gln Gly Ile Phe Ala Pro Glu Tyr Ala Asn Ala

180 185 190

Glu Thr Asn Tyr Leu Ser Lys Ala Phe Leu Ala Trp Leu Ile Ile Lys

195 200 205

Thr Gln Asn Ser Pro Tyr Asn Glu Glu Gln Phe Gln His Leu Arg Ala

210 215 220

Ile Leu Ile Ser His Asn Leu Ile Asn Ile Ser Gln Leu Glu Glu Lys

225 230 235 240

Ala Ile Leu Lys Asn Gly Ile Thr Cys Cys Pro Leu Cys Glu Gln Ile

245 250 255

Ile Phe Tyr Glu Gln Leu His Glu Met Val Ser Phe Glu Gly Ala Ser

260 265 270

Gly Leu Ala Asn Ser Gln Glu Gln Val Glu Gly Ala Thr Arg Ser Thr

275 280 285

Ser Val Asn Leu Phe His Met Val Pro Leu Val Tyr Glu Thr Leu Glu

290 295 300

His Lys Pro Asp Gln Ile Ala Trp Gly His Ala Ile Cys Asn Thr Arg

305 310 315 320

Leu Gly Gln Arg Glu Cys Leu Pro Leu Ser Arg Leu Lys Gln Glu Gly

325 330 335

Thr Pro Val Gly Leu Leu Asp Glu Asp Ser Asn Leu Glu Val Leu Gly

340 345 350

Trp Ile Ser Lys Asp Lys Gln Phe Ile Arg Thr Glu Asn Gly Glu Val

355 360 365

Trp Ile Lys Ile Thr Asp Ile Glu Phe Asn Asp Asp Phe Glu Glu

370 375 380

<210> 8

<211> 1536

<212> DNA

<213> 嗜热脂肪芽胞杆菌 X1

<220>

<221> misc_feature

<223> M.BstXI的DNA序列

<400> 8

atgatttttg ctgatattga atttgaaaaa gaactttttt cagctgctaa taaattaagg 60

ggaaaaattg ctccaagtga gtataagcat tatgttttgc ctttgatatt ccttagatat 120

ttatctctta aataccaaca aagaaggaat gaaattcaac aacagataaa tgattcaagg 180

gatcacaaga aaaatcaaga tgaagtgtta aagatattgg aagacaggac tgaatacacc 240

aaagtaaatg ttttctatat tcctgaaaaa gctagttggg aatacttatt gaaaaattcc 300

gaaaatgata aaattaaaga aatgatagat tcagctatgg aaatactgga aaatgaatat 360

gacgagttaa aaggtgtttt gccaaagata tataaaaact caaatatacc gaatgaagtt 420

attagtgatt tactaaaact attttctcaa gaagtatttt cagcacatga tggaagaaat 480

gttgatttat tggggagagt ttatgaatac tttataagta attttgctac tacagaaggt 540

actagaggtg gtgaatattt tacaccgtct tcaatcgtaa aattattggt agcaatgcta 600

gagcccatta aaggtacagt ttatgatccg gcctgtggga caggaggaat gtttattcag 660

tctaataaat atagagaaaa taatcataac ttgtgttttg taggccagga acaaaacgag 720

cttactatca aattggctaa aatgaatgga attctacatg gaataaatcc tgaaattaga 780

caaggtgatt cattattaaa tgaccgttat ccagaattga aagctgaaat tgtaatatct 840

aatccaccgt ttaatatgaa ggattgggga gctgaacgcc tgccacttaa tgataagcga 900

ttaataggac cggtaacaaa cagtaatgca aattacatgt ggatacagca ttttctatac 960

catttaaaag atggtggttt agcaggattt gttattgcta atggagcttt gactagtaat 1020

ctggctgctg aaaaaattgt aaggaaacac ttaatagaca atgattatgt agattgtgtt 1080

gttcaattac ctgaaaaaat gttctttggt actggcattc caagtgcttt agtgttttta 1140

agtaagaatc gaaatggaag taacggccat gccaaaagag aaaaagaggt tctatttatt 1200

gatgcaagcg ataagggaac attagtgggt aaaaagaata aaatattttt agatgatgaa 1260

ataaaagaaa ttgcagattt atatcattca tttaaatttt taaatgataa tgattataac 1320

catagtggtt tttacaaaaa ggttaacatt gaaaaaatcg tggaaaatga ttataaatta 1380

actccaactc tctatgtagg tgtaaaggaa gagactgaaa tggagaagcc atttagagaa 1440

atgataatag aatataaagc gatattagag caacaatttg aagaatcaaa caaactacag 1500

cagaaaatat taaagaattt agagggatta ttatga 1536

<210> 9

<211> 511

<212> PRT

<213> 嗜热脂肪芽胞杆菌 X1

<220>

<221> misc_feature

<223> M.BstXI的蛋白质序列

<400> 9

Met Ile Phe Ala Asp Ile Glu Phe Glu Lys Glu Leu Phe Ser Ala Ala

1 5 10 15

Asn Lys Leu Arg Gly Lys Ile Ala Pro Ser Glu Tyr Lys His Tyr Val

20 25 30

Leu Pro Leu Ile Phe Leu Arg Tyr Leu Ser Leu Lys Tyr Gln Gln Arg

35 40 45

Arg Asn Glu Ile Gln Gln Gln Ile Asn Asp Ser Arg Asp His Lys Lys

50 55 60

Asn Gln Asp Glu Val Leu Lys Ile Leu Glu Asp Arg Thr Glu Tyr Thr

65 70 75 80

Lys Val Asn Val Phe Tyr Ile Pro Glu Lys Ala Ser Trp Glu Tyr Leu

85 90 95

Leu Lys Asn Ser Glu Asn Asp Lys Ile Lys Glu Met Ile Asp Ser Ala

100 105 110

Met Glu Ile Leu Glu Asn Glu Tyr Asp Glu Leu Lys Gly Val Leu Pro

115 120 125

Lys Ile Tyr Lys Asn Ser Asn Ile Pro Asn Glu Val Ile Ser Asp Leu

130 135 140

Leu Lys Leu Phe Ser Gln Glu Val Phe Ser Ala His Asp Gly Arg Asn

145 150 155 160

Val Asp Leu Leu Gly Arg Val Tyr Glu Tyr Phe Ile Ser Asn Phe Ala

165 170 175

Thr Thr Glu Gly Thr Arg Gly Gly Glu Tyr Phe Thr Pro Ser Ser Ile

180 185 190

Val Lys Leu Leu Val Ala Met Leu Glu Pro Ile Lys Gly Thr Val Tyr

195 200 205

Asp Pro Ala Cys Gly Thr Gly Gly Met Phe Ile Gln Ser Asn Lys Tyr

210 215 220

Arg Glu Asn Asn His Asn Leu Cys Phe Val Gly Gln Glu Gln Asn Glu

225 230 235 240

Leu Thr Ile Lys Leu Ala Lys Met Asn Gly Ile Leu His Gly Ile Asn

245 250 255

Pro Glu Ile Arg Gln Gly Asp Ser Leu Leu Asn Asp Arg Tyr Pro Glu

260 265 270

Leu Lys Ala Glu Ile Val Ile Ser Asn Pro Pro Phe Asn Met Lys Asp

275 280 285

Trp Gly Ala Glu Arg Leu Pro Leu Asn Asp Lys Arg Leu Ile Gly Pro

290 295 300

Val Thr Asn Ser Asn Ala Asn Tyr Met Trp Ile Gln His Phe Leu Tyr

305 310 315 320

His Leu Lys Asp Gly Gly Leu Ala Gly Phe Val Ile Ala Asn Gly Ala

325 330 335

Leu Thr Ser Asn Leu Ala Ala Glu Lys Ile Val Arg Lys His Leu Ile

340 345 350

Asp Asn Asp Tyr Val Asp Cys Val Val Gln Leu Pro Glu Lys Met Phe

355 360 365

Phe Gly Thr Gly Ile Pro Ser Ala Leu Val Phe Leu Ser Lys Asn Arg

370 375 380

Asn Gly Ser Asn Gly His Ala Lys Arg Glu Lys Glu Val Leu Phe Ile

385 390 395 400

Asp Ala Ser Asp Lys Gly Thr Leu Val Gly Lys Lys Asn Lys Ile Phe

405 410 415

Leu Asp Asp Glu Ile Lys Glu Ile Ala Asp Leu Tyr His Ser Phe Lys

420 425 430

Phe Leu Asn Asp Asn Asp Tyr Asn His Ser Gly Phe Tyr Lys Lys Val

435 440 445

Asn Ile Glu Lys Ile Val Glu Asn Asp Tyr Lys Leu Thr Pro Thr Leu

450 455 460

Tyr Val Gly Val Lys Glu Glu Thr Glu Met Glu Lys Pro Phe Arg Glu

465 470 475 480

Met Ile Ile Glu Tyr Lys Ala Ile Leu Glu Gln Gln Phe Glu Glu Ser

485 490 495

Asn Lys Leu Gln Gln Lys Ile Leu Lys Asn Leu Glu Gly Leu Leu

500 505 510

<210> 10

<211> 1179

<212> DNA

<213> 嗜热脂肪芽胞杆菌 X1

<220>

<221> misc_feature

<223> S.BstXI的DNA序列

<400> 10

atgaaaagta ctttgaagga atataaattg ggtgatatta ccgaagtcgt taatggtgcc 60

actccttcaa ctaaaaagcc tgagtactat gaaaatggta caattccatg gattactcct 120

aaagatttat caggctatta ctttaaatat atatctcatg gtgaacgtaa tataacagag 180

cttggtctaa gaaatagttc agctaagttg ttaccaaaag gaactgtatt attttcctca 240

agagccccaa taggatacgt agcaatagct gataattggt taactacgaa ccagggattt 300

aaaagtttta tatgtaatga ggagattatt tacaatgaat acctttatta ttttcttatt 360

gctaaaaggg attttattga aacatttgcg aatgggagta cgtttaaaga gctttcatca 420

acttctgcaa agaatatacc aatcaatctt cctagtttag aagagcaaaa gaagattgtg 480

acaattttag gggatttgga tagaaagata gaattaaatt ataaaattat tgaaagctta 540

gaaaaaatag cagaaagaac atataaatat tggtttgtcg atgaattaaa tcaagatgaa 600

cagcacatcc gtaatggatg ggaaactgct aaaattggcg atgtggtgga acttttggga 660

gggggaaccc ctaaaacttc ggaaagtaag tattgggaag atggagatat taattggttt 720

actccttcag atttaacaaa aactagacag ctttttgtac gtgattctca aagaaaaata 780

acaattgatg gacttaataa cagtgcagcg aaattaattc ccccttattc cttgttaatg 840

tcaagtagag ctacaattgg cgagttggca attaatcaag aatctgctac tacaaatcaa 900

gggtttattg tattaatacc aaatgaaaaa atttctattt accaattata cttttgggct 960

aaacttaata agagcaaaat tatttcaatg gcaaatggta gtacttttaa agaaattagt 1020

aagcgggatt ttaaatcttt ggagataata ttaccaaaaa atatagacac ttttaattca 1080

attatgcaag attattttag gaaaattgag gagttaattg atgaaataaa aatcttaaaa 1140

accgcaagag ataatttaat tccaaaactt ataaaatga 1179

<210> 11

<211> 392

<212> PRT

<213> 嗜热脂肪芽胞杆菌 X1

<220>

<221> misc_feature

<223> S.BstXI的蛋白质序列

<400> 11

Met Lys Ser Thr Leu Lys Glu Tyr Lys Leu Gly Asp Ile Thr Glu Val

1 5 10 15

Val Asn Gly Ala Thr Pro Ser Thr Lys Lys Pro Glu Tyr Tyr Glu Asn

20 25 30

Gly Thr Ile Pro Trp Ile Thr Pro Lys Asp Leu Ser Gly Tyr Tyr Phe

35 40 45

Lys Tyr Ile Ser His Gly Glu Arg Asn Ile Thr Glu Leu Gly Leu Arg

50 55 60

Asn Ser Ser Ala Lys Leu Leu Pro Lys Gly Thr Val Leu Phe Ser Ser

65 70 75 80

Arg Ala Pro Ile Gly Tyr Val Ala Ile Ala Asp Asn Trp Leu Thr Thr

85 90 95

Asn Gln Gly Phe Lys Ser Phe Ile Cys Asn Glu Glu Ile Ile Tyr Asn

100 105 110

Glu Tyr Leu Tyr Tyr Phe Leu Ile Ala Lys Arg Asp Phe Ile Glu Thr

115 120 125

Phe Ala Asn Gly Ser Thr Phe Lys Glu Leu Ser Ser Thr Ser Ala Lys

130 135 140

Asn Ile Pro Ile Asn Leu Pro Ser Leu Glu Glu Gln Lys Lys Ile Val

145 150 155 160

Thr Ile Leu Gly Asp Leu Asp Arg Lys Ile Glu Leu Asn Tyr Lys Ile

165 170 175

Ile Glu Ser Leu Glu Lys Ile Ala Glu Arg Thr Tyr Lys Tyr Trp Phe

180 185 190

Val Asp Glu Leu Asn Gln Asp Glu Gln His Ile Arg Asn Gly Trp Glu

195 200 205

Thr Ala Lys Ile Gly Asp Val Val Glu Leu Leu Gly Gly Gly Thr Pro

210 215 220

Lys Thr Ser Glu Ser Lys Tyr Trp Glu Asp Gly Asp Ile Asn Trp Phe

225 230 235 240

Thr Pro Ser Asp Leu Thr Lys Thr Arg Gln Leu Phe Val Arg Asp Ser

245 250 255

Gln Arg Lys Ile Thr Ile Asp Gly Leu Asn Asn Ser Ala Ala Lys Leu

260 265 270

Ile Pro Pro Tyr Ser Leu Leu Met Ser Ser Arg Ala Thr Ile Gly Glu

275 280 285

Leu Ala Ile Asn Gln Glu Ser Ala Thr Thr Asn Gln Gly Phe Ile Val

290 295 300

Leu Ile Pro Asn Glu Lys Ile Ser Ile Tyr Gln Leu Tyr Phe Trp Ala

305 310 315 320

Lys Leu Asn Lys Ser Lys Ile Ile Ser Met Ala Asn Gly Ser Thr Phe

325 330 335

Lys Glu Ile Ser Lys Arg Asp Phe Lys Ser Leu Glu Ile Ile Leu Pro

340 345 350

Lys Asn Ile Asp Thr Phe Asn Ser Ile Met Gln Asp Tyr Phe Arg Lys

355 360 365

Ile Glu Glu Leu Ile Asp Glu Ile Lys Ile Leu Lys Thr Ala Arg Asp

370 375 380

Asn Leu Ile Pro Lys Leu Ile Lys

385 390

<210> 12

<211> 770

<212> DNA

<213> 柠檬色动性球菌(planococcus citreus) SE-F45

<400> 12

atgaaacagt ttgcagatcc ttttgaaaga agattccttg atgcaattga acatcatctt 60

gatggaattt ctgagaaaat aaaaaaagac tttacacaca aaaacttttt aaaagaattg 120

aatggcctta aaggtgataa agtctatcat gacttaggct ttgataccgc tgaatatact 180

ctggtacgtc ttataggaag aatgagcata agcgttggga gaaggctggg ggagatatac 240

gataaagtcc ctcgttatgt tgctgccgcg cgatttggtc ttcaaccaaa tcaaattgca 300

gaagtatttg atggtcttga gttagatata gctttgcgca atagcctttt gtcagatgat 360

gataaaattc acataaaaaa aataactgaa aagatgtcag gcgaaacata ctcgggaatc 420

ggaatcgaaa ttcgttataa ctttaatcca aatgacagtt cccgtttaag aaaagacgtc 480

gatgtagctt ctaaattgtc ggccgcgggg ttatttcctg tttatttaat atttagctct 540

ctcagtccta ggaatgatgc aatagcccgt cttaaaagag ggggatggag ctttaaacag 600

gggcaggaag ccttagactt ccttaccgaa cttttaggag tggatattgg gtctgtttta 660

tctgacccaa taatagccgc agaaactagg gagaaaacat caaaaattat gaagtctata 720

tttgaatcag aggcattcca atctgttata ccgggagagt ggagtaaact 770

<210> 13

<211> 257

<212> PRT

<213> 柠檬色动性球菌 SE-F45

<400> 13

Met Lys Gln Phe Ala Asp Pro Phe Glu Arg Arg Phe Leu Asp Ala Ile

1 5 10 15

Glu His His Leu Asp Gly Ile Ser Glu Lys Ile Lys Lys Asp Phe Thr

20 25 30

His Lys Asn Phe Leu Lys Glu Leu Asn Gly Leu Lys Gly Asp Lys Val

35 40 45

Tyr His Asp Leu Gly Phe Asp Thr Ala Glu Tyr Thr Leu Val Arg Leu

50 55 60

Ile Gly Arg Met Ser Ile Ser Val Gly Arg Arg Leu Gly Glu Ile Tyr

65 70 75 80

Asp Lys Val Pro Arg Tyr Val Ala Ala Ala Arg Phe Gly Leu Gln Pro

85 90 95

Asn Gln Ile Ala Glu Val Phe Asp Gly Leu Glu Leu Asp Ile Ala Leu

100 105 110

Arg Asn Ser Leu Leu Ser Asp Asp Asp Lys Ile His Ile Lys Lys Ile

115 120 125

Thr Glu Lys Met Ser Gly Glu Thr Tyr Ser Gly Ile Gly Ile Glu Ile

130 135 140

Arg Tyr Asn Phe Asn Pro Asn Asp Ser Ser Arg Leu Arg Lys Asp Val

145 150 155 160

Asp Val Ala Ser Lys Leu Ser Ala Ala Gly Leu Phe Pro Val Tyr Leu

165 170 175

Ile Phe Ser Ser Leu Ser Pro Arg Asn Asp Ala Ile Ala Arg Leu Lys

180 185 190

Arg Gly Gly Trp Ser Phe Lys Gln Gly Gln Glu Ala Leu Asp Phe Leu

195 200 205

Thr Glu Leu Leu Gly Val Asp Ile Gly Ser Val Leu Ser Asp Pro Ile

210 215 220

Ile Ala Ala Glu Thr Arg Glu Lys Thr Ser Lys Ile Met Lys Ser Ile

225 230 235 240

Phe Glu Ser Glu Ala Phe Gln Ser Val Ile Pro Gly Glu Trp Ser Lys

245 250 255

Leu

<210> 14

<211> 1347

<212> DNA

<213> 柠檬色动性球菌 SE-F45

<220>

<221> misc_feature

<223> M.PciI的DNA序列

<400> 14

atgacaaatt tttcgcactc agctctaacg agctacgatc ttctcgggca tgaaattgtc 60

caagattctg aagctgttag ctcgggtcca tatctggtca gctatgaccc gatccctgta 120

cgtcggtcta cattcctagc tggactgtca gagaacgttc actcgtggtt tcgtctcaca 180

ccaagtttcg gaccggatct agttcgaaca atcatcaaac agatgaatct tgcgccgcac 240

tcacacatcc atgacccttt ctcaggagcc gggactaccg cgattgaggc ttcgttagag 300

ggctatgaag caagctgcgt agaagttaat ccgtttctct acttcgtggg gaaaacatcc 360

atagattggt ctatcaatgc tgatgatgct gcagcgcagc tagaaagcat taaaaataaa 420

tattatagca tgtctgcaac cgctactttg gataacatag ccgacctagg aatagatata 480

ccaaaaatac acaatattca tcggtggtgg agaaacgatg ttcttaaaga tatattagtc 540

ctaaaatctt ctatcagatc ttgcacacaa gataagtatt gttccttttt tgagctagcc 600

ctagctgcag ttctcgttcc agatttgaca aatgtaacgc taggaaaact acaactgcac 660

tttgtaaaca aagacgataa agagataaac gtctggccta catatgaatc tcatgcaaaa 720

aaaatgattc acgacttgtc attaattaat aagcaaaatt tcgaattttt gcccaagatt 780

atttatggtg attcaactca aaaatcaaca tttagcgagg tggcagggat agatgctata 840

ataacatccc ctccgtaccc taataggtac agctatattt ggaatactcg ccctcacctg 900

tacattcttg atatgatttc cgaagcaaaa gaggcttcgc aaatagatcg tagaacgatt 960

ggtggaacat gggggacagc aacttccgaa ttaggaaagg gtatattttc tccaatcaat 1020

gctgtagtca aagacgcgct tgaaggggtt cacgaaagaa tcgccggttc cgatcaactc 1080

atggcaaact atgtaactca ttattttaat cggctctttt tacatataga agctataaaa 1140

ccatcactta atccaaaagc aaagcttgct tatgttgttg ggaactcttg gattaagggc 1200

gaatatgtag ccactgacgt aatcttagca aaaattatcg aaggggcttt gccaggctca 1260

tcaattgatg gtcttcatcg tttccgtcgc cggaacagtg gaaagaatct ctttgaaact 1320

atagtttact ccactctccc ggtataa 1347

<210> 15

<211> 448

<212> PRT

<213> 柠檬色动性球菌 SE-F45

<220>

<221> misc_feature

<223> M.PciI的蛋白质序列

<400> 15

Met Thr Asn Phe Ser His Ser Ala Leu Thr Ser Tyr Asp Leu Leu Gly

1 5 10 15

His Glu Ile Val Gln Asp Ser Glu Ala Val Ser Ser Gly Pro Tyr Leu

20 25 30

Val Ser Tyr Asp Pro Ile Pro Val Arg Arg Ser Thr Phe Leu Ala Gly

35 40 45

Leu Ser Glu Asn Val His Ser Trp Phe Arg Leu Thr Pro Ser Phe Gly

50 55 60

Pro Asp Leu Val Arg Thr Ile Ile Lys Gln Met Asn Leu Ala Pro His

65 70 75 80

Ser His Ile His Asp Pro Phe Ser Gly Ala Gly Thr Thr Ala Ile Glu

85 90 95

Ala Ser Leu Glu Gly Tyr Glu Ala Ser Cys Val Glu Val Asn Pro Phe

100 105 110

Leu Tyr Phe Val Gly Lys Thr Ser Ile Asp Trp Ser Ile Asn Ala Asp

115 120 125

Asp Ala Ala Ala Gln Leu Glu Ser Ile Lys Asn Lys Tyr Tyr Ser Met

130 135 140

Ser Ala Thr Ala Thr Leu Asp Asn Ile Ala Asp Leu Gly Ile Asp Ile

145 150 155 160

Pro Lys Ile His Asn Ile His Arg Trp Trp Arg Asn Asp Val Leu Lys

165 170 175

Asp Ile Leu Val Leu Lys Ser Ser Ile Arg Ser Cys Thr Gln Asp Lys

180 185 190

Tyr Cys Ser Phe Phe Glu Leu Ala Leu Ala Ala Val Leu Val Pro Asp

195 200 205

Leu Thr Asn Val Thr Leu Gly Lys Leu Gln Leu His Phe Val Asn Lys

210 215 220

Asp Asp Lys Glu Ile Asn Val Trp Pro Thr Tyr Glu Ser His Ala Lys

225 230 235 240

Lys Met Ile His Asp Leu Ser Leu Ile Asn Lys Gln Asn Phe Glu Phe

245 250 255

Leu Pro Lys Ile Ile Tyr Gly Asp Ser Thr Gln Lys Ser Thr Phe Ser

260 265 270

Glu Val Ala Gly Ile Asp Ala Ile Ile Thr Ser Pro Pro Tyr Pro Asn

275 280 285

Arg Tyr Ser Tyr Ile Trp Asn Thr Arg Pro His Leu Tyr Ile Leu Asp

290 295 300

Met Ile Ser Glu Ala Lys Glu Ala Ser Gln Ile Asp Arg Arg Thr Ile

305 310 315 320

Gly Gly Thr Trp Gly Thr Ala Thr Ser Glu Leu Gly Lys Gly Ile Phe

325 330 335

Ser Pro Ile Asn Ala Val Val Lys Asp Ala Leu Glu Gly Val His Glu

340 345 350

Arg Ile Ala Gly Ser Asp Gln Leu Met Ala Asn Tyr Val Thr His Tyr

355 360 365

Phe Asn Arg Leu Phe Leu His Ile Glu Ala Ile Lys Pro Ser Leu Asn

370 375 380

Pro Lys Ala Lys Leu Ala Tyr Val Val Gly Asn Ser Trp Ile Lys Gly

385 390 395 400

Glu Tyr Val Ala Thr Asp Val Ile Leu Ala Lys Ile Ile Glu Gly Ala

405 410 415

Leu Pro Gly Ser Ser Ile Asp Gly Leu His Arg Phe Arg Arg Arg Asn

420 425 430

Ser Gly Lys Asn Leu Phe Glu Thr Ile Val Tyr Ser Thr Leu Pro Val

435 440 445

<210> 16

<211> 430

<212> PRT

<213> 球形芽胞杆菌(Bacillus sphaericus)

<400> 16

Met Arg Arg Leu Ala Lys Asn Ser Arg Asn Asp Ser Tyr Leu Ser Asn

1 5 10 15

Arg Asp Tyr Gln Glu Ile Val Arg Glu Asn Thr Thr Thr Ile Ser Phe

20 25 30

Pro Leu Lys Glu Lys His Thr Leu Thr Leu Thr Lys Lys Ile Gly Leu

35 40 45

Asn Gln Thr Ala Gly Phe Gly Gly Trp Phe Phe Pro Asp Ser Pro Cys

50 55 60

Leu Leu Thr Val Thr Val Leu Ser Ser Phe Gly Thr Lys Val Thr Ser

65 70 75 80

Lys Thr Phe Ser Leu Ser Lys Asp Trp Asn Arg Val Gly Leu Ala Trp

85 90 95

Ile Asn Glu His Ser Ser Asp Thr Met Ser Ile Val Leu Glu Phe Ser

100 105 110

Asp Val Glu Ile Val His Thr Trp Gly Leu Thr Cys Asp Val Phe Asn

115 120 125

Val His Glu Leu Ile Ile Asp Ala Ile Glu Asp Gln Asn Lys Leu Ile

130 135 140

Asp Val Leu Asn Gln Glu His Leu Ser Pro Glu Thr Tyr Tyr Leu Asn

145 150 155 160

His Asp Ser Asp Thr Asp Leu Ile Glu Asn Leu Glu Ser Thr Glu Glu

165 170 175

Ile Lys Ile Val Asn Gln Ser Gln Lys Gln Ile Ser Leu Lys Lys Cys

180 185 190

Cys Tyr Cys Gln Arg Tyr Met Pro Val Asn Ile Leu Val Arg Ser Asn

195 200 205

Ser Ser Phe His Lys His Lys Ser Lys Lys Thr Gly Phe Gln Asn Glu

210 215 220

Cys Arg Ala Cys Lys Lys Trp Arg Ile Asn Asn Ser Phe Asn Pro Val

225 230 235 240

Arg Thr Lys Asp Gln Leu His Glu Ser Ala Val Ile Thr Arg Glu Lys

245 250 255

Lys Ile Leu Leu Lys Glu Pro Glu Ile Leu Gln Lys Ile Lys Asn Arg

260 265 270

Asn Asn Gly Glu Gly Leu Lys Ser Ile Ile Trp Lys Lys Phe Asp Lys

275 280 285

Lys Cys Phe Asn Cys Glu Lys Glu Leu Thr Ile Glu Glu Val Arg Leu

290 295 300

Asp His Thr Arg Pro Leu Ala Tyr Leu Trp Pro Ile Asp Glu His Ala

305 310 315 320

Thr Cys Leu Cys Glu Lys Cys Asn Asn Thr Lys His Asp Met Phe Pro

325 330 335

Ile Asp Phe Tyr Gln Gly Asp Glu Asp Lys Leu Arg Arg Leu Ala Arg

340 345 350

Ile Thr Gly Leu Asp Tyr Glu Ser Leu Val Lys Arg Asp Val Asn Glu

355 360 365

Val Glu Leu Ala Arg Ile Ile Asn Asn Ile Glu Asp Phe Ala Thr Asn

370 375 380

Val Glu Ala Arg Thr Phe Arg Ser Ile Arg Asn Lys Val Lys Glu Val

385 390 395 400

Arg Pro Asp Thr Asp Leu Phe Glu Ile Leu Lys Ser Lys Asn Ile Asn

405 410 415

Leu Tyr Asn Glu Leu Gln Tyr Glu Leu Leu Thr Arg Lys Asp

420 425 430

<210> 17

<211> 1245

<212> DNA

<213> 产气肠杆菌(Enterobacter aerogenes)

<400> 17

gtgaatcaga aaaatgaaaa atcatttatg cgtttgcaat caacctttag cggtggcaaa 60

ggtagtccaa tgcatgattg gtacccatat ttagagggtt attctcccga atttgtgaaa 120

tgcttgattt cacgatttgc tcctaaagcc aaaacaattt tagatccatt ttgtggctct 180

ggaacaacag ccattgtttc cgttttagag ggtttaaata attactattg cgaagtaaac 240

cctttatgcc aatatattat tgaaactaaa ctaatagctt taacattaag cgaagaagaa 300

aaaacaaaat tagtaaatga actttattct atttctaatg aaataactaa tgtactcaaa 360

ccttctgcaa ccgagacaga tctagagaaa tcatttaaat ccgtttttgg taatacgaaa 420

ttttttgagg atcacatatt taaagatata cttagttatc aatgttacat tagctctatc 480

gaagatgaaa atcttaagag acttctgaca atagcaggga ttagatcgtt aatcccttcc 540

tcgttattgg taagacgagg tgatttacga ttcaagacac aaaaagaatt agagaaaggc 600

aaccagggct ttcgctttca tgtacaaaaa agcttagaat taattgccag tgatttatta 660

gacattacgg aaggtagtgg tttagctacc ttcttatgtg atgatgccaa agaaatatct 720

gggaataacc tgattgatgc tgtaataaca agcccgccat atttaaatgg cacaaattat 780

tttagaaata ctaaaattga actttggttt atagggaaat taaagaccaa atcagatcta 840

agacattata gggatttagc tattaccagt ggtattaacg atgtaactaa aggtaaaagc 900

ttatcttcaa ataatactat tatctcagaa ataccattat tatctgaatg tattaaagaa 960

ctaagcataa aagagtatga tagtcgtatt tcaatgatgg ttgaaaacta cttttgggac 1020

atgttcaaat tcttatcaaa actcccaaaa ttactaacta atgatgcgac tatctgtata 1080

gatttaggtg attctgttta ttgtaacgtc tacatcccta cacaagatat tttgaaagaa 1140

atgatgtcaa agttaggttt tgaagagaac gaaagggtca ttcttcgtga acgaaaatcc 1200

cgcaatggaa caaagttagt ccagactgtt caggttttta aatga 1245

<210> 18

<211> 1140

<212> DNA

<213> 产气肠杆菌

<400> 18

atgaaaaata aatattttag taaaaaatgg gagcaattca agaaagaatt accccatcaa 60

tcaggtgaaa tggtaaagag aaattggggc cataactggc actctatgtg ttcataccaa 120

gggaaactta aaccatcaat agctagatct ttaattgata cattcatgcc atcaagtaag 180

ggacgtatat tagatgtctt ctcaggtgtt ggcaccattc ctttcgaagc aagattactt 240

ggtcatactg catatggatt tgatattagt ccagcagcag ttaatatttc acgcgcaaaa 300

ctagaagtta taagtaaaaa tgaaatccaa gaggtaatta ataaattatc tgattttatt 360

gagcaaaaca aaaattcaat agattataac gaacataatt taataaggtt taatggttca 420

attgaatcct attttcatcc tgaaactttt aaggaaatac tgtgtgctcg taaattcttt 480

ttaataaaag gtgaattaaa tgcatctgaa tcgttagtac agtcatgttt attacatatt 540

ttacatggta atcgtccgta tgcattgagt agaaagtccc atcctattac acctttcgcg 600

cctactggag attttatata cagtaattta gttataaagt taatcaaaaa agttgaaaga 660

gtcttgcaaa attctgatgg tatcccagat actggcagca aagtatttta tcaggactct 720

acaaaaagtt ggcctgaaga agtaaataat ttagatgcaa ttataacatc acctccattt 780

tatgatagta cccgtttcta ttcagcaaat tggatgcgat tatggttttc tggttgggaa 840

aaagatgact tccaaacgaa gccaaaagat tttgtggacg aaactcagaa aaaaagcttt 900

gaaatatatg ataatatatt caaacaatct caacaatgct taaaaaaaga tggcgttttt 960

ttaatgcacg ttggcaaaag taaaaaaagt gatatggcag gacaaattgc taaaattggt 1020

agtaattatc ttagccttat agatatattt gacgaaagtg ttgaacattg cgaaagtcac 1080

ggaattaaag acaaaggcac gacaacccat catcagtacc ttgtctttac gaaagattag 1140

<210> 19

<211> 213

<212> PRT

<213> 解淀粉芽胞杆菌(Bacillus amyloliquefaciens)H

<400> 19

Met Glu Val Glu Lys Glu Phe Ile Thr Asp Glu Ala Lys Glu Leu Leu

1 5 10 15

Ser Lys Asp Lys Leu Ile Gln Gln Ala Tyr Asn Glu Val Lys Thr Ser

20 25 30

Ile Cys Ser Pro Ile Trp Pro Ala Thr Ser Lys Thr Phe Thr Ile Asn

35 40 45

Asn Thr Glu Lys Asn Cys Asn Gly Val Val Pro Ile Lys Glu Leu Cys

50 55 60

Tyr Thr Leu Leu Glu Asp Thr Tyr Asn Trp Tyr Arg Glu Lys Pro Leu

65 70 75 80

Asp Ile Leu Lys Leu Glu Lys Lys Lys Gly Gly Pro Ile Asp Val Tyr

85 90 95

Lys Glu Phe Ile Glu Asn Ser Glu Leu Lys Arg Val Gly Met Glu Phe

100 105 110

Glu Thr Gly Asn Ile Ser Ser Ala His Arg Ser Met Asn Lys Leu Leu

115 120 125

Leu Gly Leu Lys His Gly Glu Ile Asp Leu Ala Ile Ile Leu Met Pro

130 135 140

Ile Lys Gln Leu Ala Tyr Tyr Leu Thr Asp Arg Val Thr Asn Phe Glu

145 150 155 160

Glu Leu Glu Pro Tyr Phe Glu Leu Thr Glu Gly Gln Pro Phe Ile Phe

165 170 175

Ile Gly Phe Asn Ala Glu Ala Tyr Asn Ser Asn Val Pro Leu Ile Pro

180 185 190

Lys Gly Ser Asp Gly Met Ser Lys Arg Ser Ile Lys Lys Trp Lys Asp

195 200 205

Lys Val Glu Asn Lys

210

<210> 20

<211> 194

<212> PRT

<213> 克氏海洋螺菌(Oceanospirillum kriegii)

<400> 20

Met Lys Ile Lys Arg Ile Glu Val Leu Ile Asn Asn Gly Ser Val Pro

1 5 10 15

Gly Ile Pro Met Ile Leu Asn Glu Ile Gln Asp Ala Ile Lys Thr Val

20 25 30

Ser Trp Pro Glu Gly Asn Asn Ser Phe Val Ile Asn Pro Val Arg Lys

35 40 45

Gly Asn Gly Val Lys Pro Ile Lys Asn Ser Cys Met Arg His Leu His

50 55 60

Gln Lys Gly Trp Ala Leu Glu His Pro Val Arg Ile Lys Ala Glu Met

65 70 75 80

Arg Pro Gly Pro Leu Asp Ala Val Lys Met Ile Gly Gly Lys Ala Phe

85 90 95

Ala Leu Glu Trp Glu Thr Gly Asn Ile Ser Ser Ser His Arg Ala Ile

100 105 110

Asn Lys Met Val Met Gly Met Leu Glu Arg Val Ile Ile Gly Gly Val

115 120 125

Leu Ile Leu Pro Ser Arg Asp Met Tyr Asn Tyr Leu Thr Asp Arg Val

130 135 140

Gly Asn Phe Arg Glu Leu Glu Pro Tyr Phe Ser Val Trp Arg Gln Phe

145 150 155 160

Asn Leu Lys Asp Ala Tyr Leu Ala Ile Val Glu Ile Glu His Asp Ser

165 170 175

Val Asp Ala Gln Val Ser Leu Ile Pro Lys Gly Thr Asp Gly Arg Ala

180 185 190

Ile Arg

<210> 21

<211> 180

<212> PRT

<213> 解淀粉芽胞杆菌H

<220>

<221> MISC_FEATURE

<222> (1)..(180)

<223> 残基1-180相应于BamHI (seq id no. 19)的蛋白质序列的残基22-201

<400> 21

Ile Gln Gln Ala Tyr Asn Glu Val Lys Thr Ser Ile Cys Ser Pro Ile

1 5 10 15

Trp Pro Ala Thr Ser Lys Thr Phe Thr Ile Asn Asn Thr Glu Lys Asn

20 25 30

Cys Asn Gly Val Val Pro Ile Lys Glu Leu Cys Tyr Thr Leu Leu Glu

35 40 45

Asp Thr Tyr Asn Trp Tyr Arg Glu Lys Pro Leu Asp Ile Leu Lys Leu

50 55 60

Glu Lys Lys Lys Gly Gly Pro Ile Asp Val Tyr Lys Glu Phe Ile Glu

65 70 75 80

Asn Ser Glu Leu Lys Arg Val Gly Met Glu Phe Glu Thr Gly Asn Ile

85 90 95

Ser Ser Ala His Arg Ser Met Asn Lys Leu Leu Leu Gly Leu Lys His

100 105 110

Gly Glu Ile Asp Leu Ala Ile Ile Leu Met Pro Ile Lys Gln Leu Ala

115 120 125

Tyr Tyr Leu Thr Asp Arg Val Thr Asn Phe Glu Glu Leu Glu Pro Tyr

130 135 140

Phe Glu Leu Thr Glu Gly Gln Pro Phe Ile Phe Ile Gly Phe Asn Ala

145 150 155 160

Glu Ala Tyr Asn Ser Asn Val Pro Leu Ile Pro Lys Gly Ser Asp Gly

165 170 175

Met Ser Lys Arg

180

<210> 22

<211> 177

<212> PRT

<213> 克氏海洋螺菌

<220>

<221> MISC_FEATURE

<222> (1)..(177)

<223> 残基1-177相应于OkrAI (seq id no. 20)的蛋白质序列的残基18-194

<400> 22

Ile Pro Met Ile Leu Asn Glu Ile Gln Asp Ala Ile Lys Thr Val Ser

1 5 10 15

Trp Pro Glu Gly Asn Asn Ser Phe Val Ile Asn Pro Val Arg Lys Gly

20 25 30

Asn Gly Val Lys Pro Ile Lys Asn Ser Cys Met Arg His Leu His Gln

35 40 45

Lys Gly Trp Ala Leu Glu His Pro Val Arg Ile Lys Ala Glu Met Arg

50 55 60

Pro Gly Pro Leu Asp Ala Val Lys Met Ile Gly Gly Lys Ala Phe Ala

65 70 75 80

Leu Glu Trp Glu Thr Gly Asn Ile Ser Ser Ser His Arg Ala Ile Asn

85 90 95

Lys Met Val Met Gly Met Leu Glu Arg Val Ile Ile Gly Gly Val Leu

100 105 110

Ile Leu Pro Ser Arg Asp Met Tyr Asn Tyr Leu Thr Asp Arg Val Gly

115 120 125

Asn Phe Arg Glu Leu Glu Pro Tyr Phe Ser Val Trp Arg Gln Phe Asn

130 135 140

Leu Lys Asp Ala Tyr Leu Ala Ile Val Glu Ile Glu His Asp Ser Val

145 150 155 160

Asp Ala Gln Val Ser Leu Ile Pro Lys Gly Thr Asp Gly Arg Ala Ile

165 170 175

Arg

<210> 23

<211> 38

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 23

attcaacaag catacaatgc agttaaaaca tctattgt 38

<210> 24

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 24

acaaatagat gttttaactg cattgtatgc ttgttgaat 39

<210> 25

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 25

caagcataca atgaagttgc aacatctatt tgttcacct 39

<210> 26

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 26

aggtgaacaa atagatgttg caacttcatt gtatgcttg 39

<210> 27

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 27

acgattaaca acaccgaagc aaattgtaac ggtgtagta 39

<210> 28

<211> 40

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 28

acgattaaca acaccgaagc aaattgtaac ggtgtagtat 40

<210> 29

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 29

aacggtgtag taccaattgc agaactatgt tacacctta 39

<210> 30

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 30

taaggtgtaa catagttctg caattggtac tacaccgtt 39

<210> 31

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 31

aacccccttg atatacttgc acttgaaaag aaaaaaggt 39

<210> 32

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 32

accttttttc ttttcaagtg caagtatatc aaggggttt 39

<210> 33

<211> 36

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 33

gatatactta aacttgcaaa gaaaaaaggt ggtccg 36

<210> 34

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 34

cggaccacct tttttctttg caagtttaag tatatcaag 39

<210> 35

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 35

atacttaaac ttgaaaaggc aaaaggtggt ccgattgat 39

<210> 36

<211> 40

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 36

atcaatcgga ccaccttttg cctttttcaa gtttaagtat 40

<210> 37

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 37

ggtccgattg atgtttatgc agagttcata gaaaacagt 39

<210> 38

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 38

actgttttct atgaactctg cataaacatc aatcggacc 39

<210> 39

<211> 37

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 39

atagaaaaac agtgaacttg cacgtgtagg tatggaa 37

<210> 40

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 40

aaattccata cctacacgtg caagttcact gttttctat 39

<210> 41

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 41

ggaaatatta gttctgccgc acgttcaatg aacaaactt 39

<210> 42

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 42

aagtttgttc attgaaacgt gcggcagaac taatattcc 39

<210> 43

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 43

aatattagtt ctgcccacgc atcaatgaac aaacttcta 39

<210> 44

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 44

tagaagtttg ttcattgatg cgtgggcaga actaatatt 39

<210> 45

<211> 42

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 45

gcccaccgtt caatgaacgc acttctatta ggattaaaac at 42

<210> 46

<211> 42

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 46

atgttttaat cctaatagaa gtgcggtcat tgaacggtgg gc 42

<210> 47

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 47

attatcctta tgcctattgc acaattggcc tattatctt 39

<210> 48

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 48

aagataatag gccaattgtg caataggcat aaggataat 39

<210> 49

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 49

ttggcctatt atcttacagc acgtgttacc aatttcgag 39

<210> 50

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 50

ctcgaaattg gtaacacgtg ctgtaagata ataggccaa 39

<210> 51

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 51

gcctattatc ttacagatgc agttaccaat ttcgaggaa 39

<210> 52

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 52

ttcctcgaaa ttggtaactg catctgtaag ataataggc 39

<210> 53

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 53

cgtgttacca atttcgaggc attagaacct tattttgaa 39

<210> 54

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 54

ttcaaaataa ggttctaatg cctcgaaatt ggtaacacg 39

<210> 55

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 55

accaatttcg aggaattagc accttatttt gaacttact 39

<210> 56

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 56

agtaagttca aaataaggtg ctaattcctc gaaattggt 39

<210> 57

<211> 42

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 57

ccttattttg aacttactgc aggacaacca tttattttta tt 42

<210> 58

<211> 42

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 58

aataaaaata aatggttgtg ctgcagtaag ttcaaaataa gg 42

<210> 59

<211> 45

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 59

tttattttta ttggatttaa tgctgcagct tataattcta atgtc 45

<210> 60

<211> 45

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 60

gacattagaa ttataagctg cagcattaaa tccaataaaa ataaa 45

<210> 61

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 61

aatgtccctt taattcccgc aggttctgac ggtatgtca 39

<210> 62

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 62

tgacataccg tcagaacctg cgggaattaa agggacatt 39

<210> 63

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 63

ttaattccca aaggttctgc aggtatgtca aaacgctca 39

<210> 64

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 64

tgagcgtttt gacatacctg cagaaccttt gggaattaa 39

<210> 65

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 65

tctgacggta tgtcaaaagc atcaattaag aaatggaaa 39

<210> 66

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 66

tttccatttc ttaattgatg cttttgacat accgtcaga 39

<210> 67

<211> 54

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 67

ggtggtgcat gcggaggtaa ataaatggaa gtagaaaaag agtttattac tgat 54

<210> 68

<211> 51

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 68

ggtggtggta ccctatttgt tttcaacttt atctttccat ttcttaattg a 51

<210> 69

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<220>

<221> misc_feature

<222> (19)..(21)

<223> n=a, c, g或t

<400> 69

caagcataca atgaagttnn nacatctatt tgttcacct 39

<210> 70

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<220>

<221> misc_feature

<222> (19)..(21)

<223> n=a. c. g或 t

<400> 70

aggtgaacaa atagatgtnn naacttcatt gtatgcttg 39

<210> 71

<211> 37

<212> DNA

<213> 人工

<220>

<223> 引物

<220>

<221> misc_feature

<222> (16)..(18)

<220>

<221> misc_feature

<222> (16)..(18)

<223> n=a, c, g或t

<400> 71

gatatactta aacttnnnaa gaaaaaaagg tggtccg 37

<210> 72

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<220>

<221> misc_feature

<222> (19)..(21)

<220>

<221> misc_feature

<222> (19)..(21)

<223> n=a, c, g或t

<400> 72

cggaccacct tttttcttnn naagtttaag tatatcaag 39

<210> 73

<211> 54

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 73

ggtggtgcat gcggaggtaa ataaatgtct aataaaaaac agtcaaatag gcta 54

<210> 74

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 74

ggtggtggta cctcacttag atctaagctg ttcaaacaa 39

<210> 75

<211> 267

<212> PRT

<213> 大肠杆菌(Escherichia coli) RY13

<220>

<221> MISC_FEATURE

<222> (1)..(267)

<223> 氨基酸残基1-267相应于EcoRI的蛋白质序列的残基4-270

<400> 75

Lys Lys Gln Ser Asn Arg Leu Thr Glu Gln His Lys Leu Ser Gln Gly

1 5 10 15

Val Ile Gly Ile Phe Gly Asp Tyr Ala Lys Ala His Asp Leu Ala Val

20 25 30

Gly Glu Val Ser Lys Leu Val Lys Lys Ala Leu Ser Asn Glu Tyr Pro

35 40 45

Gln Leu Ser Phe Arg Tyr Arg Asp Ser Ile Lys Lys Thr Glu Ile Asn

50 55 60

Glu Ala Leu Lys Lys Ile Asp Pro Asp Leu Gly Gly Thr Leu Phe Val

65 70 75 80

Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly Ile Val Glu Val Lys Asp

85 90 95

Asp Tyr Gly Glu Trp Arg Val Val Leu Val Ala Glu Ala Lys His Gln

100 105 110

Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Val Gly Lys Arg

115 120 125

Gly Asp Gln Asp Leu Met Ala Ala Gly Asn Ala Ile Glu Arg Ser His

130 135 140

Lys Asn Ile Ser Glu Ile Ala Asn Phe Met Leu Ser Glu Ser His Phe

145 150 155 160

Pro Tyr Val Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr Glu Asn Ile

165 170 175

Ser Ile Thr Arg Pro Asp Gly Arg Val Val Asn Leu Glu Tyr Asn Ser

180 185 190

Gly Ile Leu Asn Arg Leu Asp Arg Leu Thr Ala Ala Asn Tyr Gly Met

195 200 205

Pro Ile Asn Ser Asn Leu Cys Ile Asn Lys Phe Val Asn His Lys Asp

210 215 220

Lys Ser Ile Met Leu Gln Ala Ala Ser Ile Tyr Thr Gln Gly Asp Gly

225 230 235 240

Arg Glu Trp Asp Ser Lys Ile Met Phe Glu Ile Met Phe Asp Ile Ser

245 250 255

Thr Thr Ser Leu Arg Val Leu Gly Arg Asp Leu

260 265

<210> 76

<211> 265

<212> PRT

<213> 类球红细菌(Rhodopseudomonas sphaeroides)

<220>

<221> MISC_FEATURE

<222> (1)..(265)

<223> 氨基酸残基1-265相应于RsrI的蛋白质序列的残基10-274

<400> 76

Lys Gly Gln Ala Leu Arg Leu Gly Ile Gln Gln Glu Leu Gly Gly Gly

1 5 10 15

Pro Leu Ser Ile Phe Gly Ala Ala Ala Gln Lys His Asp Leu Ser Ile

20 25 30

Arg Glu Val Thr Ala Gly Val Leu Thr Lys Leu Ala Glu Asp Phe Pro

35 40 45

Asn Leu Glu Phe Gln Leu Arg Thr Ser Leu Thr Lys Lys Ala Ile Asn

50 55 60

Glu Lys Leu Arg Ser Phe Asp Pro Arg Leu Gly Gln Ala Leu Phe Val

65 70 75 80

Glu Ser Ala Ser Ile Arg Pro Asp Gly Gly Ile Thr Glu Val Lys Asp

85 90 95

Arg His Gly Asn Trp Arg Val Ile Leu Val Gly Glu Ser Lys His Gln

100 105 110

Gly Asn Asp Val Glu Lys Ile Leu Ala Gly Val Leu Gln Gly Lys Ala

115 120 125

Lys Asp Gln Asp Phe Met Ala Ala Gly Asn Ala Ile Glu Arg Met His

130 135 140

Lys Asn Val Leu Glu Leu Arg Asn Tyr Met Leu Asp Glu Lys His Phe

145 150 155 160

Pro Tyr Val Val Phe Leu Gln Gly Ser Asn Phe Ala Thr Glu Ser Phe

165 170 175

Glu Val Thr Arg Pro Asp Gly Arg Val Val Lys Ile Val His Asp Ser

180 185 190

Gly Met Leu Asn Arg Ile Asp Arg Val Thr Ala Ser Ser Leu Ser Arg

195 200 205

Glu Ile Asn Gln Asn Tyr Cys Glu Asn Ile Val Val Arg Ala Gly Ser

210 215 220

Phe Asp His Met Phe Gln Ile Ala Ser Leu Tyr Cys Lys Ala Ala Pro

225 230 235 240

Trp Thr Ala Gly Glu Met Ala Glu Ala Met Leu Ala Val Ala Lys Thr

245 250 255

Ser Leu Arg Ile Ile Ala Asp Asp Leu

260 265

<210> 77

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 77

gattgggtgg cgcagaaatt tcaaacgggc cagcagtcg 39

<210> 78

<211> 39

<212> DNA

<213> 人工

<220>

<223> 引物

<400> 78

cgactgctgg cccgtttgaa atttctgcgc cacccaatc 39

<210> 79

<211> 272

<212> PRT

<213> 食明胶土壤杆菌(Agrobacterium gelatinovorum)

<400> 79

Met Arg Leu Asp Leu Asp Phe Gly Arg Gly Leu Val Ala His Val Met

1 5 10 15

Leu Asp Asn Val Ser Glu Glu Gln Tyr Gln Gln Ile Ser Asp Tyr Phe

20 25 30

Val Pro Leu Val Asn Lys Pro Lys Leu Lys Ser Arg Asp Ala Ile Gly

35 40 45

Gln Ala Phe Val Met Ala Thr Glu Val Cys Pro Asp Ala Asn Pro Ser

50 55 60

Asp Leu Trp His His Val Leu Tyr Arg Ile Tyr Ile Arg Glu Lys Ile

65 70 75 80

Gly Thr Asp Pro Ser Gln Ser Trp Val Arg Thr Ser Gly Glu Ala Phe

85 90 95

Glu Val Ala Leu Val Glu Arg Tyr Asn Pro Val Leu Ala Arg His Gly

100 105 110

Ile Arg Leu Thr Ala Leu Phe Lys Gly Gln Lys Gly Leu Ala Leu Thr

115 120 125

Arg Met Gly Val Ala Asp Arg Val Gly Ser Arg Lys Val Asp Val Met

130 135 140

Ile Glu Lys Gln Gly Gly Gly Arg Ser Pro Asp Ala Glu Gly Phe Gly

145 150 155 160

Val Val Gly Gly Ile His Ala Lys Val Ser Leu Ala Glu Arg Val Ser

165 170 175

Asp Asp Ile Pro Ala Ser Arg Ile Met Met Gly Glu Gly Leu Leu Ser

180 185 190

Val Leu Ser Thr Leu Asp Val Lys Ser Phe Pro Pro Pro His Gly Asp

195 200 205

Leu Val Asn Arg Gly Glu Leu Gly Thr Pro Asp Arg Pro Ser Asp Lys

210 215 220

Arg Asn Tyr Ile Glu Gly His Gly Asp Phe Ser Ala Cys Phe Ser Tyr

225 230 235 240

Asn Leu Arg Thr Pro Pro Ser Asn Ala Thr Thr Pro Ser Gly Arg His

245 250 255

Ile Tyr Val Ser Ala Ser Leu Val Arg Thr Thr Ser Ser Pro Thr Thr

260 265 270

<210> 80

<211> 358

<212> PRT

<213> 鱼腥藻(Anabaena variabilis)

<400> 80

Met Glu Glu Asp Leu Asp Leu Ser Glu Asn Ile Glu Ala Ala Ser Ala

1 5 10 15

Glu Leu Thr Thr Leu Tyr Gln Val Ala Ala Asp Ala Met Lys Asp Tyr

20 25 30

Ile Glu Ile Tyr Leu Ala Leu Ser Lys Gln Ser Asp Gly Phe Ser Asn

35 40 45

Ile Asn Asn Leu Asp Leu Thr Ser Arg Asn Arg Arg Leu Val Val Ile

50 55 60

His Gly Leu Ser Leu Glu Leu Asp Pro Asp Thr Ser Thr Pro Glu Glu

65 70 75 80

Ile Lys Arg Glu Ala Glu Arg Met Leu Ala Ile Ala Leu Asp Thr Glu

85 90 95

Ser Ala Ile Thr Ala Gly Val Tyr Glu Lys Met Arg Leu Phe Ala Ser

100 105 110

Ser Leu Val Asp Gln Leu Phe Glu Gln Thr Asp Glu Leu Asn Ser Leu

115 120 125

Ser Ser Glu Tyr Leu Ser Ala Asn Pro Gly Phe Leu Pro Phe Phe Gln

130 135 140

Gln Leu Ala Gly Leu Arg Ser Lys Ser Glu Leu Lys Arg Glu Val Gly

145 150 155 160

Asn Ala Ser Asp Asn Ser Ile Ser Lys Ala Val Ala Glu Arg Ile Leu

165 170 175

Glu Arg Ile Ile Arg Asn Leu Arg Ile Arg Thr Phe Ser Lys Glu Lys

180 185 190

Leu Leu Gln Ala Val Glu Pro Thr Leu Glu Gly Ile Val Arg Asp Leu

195 200 205

Val Gly Lys Val Leu Leu Glu Asn Ile Val Ala Asp Ala Leu Ser Asp

210 215 220

Leu Gln Val Pro Phe Met Arg Glu Ser Glu Tyr Gln Ser Leu Lys Gly

225 230 235 240

Val Ile Tyr Asp Phe Arg Ala Asp Phe Val Ile Pro Asp Ala Gln Asn

245 250 255

Pro Ile Ala Phe Ile Glu Val Arg Lys Ser Ser Thr Arg His Ala Ser

260 265 270

Leu Tyr Ala Lys Asp Lys Met Phe Ser Ala Ile Asn Trp Lys Gly Lys

275 280 285

Asn Lys Arg Leu Leu Gly Ile Leu Val Val Glu Gly Pro Trp Thr Arg

290 295 300

Glu Thr Leu Arg Val Met Ala Asn Val Phe Asp Tyr Val Thr Pro Leu

305 310 315 320

Thr Arg Val Ser Gln Val Ala Glu Ala Ile Arg Ala Tyr Leu Asp Gly

325 330 335

Asp Lys Thr Arg Leu Lys Trp Leu Val Asn Phe Ser Ile Glu Glu Ala

340 345 350

Asp His Asp Asn Ile Thr

355

<210> 81

<211> 530

<212> PRT

<213> 嗜热脂肪芽胞杆菌(Bacillus stearothermophilus) B61

<400> 81

Met Ala Lys Tyr Gly Arg Gly Lys Phe Leu Pro His Gln Asn Tyr Ile

1 5 10 15

Asp Tyr Met His Phe Ile Val Asn His Lys Asn Tyr Ser Gly Met Pro

20 25 30

Asn Ala Ile Gly Glu Asp Gly Arg Ile Asn Trp Gln Val Ser Ser Gly

35 40 45

Lys Thr Thr Ser Phe Tyr Glu Tyr Tyr Gln Ala Arg Phe Glu Trp Trp

50 55 60

Glu Lys Lys Ala Asp Glu Leu Asn Leu Pro Gly Thr Gly Asn Ser Asn

65 70 75 80

Lys Arg Phe Ser Leu Ala Ala Arg Leu Ile His Pro Thr Gly Gln Arg

85 90 95

Pro Cys Arg Leu Cys Gly Lys Tyr Gln Tyr Val Gly Tyr Met Tyr Val

100 105 110

Ser His Asn Leu Tyr Lys Arg Trp Ser Lys Ile Thr Gly Arg Glu Asp

115 120 125

Leu Phe Phe Lys Lys Gln Asn Ile Ile Glu Ala Ala Asn Ile Phe Lys

130 135 140

Ser Ile Met Gly Glu Gln Ala Leu Ile Asn Glu Leu Thr Thr Ile Phe

145 150 155 160

Pro Glu Arg Lys Asp Tyr Phe Asn Arg Leu Pro Asn Ile Glu Asp Phe

165 170 175

Phe Val Ser Ser Ser His Ile Lys Asn Asn Gly Asn Tyr Ile Ser Pro

180 185 190

Gly Phe Met Ala Asn Pro Pro Asp Arg Leu Asp Gly Phe His Asp Tyr

195 200 205

Gly Ile Cys Cys Arg Lys Glu Lys Asp Pro Gly Arg His Asp Asp Asn

210 215 220

Met Arg Leu Tyr Asn His Asp Arg Arg Ala Phe Met Trp Trp Ser Glu

225 230 235 240

Gly Asp Trp Ala Leu Ala Asp Ala Leu Tyr Asn Lys Ala Gly Ala Gly

245 250 255

Lys Cys Ala Asp Pro Asp Cys Gln Lys Glu Val Glu Lys Ile Ser Pro

260 265 270

Asp His Val Gly Pro Ile Ser Cys Gly Phe Lys Gln Ile Pro Phe Phe

275 280 285

Lys Pro Leu Cys Ala Ser Cys Asn Ser Ala Lys Asn Arg Arg Phe Ser

290 295 300

Tyr Gln Asp Val Lys Glu Leu Leu Lys Tyr Glu Asn Tyr Thr Gly Asp

305 310 315 320

Ser Val Ala Ser Trp Gln Val Arg Ala Leu Trp Asp Asn Cys Lys His

325 330 335

Leu Val Lys Asn Asp Asp Asp Ser Lys Leu Leu Ser Asn Leu Met Arg

340 345 350

Ser Leu Gln Asp Tyr Tyr Leu Arg Ser Leu Tyr Lys Leu Phe Ser Asn

355 360 365

Gly Phe Ala His Leu Leu Ser Tyr Phe Leu Thr Pro Glu Tyr Ala His

370 375 380

Tyr Lys Ile Thr Phe Glu Gly Leu Asn Thr Ser Thr Leu Glu Tyr Glu

385 390 395 400

Arg Tyr Tyr Lys Thr Phe Lys Lys Thr Lys Ser Thr Ser Ser Leu Ala

405 410 415

Ala Arg Ile Val Arg Ile Ala Phe Glu Glu Leu Glu Ile Tyr Asn Ser

420 425 430

Lys Asp Ile Asn Glu Arg Lys Leu Ile Lys Phe Asp Thr Ser Ser Trp

435 440 445

Glu Lys Asp Phe Glu Asn Ile Ile Ser Tyr Ala Thr Lys Asn Leu Ser

450 455 460

Leu Asp Glu Glu Ala Ser Lys Trp Asn Lys Val Leu Thr Asp Lys Asn

465 470 475 480

Leu Ser Ser Thr Glu Lys Asp Lys Lys Ile Ser Ser Leu Leu Glu Asp

485 490 495

Lys Asn Tyr Glu Val Tyr Lys Lys Gln Phe Tyr Ile Leu Lys Asp Leu

500 505 510

Leu Val Glu His Phe Asn Lys Ile Gly Glu Gln Ile Ala Lys Asp Tyr

515 520 525

Met Lys

530

<210> 82

<211> 301

<212> PRT

<213> 聚团肠杆菌(Enterobacter agglomerans)

<400> 82

Met Lys Lys Arg Arg Asp Leu Val Glu Val Phe Gly Tyr Asn Pro Met

1 5 10 15

Asp Leu Ser Pro Glu Val Arg Ala Leu Trp Asn Leu Gly Ala Cys Pro

20 25 30

Phe Leu Asn Lys Glu Cys Ile Lys Ile Asn His Asp Gln Thr Ile Ile

35 40 45

Tyr Gly Thr Cys Ser Val Thr Ser Pro Tyr Gly Asp Val Ile Ile Cys

50 55 60

Pro Asn Arg Leu Tyr Ala Asn Asp Tyr Glu Thr Leu His Lys Val Ser

65 70 75 80

Arg Asp Ala Phe Gly Asp Asp Val Pro Phe Leu Thr Tyr Ser Asn Phe

85 90 95

Ile Lys Tyr Arg Ala Thr Tyr Lys Asp Cys Ile Val Ala Leu Gly Lys

100 105 110

Asn Ser Gly Lys Glu Val Gln Val Gly Arg Ala Leu Ser Met Asp Trp

115 120 125

Val Leu Val Arg Ile Thr Asp Gly Glu Leu Lys Glu Tyr Val Gly Val

130 135 140

Glu Ile Gln Ser Ile Asp Ile Thr Gly Asn Tyr Arg Asp Ala Trp His

145 150 155 160

Ala Tyr Lys Asn Leu Lys Pro Ile Asp Ile Ile Asp Asn Leu Pro Thr

165 170 175

Ser Gln His Gly Leu Asn Trp Ala Asn Val His Lys Arg Leu Ile Pro

180 185 190

Gln Ile Ile Arg Lys Gly Val Val Tyr Ser Arg Ser Asn Tyr Val Lys

195 200 205

Lys Gly Leu Tyr Phe Ile Leu Pro Glu Ile Val Tyr Asn Lys Phe Glu

210 215 220

Asp Val Ile Gly Ala Asp Ile Pro Leu Leu Lys Thr Gln Thr Asn Lys

225 230 235 240

Ser Ile Thr Val His Thr Tyr Ser Leu Gly Glu Pro Ala Ala Asn Gly

245 250 255

Glu Gln Arg Lys Leu Ile Ser Glu Arg Glu Ile Ile Phe Asp Leu Asp

260 265 270

Glu Phe Ser Lys Arg Phe Thr Thr Gly Pro Asn Leu Pro Lys Gly Asp

275 280 285

Asp Leu Asp Ala Val Ile Lys Lys Ala Leu Gly Met Met

290 295 300

<210> 83

<211> 277

<212> PRT

<213> 大肠杆菌 RY13

<400> 83

Met Ser Asn Lys Lys Gln Ser Asn Arg Leu Thr Glu Gln His Lys Leu

1 5 10 15

Ser Gln Gly Val Ile Gly Ile Phe Gly Asp Tyr Ala Lys Ala His Asp

20 25 30

Leu Ala Val Gly Glu Val Ser Lys Leu Val Lys Lys Ala Leu Ser Asn

35 40 45

Glu Tyr Pro Gln Leu Ser Phe Arg Tyr Arg Asp Ser Ile Lys Lys Thr

50 55 60

Glu Ile Asn Glu Ala Leu Lys Lys Ile Asp Pro Asp Leu Gly Gly Thr

65 70 75 80

Leu Phe Val Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly Ile Val Glu

85 90 95

Val Lys Asp Asp Tyr Gly Glu Trp Arg Val Val Leu Val Ala Glu Ala

100 105 110

Lys His Gln Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Val

115 120 125

Gly Lys Arg Gly Asp Gln Asp Leu Met Ala Ala Gly Asn Ala Ile Glu

130 135 140

Arg Ser His Lys Asn Ile Ser Glu Ile Ala Asn Phe Met Leu Ser Glu

145 150 155 160

Ser His Phe Pro Tyr Val Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr

165 170 175

Glu Asn Ile Ser Ile Thr Arg Pro Asp Gly Arg Val Val Asn Leu Glu

180 185 190

Tyr Asn Ser Gly Ile Leu Asn Arg Leu Asp Arg Leu Thr Ala Ala Asn

195 200 205

Tyr Gly Met Pro Ile Asn Ser Asn Leu Cys Ile Asn Lys Phe Val Asn

210 215 220

His Lys Asp Lys Ser Ile Met Leu Gln Ala Ala Ser Ile Tyr Thr Gln

225 230 235 240

Gly Asp Gly Arg Glu Trp Asp Ser Lys Ile Met Phe Glu Ile Met Phe

245 250 255

Asp Ile Ser Thr Thr Ser Leu Arg Val Leu Gly Arg Asp Leu Phe Glu

260 265 270

Gln Leu Thr Ser Lys

275

<210> 84

<211> 245

<212> PRT

<213> 大肠杆菌 J62 pLG74

<400> 84

Met Ser Leu Arg Ser Asp Leu Ile Asn Ala Leu Tyr Asp Glu Asn Gln

1 5 10 15

Lys Tyr Asp Val Cys Gly Ile Ile Ser Ala Glu Gly Lys Ile Tyr Pro

20 25 30

Leu Gly Ser Asp Thr Lys Val Leu Ser Thr Ile Phe Glu Leu Phe Ser

35 40 45

Arg Pro Ile Ile Asn Lys Ile Ala Glu Lys His Gly Tyr Ile Val Glu

50 55 60

Glu Pro Lys Gln Gln Asn His Tyr Pro Asp Phe Thr Leu Tyr Lys Pro

65 70 75 80

Ser Glu Pro Asn Lys Lys Ile Ala Ile Asp Ile Lys Thr Thr Tyr Thr

85 90 95

Asn Lys Glu Asn Glu Lys Ile Lys Phe Thr Leu Gly Gly Tyr Thr Ser

100 105 110

Phe Ile Arg Asn Asn Thr Lys Asn Ile Val Tyr Pro Phe Asp Gln Tyr

115 120 125

Ile Ala His Trp Ile Ile Gly Tyr Val Tyr Thr Arg Val Ala Thr Arg

130 135 140

Lys Ser Ser Leu Lys Thr Tyr Asn Ile Asn Glu Leu Asn Glu Ile Pro

145 150 155 160

Lys Pro Tyr Lys Gly Val Lys Val Phe Leu Gln Asp Lys Trp Val Ile

165 170 175

Ala Gly Asp Leu Ala Gly Ser Gly Asn Thr Thr Asn Ile Gly Ser Ile

180 185 190

His Ala His Tyr Lys Asp Phe Val Glu Gly Lys Gly Ile Phe Asp Ser

195 200 205

Glu Asp Glu Phe Leu Asp Tyr Trp Arg Asn Tyr Glu Arg Thr Ser Gln

210 215 220

Leu Arg Asn Asp Lys Tyr Asn Asn Ile Ser Glu Tyr Arg Asn Trp Ile

225 230 235 240

Tyr Arg Gly Arg Lys

245

<210> 85

<211> 300

<212> PRT

<213> 流感嗜血杆菌 Rd (外-突变体)(Haemophilus influenzae Rd (exo-mutant))

<400> 85

Met Lys Lys Ser Ala Leu Glu Lys Leu Leu Ser Leu Ile Glu Asn Leu

1 5 10 15

Thr Asn Gln Glu Phe Lys Gln Ala Thr Asn Ser Leu Ile Ser Phe Ile

20 25 30

Tyr Lys Leu Asn Arg Asn Glu Val Ile Glu Leu Val Arg Ser Ile Gly

35 40 45

Ile Leu Pro Glu Ala Ile Lys Pro Ser Ser Thr Gln Glu Lys Leu Phe

50 55 60

Ser Lys Ala Gly Asp Ile Val Leu Ala Lys Ala Phe Gln Leu Leu Asn

65 70 75 80

Leu Asn Ser Lys Pro Leu Glu Gln Arg Gly Asn Ala Gly Asp Val Ile

85 90 95

Ala Leu Ser Lys Glu Phe Asn Tyr Gly Leu Val Ala Asp Ala Lys Ser

100 105 110

Phe Arg Leu Ser Arg Thr Ala Lys Asn Gln Lys Asp Phe Lys Val Lys

115 120 125

Ala Leu Ser Glu Trp Arg Glu Asp Lys Asp Tyr Ala Val Leu Thr Ala

130 135 140

Pro Phe Phe Gln Tyr Pro Thr Thr Lys Ser Gln Ile Phe Lys Gln Ser

145 150 155 160

Leu Asp Glu Asn Val Leu Leu Phe Ser Trp Glu His Leu Ala Ile Leu

165 170 175

Leu Gln Leu Asp Leu Glu Glu Thr Asn Ile Phe Pro Phe Glu Gln Leu

180 185 190

Trp Asn Phe Pro Lys Lys Gln Ser Lys Lys Thr Ser Val Ser Asp Ala

195 200 205

Glu Asn Asn Phe Met Arg Asp Phe Asn Lys Tyr Phe Met Asp Leu Phe

210 215 220

Lys Ile Asp Lys Asp Thr Leu Asn Gln Leu Leu Gln Lys Glu Ile Asn

225 230 235 240

Phe Ile Glu Glu Arg Ser Leu Ile Glu Lys Glu Tyr Trp Lys Lys Gln

245 250 255

Ile Asn Ile Ile Lys Asn Phe Thr Arg Glu Glu Ala Ile Glu Ala Leu

260 265 270

Leu Lys Asp Ile Asn Met Ser Ser Lys Ile Glu Thr Ile Asp Ser Phe

275 280 285

Ile Lys Gly Ile Lys Ser Asn Asp Arg Leu Tyr Leu

290 295 300

<210> 86

<211> 254

<212> PRT

<213> 副流感嗜血杆菌(Haemophilus parainfluenzae)

<400> 86

Met Lys Tyr Glu Glu Ile Asn Phe Lys Val Pro Val Glu Ser Pro Tyr

1 5 10 15

Tyr Pro Asn Tyr Ser Gln Cys Val Ile Glu Arg Ile Tyr Ser Ile Leu

20 25 30

Arg Asn Gln Lys Asp Met Gly Asp Asp Arg Ile Ile Ile Asn Thr Asn

35 40 45

Leu Lys Lys Gly Leu Pro Leu Glu Asn Ile Asn Lys Ile Ala Gly Pro

50 55 60

Met Ile Glu Ala Trp Ala Glu Glu Val Phe Ser Gly Ile Arg Asp Asn

65 70 75 80

Arg Asp Asn Gln Tyr Asn Leu Ile Asn Val Glu Ala Gln Glu Arg Leu

85 90 95

Gly Ile Ser Asp Ile Ile Leu Gln Phe Gln Val Asn Asn Asn Val Ile

100 105 110

Thr Gly Asn Val Asp Val Lys Ala Thr Ser Asn Asp Ile Pro Asp Ser

115 120 125

Gly Lys Ser Pro Asn Ile Thr Ser Phe Ser Arg Ile Arg Thr Ala Tyr

130 135 140

Val Lys Asp Pro Asn Phe Ile Phe Ile Ile Leu Ser Ile Lys His Ser

145 150 155 160

Val Tyr Val Lys Arg Asn Glu Tyr Thr Asn Leu Met Asp Gly Ile Met

165 170 175

Gln Ile Ile Asp Phe Asn Val Tyr Asp Leu Lys Tyr Ile Ser Asp Ser

180 185 190

Asp Ile Ser Tyr Asn Pro Ala Leu Gly Thr Gly Gln Ile Gln Ile Lys

195 200 205

Asp Ile His Tyr Val Ser Ser Gln Lys Arg Thr Thr Trp Gln Met Cys

210 215 220

Gln Leu Leu Asp Leu Lys Tyr Leu Arg Ser Lys Lys Arg Thr Ile Glu

225 230 235 240

Gln Phe Tyr Asn Glu Ala Lys Arg Asn Lys Trp Ile Lys Asp

245 250

<210> 87

<211> 218

<212> PRT

<213> 克雷白氏肺炎菌(Klebsiella pnermoniae)OK8

<400> 87

Met Asp Val Phe Asp Lys Val Tyr Ser Asp Asp Asn Asn Ser Tyr Asp

1 5 10 15

Gln Lys Thr Val Ser Gln Arg Ile Glu Ala Leu Phe Leu Asn Asn Leu

20 25 30

Gly Lys Val Val Thr Arg Gln Gln Ile Ile Arg Ala Ala Thr Asp Pro

35 40 45

Lys Thr Gly Lys Gln Pro Glu Asn Trp His Gln Arg Leu Ser Glu Leu

50 55 60

Arg Thr Asp Lys Gly Tyr Thr Ile Leu Ser Trp Arg Asp Met Lys Val

65 70 75 80

Leu Ala Pro Gln Glu Tyr Ile Met Pro His Ala Thr Arg Arg Pro Lys

85 90 95

Ala Ala Lys Arg Val Leu Pro Thr Lys Glu Thr Trp Glu Gln Val Leu

100 105 110

Asp Arg Ala Asn Tyr Ser Cys Glu Trp Gln Glu Asp Gly Gln His Cys

115 120 125

Gly Leu Val Glu Gly Asp Ile Asp Pro Ile Gly Gly Gly Thr Val Lys

130 135 140

Leu Thr Pro Asp His Met Thr Pro His Ser Ile Asp Pro Ala Thr Asp

145 150 155 160

Val Asn Asp Pro Lys Met Trp Gln Ala Leu Cys Gly Arg His Gln Val

165 170 175

Met Lys Lys Asn Tyr Trp Asp Ser Asn Asn Gly Lys Ile Asn Val Ile

180 185 190

Gly Ile Leu Gln Ser Val Asn Glu Lys Gln Lys Asn Asp Ala Leu Glu

195 200 205

Phe Leu Leu Asn Tyr Tyr Gly Leu Lys Arg

210 215

<210> 88

<211> 288

<212> PRT

<213> 珊瑚红诺卡氏菌(Nocardia corallina)

<400> 88

Met Ala Thr Ala Pro Gly His Leu Leu Gly Gln Ile Ile Gly Asn Val

1 5 10 15

Met Glu Glu Ala Leu Lys Pro Val Leu Gln Glu Met Ala Asp Arg His

20 25 30

Asp Leu Tyr Leu Asp Ser Lys Gly Leu Arg Pro Gly Val Arg Ser Gly

35 40 45

Ala Leu Val Thr Trp Thr Asp Asp Leu Gly Asn Asn His Asp Leu Asp

50 55 60

Phe Val Leu Glu Arg Gly Gly Ser Ala Thr Lys Ala Gly Asn Pro Ala

65 70 75 80

Ala Phe Ile Glu Ala Ala Trp Arg Arg Tyr Thr Lys His Ser Lys Ala

85 90 95

Lys Ala Gln Glu Ile Gln Gly Ala Val Leu Pro Val Leu Ala Ala Trp

100 105 110

Asn Asn Val Lys Pro Thr Pro Ala Ala Val Val Ala Gly Gln Trp Thr

115 120 125

Ala Pro Ser Leu Gln Gln Met Arg Ser Asn Gly Phe Val Val Leu His

130 135 140

Leu His Phe Pro Thr Thr Ala Gln Val Phe Gly Gly Asn Gly Ile Asn

145 150 155 160

Ile Glu Gly Thr Gly Glu Gly Thr Pro Asp Ala Phe Trp Gln Gln Gln

165 170 175

Cys Asp Ala Tyr Thr Ser Lys Ser Glu Ala Asp Lys Asp Ser Leu Ala

180 185 190

Thr Ala Leu Arg Thr Ala His Ala Gln Glu Phe Arg Thr Phe Val Ala

195 200 205

Glu Leu Glu Arg Arg Val Val Arg Ala Ile Asp Tyr Val Val Val Thr

210 215 220

Pro Leu His Gly His Gly Ser Gln Tyr Thr Ser Ile Glu Asn Ala Ile

225 230 235 240

Glu Ala Val Arg Thr Tyr Ser Cys Gly Glu Glu Ser Ala Pro Phe Leu

245 250 255

Arg Phe Glu Ile Arg Ile Ser Tyr Thr Asn Gly Asp Val Ile Gln Ala

260 265 270

Thr Phe Gly Ser Ser Ser Asp Ala Ile Glu Phe Leu Asp Thr Phe Asn

275 280 285

<210> 89

<211> 328

<212> PRT

<213> 粘膜奈瑟氏菌( Neisseria mucosa)

<400> 89

Met Ser Ser Tyr His Asp Asp Leu Asn Ile Leu Asn Val Asp Phe Asn

1 5 10 15

His Leu Arg Leu Thr Glu Leu Ile Lys Leu Ala Asp Gln Ala Glu Pro

20 25 30

Phe Tyr Leu Trp Val Glu Lys Ile Phe Arg Gln Val Ser Gly Arg Ala

35 40 45

Asp Ser Leu Glu Thr Ile Ile Glu Val Glu Glu Arg Val Val Leu Lys

50 55 60

Met Ala Ile Leu Thr Cys Phe Thr Ser Asp Glu Lys Glu Leu Pro Lys

65 70 75 80

Leu Phe Asn Gly Val Gly Val Pro Tyr Pro His Ile Lys Ala Cys Tyr

85 90 95

Phe Phe Phe Ala Trp Leu Val Arg Asp Ala Ala Thr Gln Arg Leu Asp

100 105 110

Pro Leu Ile Arg Glu Ala Phe Thr Gln Leu Lys Ser Ile His Pro Gln

115 120 125

Met Lys Lys Thr Glu Leu Glu Ser Glu Ile Phe Ser Gln Leu Leu Val

130 135 140

Asn Tyr Arg Asn Glu Leu Ile His Phe Ser Trp Pro Val Ile Arg Glu

145 150 155 160

Val Leu Ile Ser Arg Leu Glu Gly Ser Arg Arg Ala Ala Arg Gly Ser

165 170 175

Tyr Leu Glu Leu Phe Val Arg Thr Ala Leu Ala Gln Ser Ile Thr Tyr

180 185 190

Phe Tyr Lys Ile Tyr Gly Asn Tyr Gly Lys Phe Leu Asp Val Lys Ile

195 200 205

His Asp Lys Pro Leu Lys Val Lys Asn Arg Thr Tyr Asp Val Val Ala

210 215 220

Glu Leu Ile Gly Asn Asn His Asn Thr Gln Tyr Leu Ile Leu Pro Val

225 230 235 240

Lys Thr Arg Glu Thr Gln Gly Gly Gly His Ala His Leu Phe Thr Arg

245 250 255

Asp Ile Glu Gln Ser Asn Asn Asp Ile Arg Glu Leu Tyr Pro Asn Ala

260 265 270

Val Ile Ala Pro Val Ile Ile Ala Glu Asn Trp Ser Asp Thr Glu Lys

275 280 285

Asp Leu Glu Asn Val Gly Tyr Asn Asp Ile Phe His Phe Ser Val Asn

290 295 300

Pro Asn Arg Phe Ala Gly Phe Ser Asp Val Glu Gln Ile Arg Leu Asn

305 310 315 320

Arg Leu Val Glu Arg Ile Leu Leu

325

<210> 90

<211> 383

<212> PRT

<213> 豚鼠诺卡氏菌(Nocardia otitidis-caviarum)

<400> 90

Met Arg Ser Asp Thr Ser Val Glu Pro Glu Gly Ala Asn Phe Ile Ala

1 5 10 15

Glu Phe Phe Gly His Arg Val Tyr Pro Glu Val Val Ser Thr Glu Ala

20 25 30

Ala Arg Asn Asp Gln Ala Thr Gly Thr Cys Pro Phe Leu Thr Ala Ala

35 40 45

Lys Leu Val Glu Thr Ser Cys Val Lys Ala Glu Thr Ser Arg Gly Val

50 55 60

Cys Val Val Asn Thr Ala Val Asp Asn Glu Arg Tyr Asp Trp Leu Val

65 70 75 80

Cys Pro Asn Arg Ala Leu Asp Pro Leu Phe Met Ser Ala Ala Ser Arg

85 90 95

Lys Leu Phe Gly Tyr Gly Pro Thr Glu Pro Leu Gln Phe Ile Ala Ala

100 105 110

Pro Thr Leu Ala Asp Gln Ala Val Arg Asp Gly Ile Arg Glu Trp Leu

115 120 125

Asp Arg Gly Val His Val Val Ala Tyr Phe Gln Glu Lys Leu Gly Gly

130 135 140

Glu Leu Ser Ile Ser Lys Thr Asp Ser Ser Pro Glu Phe Ser Phe Asp

145 150 155 160

Trp Thr Leu Ala Glu Val Glu Ser Ile Tyr Pro Val Pro Lys Ile Lys

165 170 175

Arg Tyr Gly Val Leu Glu Ile Gln Thr Met Asp Phe His Gly Ser Tyr

180 185 190

Lys His Ala Val Gly Ala Ile Asp Ile Ala Leu Val Glu Gly Ile Asp

195 200 205

Phe His Gly Trp Leu Pro Thr Pro Ala Gly Arg Ala Ala Leu Ser Lys

210 215 220

Lys Met Glu Gly Pro Asn Leu Ser Asn Val Phe Lys Arg Thr Phe Tyr

225 230 235 240

Gln Met Ala Tyr Lys Phe Ala Leu Ser Gly His Gln Arg Cys Ala Gly

245 250 255

Thr Gly Phe Ala Ile Pro Gln Ser Val Trp Lys Ser Trp Leu Arg His

260 265 270

Leu Ala Asn Pro Thr Leu Ile Asp Asn Gly Asp Gly Thr Phe Ser Leu

275 280 285

Gly Asp Thr Arg Asn Asp Ser Glu Asn Ala Trp Ile Phe Val Phe Glu

290 295 300

Leu Asp Pro Asp Thr Asp Ala Ser Pro Arg Pro Leu Ala Pro His Leu

305 310 315 320

Glu Ile Arg Val Asn Val Asp Thr Leu Ile Asp Leu Ala Leu Arg Glu

325 330 335

Ser Pro Arg Ala Ala Leu Gly Pro Ser Gly Pro Val Ala Thr Phe Thr

340 345 350

Asp Lys Val Glu Ala Arg Met Leu Arg Phe Trp Pro Lys Thr Arg Arg

355 360 365

Arg Arg Ser Thr Thr Pro Gly Gly Gln Arg Gly Leu Phe Asp Ala

370 375 380

<210> 91

<211> 326

<212> PRT

<213> 斯氏普罗威登斯菌(Providencia stuartii)164

<400> 91

Met Lys Glu Leu Lys Leu Lys Glu Ala Lys Glu Ile Leu Lys Ala Leu

1 5 10 15

Gly Leu Pro Pro Gln Gln Tyr Asn Asp Arg Ser Gly Trp Val Leu Leu

20 25 30

Ala Leu Ala Asn Ile Lys Pro Glu Asp Ser Trp Lys Glu Ala Lys Ala

35 40 45

Pro Leu Leu Pro Thr Val Ser Ile Met Glu Phe Ile Arg Thr Glu Tyr

50 55 60

Gly Lys Asp Tyr Lys Pro Asn Ser Arg Glu Thr Ile Arg Arg Gln Thr

65 70 75 80

Leu His Gln Phe Glu Gln Ala Arg Ile Val Asp Arg Asn Arg Asp Leu

85 90 95

Pro Ser Arg Ala Thr Asn Ser Lys Asp Asn Asn Tyr Ser Leu Asn Gln

100 105 110

Val Ile Ile Asp Ile Leu His Asn Tyr Pro Asn Gly Asn Trp Lys Glu

115 120 125

Leu Ile Gln Gln Phe Leu Thr His Val Pro Ser Leu Gln Glu Leu Tyr

130 135 140

Glu Arg Ala Leu Ala Arg Asp Arg Ile Pro Ile Lys Leu Leu Asp Gly

145 150 155 160

Thr Gln Ile Ser Leu Ser Pro Gly Glu His Asn Gln Leu His Ala Asp

165 170 175

Ile Val His Glu Phe Cys Pro Arg Phe Val Gly Asp Met Gly Lys Ile

180 185 190

Leu Tyr Ile Gly Asp Thr Ala Ser Ser Arg Asn Glu Gly Gly Lys Leu

195 200 205

Met Val Leu Asp Ser Glu Tyr Leu Lys Lys Leu Gly Val Pro Pro Met

210 215 220

Ser His Asp Lys Leu Pro Asp Val Val Val Tyr Asp Glu Lys Arg Lys

225 230 235 240

Trp Leu Phe Leu Ile Glu Ala Val Thr Ser His Gly Pro Ile Ser Pro

245 250 255

Lys Arg Trp Leu Glu Leu Glu Ala Ala Leu Ser Ser Cys Thr Val Gly

260 265 270

Lys Val Tyr Val Thr Ala Phe Pro Thr Arg Thr Glu Phe Arg Lys Asn

275 280 285

Ala Ala Asn Ile Ala Trp Glu Thr Glu Val Trp Ile Ala Asp Asn Pro

290 295 300

Asp His Met Val His Phe Asn Gly Asp Arg Phe Leu Gly Pro His Asp

305 310 315 320

Lys Lys Pro Glu Leu Ser

325

<210> 92

<211> 157

<212> PRT

<213> 普通变形杆菌(Proteus vulgaris)

<400> 92

Met Ser His Pro Asp Leu Asn Lys Leu Leu Glu Leu Trp Pro His Ile

1 5 10 15

Gln Glu Tyr Gln Asp Leu Ala Leu Lys His Gly Ile Asn Asp Ile Phe

20 25 30

Gln Asp Asn Gly Gly Lys Leu Leu Gln Val Leu Leu Ile Thr Gly Leu

35 40 45

Thr Val Leu Pro Gly Arg Glu Gly Asn Asp Ala Val Asp Asn Ala Gly

50 55 60

Gln Glu Tyr Glu Leu Lys Ser Ile Asn Ile Asp Leu Thr Lys Gly Phe

65 70 75 80

Ser Thr His His His Met Asn Pro Val Ile Ile Ala Lys Tyr Arg Gln

85 90 95

Val Pro Trp Ile Phe Ala Ile Tyr Arg Gly Ile Ala Ile Glu Ala Ile

100 105 110

Tyr Arg Leu Glu Pro Lys Asp Leu Glu Phe Tyr Tyr Asp Lys Trp Glu

115 120 125

Arg Lys Trp Tyr Ser Asp Gly His Lys Asp Ile Asn Asn Pro Lys Ile

130 135 140

Pro Val Lys Tyr Val Met Glu His Gly Thr Lys Ile Tyr

145 150 155

<210> 93

<211> 358

<212> PRT

<213> 不产色链霉菌(Streptomyces achromogenes)

<400> 93

Met Gly Ile Thr Ile Lys Lys Ser Thr Ala Glu Gln Val Leu Arg Lys

1 5 10 15

Ala Tyr Glu Ala Ala Ala Ser Asp Asp Val Phe Leu Glu Asp Trp Ile

20 25 30

Phe Leu Ala Thr Ser Leu Arg Glu Val Asp Ala Pro Arg Thr Tyr Thr

35 40 45

Ala Ala Leu Val Thr Ala Leu Leu Ala Arg Ala Cys Asp Asp Arg Val

50 55 60

Asp Pro Arg Ser Ile Lys Glu Lys Tyr Asp Asp Arg Ala Phe Ser Leu

65 70 75 80

Arg Thr Leu Cys His Gly Val Val Val Pro Met Ser Val Glu Leu Gly

85 90 95

Phe Asp Leu Gly Ala Thr Gly Arg Glu Pro Ile Asn Asn Gln Pro Phe

100 105 110

Phe Arg Tyr Asp Gln Tyr Ser Glu Ile Val Arg Val Gln Thr Lys Ala

115 120 125

Arg Pro Tyr Leu Asp Arg Val Ser Ser Ala Leu Ala Arg Val Asp Glu

130 135 140

Glu Asp Tyr Ser Thr Glu Glu Ser Phe Arg Ala Leu Val Ala Val Leu

145 150 155 160

Ala Val Cys Ile Ser Val Ala Asn Lys Lys Gln Arg Val Ala Val Gly

165 170 175

Ser Ala Ile Val Glu Ala Ser Leu Ile Ala Glu Thr Gln Ser Phe Val

180 185 190

Val Ser Gly His Asp Val Pro Arg Lys Leu Gln Ala Cys Val Ala Ala

195 200 205

Gly Leu Asp Met Val Tyr Ser Glu Val Val Ser Arg Arg Ile Asn Asp

210 215 220

Pro Ser Arg Asp Phe Pro Gly Asp Val Gln Val Ile Leu Asp Gly Asp

225 230 235 240

Pro Leu Leu Thr Val Glu Val Arg Gly Lys Ser Val Ser Trp Glu Gly

245 250 255

Leu Glu Gln Phe Val Ser Ser Ala Thr Tyr Ala Gly Phe Arg Arg Val

260 265 270

Ala Leu Met Val Asp Ala Ala Ser His Val Ser Leu Met Ser Ala Asp

275 280 285

Asp Leu Thr Ser Ala Leu Glu Arg Lys Tyr Glu Cys Ile Val Lys Val

290 295 300

Asn Glu Ser Val Ser Ser Phe Leu Arg Asp Val Phe Val Trp Ser Pro

305 310 315 320

Arg Asp Val His Ser Ile Leu Ser Ala Phe Pro Glu Ala Met Tyr Arg

325 330 335

Arg Met Ile Glu Ile Glu Val Arg Glu Pro Glu Leu Asp Arg Trp Ala

340 345 350

Glu Ile Phe Pro Glu Thr

355

<210> 94

<211> 315

<212> PRT

<213> 白色链霉菌(Streptomyces albus)G

<400> 94

Met Ile Asn Ala Asp Lys Pro His Arg Trp Asn Asp Asp Val Gln Ala

1 5 10 15

Ser Val Arg Leu Tyr Asn Gln Trp Phe Leu Asp Ala Ala Pro Lys Ala

20 25 30

Tyr Arg Asp Thr Arg Gln Leu Thr Ile Asp Glu Val Glu Gln Ala Phe

35 40 45

Gln Arg Thr Ala Asn Met Thr Ser Ile Thr Pro Glu Val Leu Lys Ala

50 55 60

His Pro Lys Thr Leu Ala Thr Leu Arg Met Ser Thr Ala Pro Pro Ile

65 70 75 80

Ala Arg Asp Arg Leu Val Gly Leu Ser His Gly Ser Lys Ser Leu Leu

85 90 95

Asp Thr Met Glu Lys Gly Lys Leu Pro Pro Arg Met Lys Gly Asp Val

100 105 110

Leu Asp Thr His Leu Ala Lys Met Cys Ala Val Leu Thr Asp Leu Leu

115 120 125

Asp Leu Asp Leu Phe His Trp Tyr Pro Thr Gly Glu Pro Ala Glu Pro

130 135 140

Arg Gln Arg Glu Leu Ala Ala Thr Val Val Ala Asp Arg Leu Cys Gly

145 150 155 160

Ala Ile Ala Asp Pro Ile Val Arg Asn Ala Gln Glu Arg Arg Gln Leu

165 170 175

Ala Leu Ile Glu Glu Trp Leu Leu Ala Arg Gly Tyr Thr Lys Lys Thr

180 185 190

His Ser Ala Ser Leu Pro Leu Asn Thr Met Gln Pro Gly Thr Phe Ser

195 200 205

Phe Arg Gln Asn Val Val Val Gly Ser Asp Leu Pro Val Asn Ile Pro

210 215 220

Val Asp Ala Val Ile Gln Pro His Thr Pro His Ser His Lys Leu Pro

225 230 235 240

Ile Leu Ile Glu Ala Lys Ser Ala Gly Asp Phe Thr Asn Thr Asn Lys

245 250 255

Arg Arg Lys Glu Glu Ala Thr Lys Ile His Gln Leu Gln Leu Lys Tyr

260 265 270

Gly Asn Glu Ile Ser Leu Thr Leu Phe Leu Cys Gly Tyr Phe Asn Thr

275 280 285

Gly Tyr Leu Gly Tyr Ser Ala Ala Glu Gly Leu Asp Trp Val Trp Glu

290 295 300

His Arg Ile Asp Asp Leu Glu Ala Ala Gly Ala

305 310 315

<210> 95

<211> 432

<212> PRT

<213> 糖多孢菌某种(Saccharopolyspora sp.)

<400> 95

Met Arg Arg Leu Ala Thr Gln Arg Arg Glu Asp Ala Tyr Lys Ser Asn

1 5 10 15

Arg Asp Tyr Gln Thr Val His Glu Ala Gln Ser Leu Arg Val Asn Ser

20 25 30

Thr Asp Asp Asp Asn Leu Ser Leu Phe Leu Leu Lys Asp Ile Ser Pro

35 40 45

Arg Glu Asp Ser Lys Asn Ile Val Gly Phe Gly Gly Phe Val Lys Pro

50 55 60

Glu Ile Ala Thr Thr Met Ala Leu Thr Leu Thr Thr Asp Ile Asp Lys

65 70 75 80

Gln Ile Lys Ser Val Pro Leu Ser Ser Asn Trp Asn Arg Ile Ser Ile

85 90 95

Val Ala Lys Phe Ala Ser Asn Pro Ser Val Ser Ile Thr Leu Gly Phe

100 105 110

Asp Gln Thr Pro Trp Val Asp Phe Trp Gly Ile Asn Ser Asp Asp Ile

115 120 125

Gly Leu Ser Phe Val Ser Asp Ala Val Pro Leu Glu Met Ser Met Ile

130 135 140

Asp Ser Ile His Ile Ala Pro Glu Thr Leu Tyr Leu Asp His Ser Ser

145 150 155 160

Ala Cys Leu Leu Asp Ile Asp Pro Val Glu Ser Thr Arg Phe Lys Thr

165 170 175

Gly His Gly Asp Pro Leu Ser Leu Lys Lys Cys Ser Tyr Cys Gly Arg

180 185 190

Leu Leu Pro Ile Asp Leu Glu Arg Pro Gly Lys Leu Ser Phe His Lys

195 200 205

His Arg Ala Lys Ile Thr Asn His Gln Asn Glu Cys Arg Ser Cys Lys

210 215 220

Lys Trp Arg Ile Asn Asn Ser Phe Asn Pro Met Arg Thr Ile Asp Gln

225 230 235 240

Leu Asn Glu Ser Ala Leu Ile Thr Arg Glu Arg Lys Ile Phe Leu Gln

245 250 255

Glu Pro Glu Ile Leu Gln Glu Ile Lys Asp Arg Thr Gly Ala Gly Leu

260 265 270

Lys Ser Gln Val Trp Glu Arg Phe His Arg Lys Cys Phe Asn Cys Arg

275 280 285

Lys Asp Leu Lys Leu Ser Glu Val Gln Leu Asp His Thr Arg Pro Leu

290 295 300

Ala Tyr Leu Trp Pro Ile Asp Glu His Ala Thr Cys Leu Cys Ala Gln

305 310 315 320

Cys Asn Asn Thr Lys Lys Asp Arg Phe Pro Val Asp Phe Tyr Ser Glu

325 330 335

Gln Gln Ile Arg Glu Leu Ser Asp Ile Cys Gly Leu Pro Tyr Gln Asp

340 345 350

Leu Cys Ala Arg Ser Leu Asn Leu Asp Gln Leu Asp Arg Ile Glu Arg

355 360 365

Asn Ile Ala Glu Phe Ser Lys Glu Trp Asp Val Arg Thr Phe Ala Ser

370 375 380

Thr Ala Arg Arg Ile Ser Glu Val Tyr Pro Ala Arg Asp Leu Phe Glu

385 390 395 400

Thr Leu Lys Lys Glu Ser Glu Ser Ala Tyr Asn Lys Ile Ile Glu Lys

405 410 415

Leu Lys Glu Arg Pro Asp Ala Leu Leu Asp Glu Ala Leu Pro Leu Asp

420 425 430

<210> 96

<211> 323

<212> PRT

<213> 链霉菌属菌种(Streptomyces species)Bf-61

<400> 96

Met Asn Ser Ser Asp Gly Ile Asp Gly Thr Val Ala Ser Ile Asp Thr

1 5 10 15

Ala Arg Ala Leu Leu Lys Arg Phe Gly Phe Asp Ala Gln Arg Tyr Asn

20 25 30

Val Arg Ser Ala Val Thr Leu Leu Ala Leu Ala Gly Leu Lys Pro Gly

35 40 45

Asp Arg Trp Val Asp Ser Thr Thr Pro Arg Leu Gly Val Gln Lys Ile

50 55 60

Met Asp Trp Ser Gly Glu His Trp Ala Lys Pro Tyr Ala Thr Gly Ser

65 70 75 80

Arg Glu Asp Phe Arg Lys Lys Thr Leu Arg Gln Trp Val Asp Asn Gly

85 90 95

Phe Ala Val Leu Asn Ala Asp Asn Leu Asn Ile Ala Thr Asn Ser Gln

100 105 110

Leu Asn Glu Tyr Cys Leu Ser Asp Glu Ala Leu Gln Ala Leu Arg Ala

115 120 125

Tyr Gly Thr Glu Gly Phe Glu Glu Ser Leu Val Val Phe Leu Asp Glu

130 135 140

Ala Ser Lys Ala Val Lys Ala Arg Ala Glu Ala Leu Gln Ala Ala Met

145 150 155 160

Ile Ser Val Asp Leu Pro Gly Gly Glu Glu Phe Leu Leu Ser Pro Ala

165 170 175

Gly Gln Asn Pro Leu Leu Lys Lys Met Val Glu Glu Phe Val Pro Arg

180 185 190

Phe Ala Pro Arg Ser Thr Val Leu Tyr Leu Gly Asp Thr Arg Gly Lys

195 200 205

His Ser Leu Phe Glu Arg Glu Ile Phe Glu Glu Val Leu Gly Leu Thr

210 215 220

Phe Asp Pro His Gly Arg Met Pro Asp Leu Ile Leu His Asp Glu Val

225 230 235 240

Arg Gly Trp Leu Phe Leu Met Glu Ala Val Lys Ser Lys Gly Pro Phe

245 250 255

Asp Glu Glu Arg His Arg Ser Leu Gln Glu Leu Phe Val Thr Pro Ser

260 265 270

Ala Gly Leu Ile Phe Val Asn Cys Phe Glu Asn Arg Glu Ser Met Arg

275 280 285

Gln Trp Leu Pro Glu Leu Ala Trp Glu Thr Glu Ala Trp Val Ala Glu

290 295 300

Asp Pro Asp His Leu Ile His Leu Asn Gly Ser Arg Phe Leu Gly Pro

305 310 315 320

Tyr Glu Arg

<210> 97

<211> 227

<212> PRT

<213> 头状链霉菌(Streptomyces caespitosus)

<400> 97

Met Ile Asn Asp Gln Leu Pro Arg Trp Val Arg Glu Ala Arg Val Gly

1 5 10 15

Thr Arg Thr Gly Gly Pro Ala Met Arg Pro Lys Thr Ser Asp Ser Pro

20 25 30

Tyr Phe Gly Trp Asp Ser Glu Asp Trp Pro Glu Val Thr Arg Gln Leu

35 40 45

Leu Ser Glu Gln Pro Leu Ser Gly Asp Thr Leu Val Asp Ala Val Leu

50 55 60

Ala Ser Trp Glu Ser Ile Phe Glu Ser Arg Leu Gly Ser Gly Phe His

65 70 75 80

Ile Gly Thr Gln Ile Arg Pro Thr Pro Gln Ile Met Gly Phe Leu Leu

85 90 95

His Ala Leu Ile Pro Leu Glu Leu Ala Asn Gly Asp Pro Ser Trp Arg

100 105 110

Ala Asp Leu Asn Ser Ser Glu Lys Asp Leu Val Tyr Gln Pro Asp His

115 120 125

Lys Tyr Ser Ile Glu Met Lys Thr Ser Ser His Lys Asp Gln Ile Phe

130 135 140

Gly Asn Arg Ser Phe Gly Val Glu Asn Pro Gly Lys Gly Lys Lys Ala

145 150 155 160

Lys Asp Gly Tyr Tyr Val Ala Val Asn Phe Glu Lys Trp Ser Asp Ala

165 170 175

Pro Gly Arg Leu Pro Arg Ile Arg Thr Ile Arg Tyr Gly Trp Leu Asp

180 185 190

His Thr Asp Trp Val Ala Gln Lys Ser Gln Thr Gly Gln Gln Ser Ser

195 200 205

Leu Pro Ala Val Val Ser Asn Thr Gln Leu Leu Ala Ile His Thr Gly

210 215 220

Gly Gln Arg

225

<210> 98

<211> 235

<212> PRT

<213> 产褐色链霉菌(Streptomyces phaeochromogenes)

<400> 98

Met Thr Ser Lys Asp Pro Ile Val Leu Ser Ala Asp Gln Ile Ala Trp

1 5 10 15

Leu Arg Gln Leu Lys Met Ser Lys Arg Ala Ala Leu Val Arg Asp Tyr

20 25 30

Ile Leu Glu Tyr Gly Ala Val Thr Thr Gly Lys Leu Ala Glu Leu Gly

35 40 45

Tyr Ser His Pro Pro Arg Ala Ala Arg Asp Leu Lys Asp Ala Gly Ala

50 55 60

Gly Val Val Thr Ile Met Val Lys Gly Pro Asp Gly Arg Arg Met Ala

65 70 75 80

Ser Tyr Ala Phe Asn Gly Lys Ala Asn Glu Asp Gly Ala Gly Arg Val

85 90 95

Val Ile Pro Lys Ala Phe Gly Glu Ala Leu Lys Arg Ala His Gly Gly

100 105 110

Lys Cys Ala Val Cys Tyr Gly Asp Phe Ser Glu Arg Glu Leu Gln Cys

115 120 125

Asp His Arg Val Pro Phe Ala Ile Ala Gly Asp Lys Pro Lys Leu Val

130 135 140

Gln Glu Asp Phe Met Pro Leu Cys Ala Ser Asp Asn Arg Ala Lys Ser

145 150 155 160

Trp Ser Cys Glu Asn Cys Pro Asn Trp Glu Leu Lys Asp Glu Asp Thr

165 170 175

Cys Arg Ser Cys Phe Trp Ala Ser Pro Glu Asn Tyr Thr His Val Ser

180 185 190

Thr Arg Pro Glu Arg Arg Ile Asn Leu Leu Phe Gln Gly Asp Glu Val

195 200 205

Glu Ile Phe Asp Ala Leu Lys Asn Ala Ala Ala Asn Glu Gly Val Ser

210 215 220

Leu Thr Glu Ala Thr Lys Arg Lys Leu Ala Asp

225 230 235

<210> 99

<211> 281

<212> PRT

<213> 球衣细菌属某种(Sphaerotilus species)

<400> 99

Met Ser Lys Ala Ala Tyr Gln Asp Phe Thr Lys Arg Phe Ser Leu Leu

1 5 10 15

Ile Lys Lys His Pro Asn Leu Ile Thr Met Thr Leu Ser Asn Ile Phe

20 25 30

Thr Met Arg Leu Ile Gly Asn Lys Thr His Gly Asp Leu Ala Glu Ile

35 40 45

Ala Ile Ser Glu Phe Ile Asn Gln Tyr Met Tyr Asp Phe Lys Ser Ile

50 55 60

His Val Gly Lys Asp Leu Tyr Arg Ala Lys Ser Lys Glu Glu Asp Ile

65 70 75 80

Thr Val Glu Asn Glu Ile Thr Lys Glu Lys Phe Pro Ile Ser Leu Lys

85 90 95

Ala Tyr Gly Asp Gly Pro Leu Gln Leu Ser Thr Asp Lys Asn Phe Leu

100 105 110

Met Tyr Pro Leu Leu Glu Glu Ile Gly Ala Phe Ile Asn Ala Lys Glu

115 120 125

Lys Ile Glu Glu Ile Phe Ala Asn Glu Ala Phe Ser Cys Phe Ser Glu

130 135 140

Ile Asn Val Leu Pro Leu Ile Tyr Asp Glu Lys Arg Gln Arg Cys Asn

145 150 155 160

Ile Leu Val Phe Asp Ala Ala Arg Ala Arg Ala Glu Thr Ala Tyr Ile

165 170 175

Arg Lys Glu Thr Glu Gly Ser Gly Arg Lys His Pro Ala Tyr Arg Phe

180 185 190

Phe Asp Lys Asn Lys Asn Tyr Ile Cys Glu Val Arg Tyr Gly Asn Ala

195 200 205

Ala Ala Asn Ala Leu Gln Arg Gly Leu Trp Thr Asn Thr Lys Asn Ala

210 215 220

Thr Ser Phe Phe Asp Ser Val Thr Asn Gly Trp Val Asp Tyr Ser His

225 230 235 240

Asn Leu Val Leu Val Lys Leu Leu Ser His Ala Leu Val Ser Ser Arg

245 250 255

Lys Gly His Glu Ala Ala Leu Glu Glu Ile Lys Lys Asp Ile Leu Gln

260 265 270

Leu Lys Gln Thr Asn Gly Ile Asn Val

275 280

<210> 100

<211> 1077

<212> DNA

<213> 鱼腥藻

<400> 100

atggaagaag accttgattt atctgaaaat atcgaagctg catctgcgga gcttacgact 60

ctttatcagg tagctgctga tgctatgaaa gattatattg aaatctatct tgcgctgagt 120

aaacagtctg atgggttttc aaatattaac aatcttgact taacttctcg taacaggcgt 180

ttggtagtta tacatggact ttcgttagag ttagatccag atacttcgac tccagaggaa 240

attaaacgtg aagctgaacg aatgctagcg atagctcttg atacagagtc agcaattacg 300

gcaggagtat atgaaaaaat gcgtctcttc gcaagctctt tagtagatca gctatttgaa 360

caaacggatg aacttaattc attatcatcg gaatatttgt cagcaaatcc aggatttttg 420

ccgtttttcc agcagttggc ggggcttaga agtaaatcag agttaaagag agaagtagga 480

aatgcctctg acaatagtat ttctaaagcg gttgcagaga gaatattaga gcgcattata 540

cgtaacttga gaattcgcac tttttccaaa gagaaactat tacaagctgt tgagcctact 600

ttagaaggaa tagtcaggga tctcgtagga aaagtgttat tggaaaatat agttgctgat 660

gctttatctg atttacaagt tcctttcatg cgtgaatcag agtatcaaag ccttaaagga 720

gtgatttatg atttccgcgc tgattttgtg ataccagacg cacaaaatcc aattgctttt 780

atcgaggtgc gaaaaagctc tacacgacat gcgtcactct atgccaagga taagatgttt 840

tcagcgatta attggaaagg aaaaaataaa aggcttttgg gtattttggt tgtggaagga 900

ccttggacaa gagaaactct tcgcgtcatg gcaaatgtgt ttgattacgt tacaccttta 960

actcgtgttt cccaagttgc agaagctatc agagcatatc tagatgggga taaaacgaga 1020

ctgaagtggt tagttaattt cagtattgaa gaagcagacc acgacaacat aacctaa 1077

<210> 101

<211> 1293

<212> DNA

<213> 球形芽孢杆菌

<400> 101

atgagacgat tagcaaaaaa ttcacggaac gacagttatt taagtaatag ggattaccag 60

gaaatcgtga gggaaaatac cactacaata tcgtttccct taaaagaaaa acatactctg 120

actttaacga aaaaaatagg gctaaatcag actgctggat tcggaggatg gtttttccct 180

gattcaccat gtttattaac agtaactgta ctatcctctt tcggtacaaa ggtaacttct 240

aaaaccttta gcctttctaa agattggaat cgtgttgggc ttgcttggat taacgagcat 300

tcgagtgaca ccataagcat tgtcctagag tttagtgatg tggaaatagt tcatacatgg 360

ggacttacat gtgatgtttt taatgtccat gaattaatta ttgatgctat agaagatcaa 420

aataaactaa tagacgtgct aaatcaagaa catttatctc ctgaaacata ttatttaaac 480

catgactctg atactgattt aattgagaat ttggaatcta cagaagagat aaagatagtt 540

aaccaaagcc aaaagcaaat ctctttaaaa aaatgctgtt attgtcaacg ttatatgcct 600

gtgaacatat tagttcgttc aaattcatca tttcataaac acaagagtaa gaaaactggt 660

tttcaaaatg aatgtcgggc ttgtaagaag tggagaataa ataattcatt caatccagtc 720

agaacaaaag accaactaca tgaatcagca gttattacac gtgaaaaaaa aatattactt 780

aaagaacctg aaatattaca gaaaatcaaa aatagaaata acggtgaggg cttaaaaagt 840

attatatgga aaaaatttga taaaaaatgc tttaattgtg aaaaagaatt aaccattgaa 900

gaggtacgcc tagaccatac aagaccactt gcttatctgt ggcctatcga tgaacacgca 960

acttgtttat gtgaaaaatg caacaataca aaacatgata tgtttcctat cgatttttat 1020

caaggggacg aagacaaatt aagacgttta gctagaatta cggggttaga ttatgaatct 1080

ctagttaaga gggacgtaaa tgaagttgaa cttgcaagaa taatcaataa cattgaagac 1140

tttgcaacta atgtagaggc acgtactttt cgctcaataa gaaataaagt aaaagaagta 1200

cgtcccgata ctgacctatt tgaaattctt aaatctaaaa atattaattt atataatgaa 1260

cttcaatatg aacttcttac ccgtaaggat taa 1293

<210> 102

<211> 2189

<212> DNA

<213> 人工

<220>

<223> 质粒placzz2

<400> 102

ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag 60

tcacgacgtt gtaaaacgac ggccagtgaa ttcgagctcg gtacccgggg gcgcgccgga 120

tccttaatta agtctagagt cgactgttta aacctgcagg catgcaagct tggcgtaatc 180

atggtcatat gttaacctcc ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 240

tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 300

gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 360

ggaaacctgt cgtgccagca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 420

ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 480

acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 540

tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 600

ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 660

ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 720

ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 780

actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 840

gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 900

tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 960

caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 1020

atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 1080

acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 1140

ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 1200

ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 1260

tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 1320

tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 1380

gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 1440

tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 1500

tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 1560

ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 1620

tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 1680

ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 1740

gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 1800

ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 1860

cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 1920

ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 1980

ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 2040

gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 2100

ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 2160

gcgcacattt ccccgaaaag tgccacctg 2189

<210> 103

<211> 10673

<212> DNA

<213> 人工

<220>

<223> 质粒pBC4

<400> 103

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat 420

cctctagagt cgaaccccgg atccggccgt ccgccgtgat ccatgcggtt accgcccgcg 480

tgtcgaaccc aggtgtgcga cgtcagacaa cgggggagcg ctccttttgg cttccttcca 540

ggcgcggcgg ctgctgcgct agcttttttg gccactggcc gcgcgcggcg taagcggtta 600

ggctggaaag cgaaagcatt aagtggctcg ctccctgtag ccggagggtt attttccaag 660

ggttgagtcg caggaccccc ggttcgagtc tcgggccggc cggactgcgg cgaacggggg 720

tttgcctccc cgtcatgcaa gaccccgctt gcaaattcct ccggaaacag ggacgagccc 780

cttttttgct tttcccagat gcatccggtg ctgcggcaga tgcgcccccc tcctcagcag 840

cggcaagagc aagagcagcg gcagacatgc agggcaccct ccccttctcc taccgcgtca 900

ggaggggcaa catccgcggc tgacgcggcg gcagatggtg attacgaacc cccgcggcgc 960

cgggcccggc actacctgga cttggaggag ggcgagggcc tggcgcggct aggagcgccc 1020

tctcctgagc gacacccaag ggtgcagctg aagcgtgaca cgcgcgaggc gtacgtgccg 1080

cggcagaacc tgtttcgcga ccgcgaggga gaggagcccg aggagatgcg ggatcgaaag 1140

ttccacgcag ggcgcgagtt gcggcatggc ctgaaccgcg agcggttgct gcgcgaggag 1200

gactttgagc ccgacgcgcg gaccgggatt agtcccgcgc gcgcacacgt ggcggccgcc 1260

gacctggtaa ccgcgtacga gcagacggtg aaccaggaga ttaactttca aaaaagcttt 1320

aacaaccacg tgcgcacgct tgtggcgcgc gaggaggtgg ctataggact gatgcatctg 1380

tgggactttg taagcgcgct ggagcaaaac ccaaatagca agccgctcat ggcgcagctg 1440

ttccttatag tgcagcacag cagggacaac gaggcattca gggatgcgct gctaaacata 1500

gtagagcccg agggccgctg gctgctcgat ttgataaaca ttctgcagag catagtggtg 1560

caggagcgca gcttgagcct ggctgacaag gtggccgcca ttaactattc catgctcagt 1620

ctgggcaagt tttacgcccg caagatatac catacccctt acgttcccat agacaaggag 1680

gtaaagatcg aggggttcta catgcgcatg gcgttgaagg tgcttacctt gagcgacgac 1740

ctgggcgttt atcgcaacga gcgcatccac aaggccgtga gcgtgagccg gcggcgcgag 1800

ctcagcgacc gcgagctgat gcacagcctg caaagggccc tggctggcac gggcagcggc 1860

gatagagagg ccgagtccta ctttgacgcg ggcgctgacc tgcgctgggc cccaagccga 1920

cgcgccctgg aggcagctgg ggccggacct gggctggcgg tggcacccgc gcgcgctggc 1980

aacgtcggcg gcgtggagga atatgacgag gacgatgagt acgagccaga ggacggcgag 2040

tactaagcgg tgatgtttct gatcagatga tgcaagacgc aacggacccg gcggtgcggg 2100

cggcgctgca gagccagccg tccggcctta actccacgga cgactggcgc caggtcatgg 2160

accgcatcat gtcgctgact gcgcgtaacc ctgacgcgtt ccggcagcag ccgcaggcca 2220

accggctctc cgcaattctg gaagcggtgg tcccggcgcg cgcaaacccc acgcacgaga 2280

aggtgctggc gatcgtaaac gcgctggccg aaaacagggc catccggccc gatgaggccg 2340

gcctggtcta cgacgcgctg cttcagcgcg tggctcgtta caacagcggc aacgtgcaga 2400

ccaacctgga ccggctggtg ggggatgtgc gcgaggccgt ggcgcagcgt gagcgcgcgc 2460

agcagcaggg caacctgggc tccatggttg cactaaacgc cttcctgagt acacagcccg 2520

ccaacgtgcc gcggggacag gaggactaca ccaactttgt gagcgcactg cggctaatgg 2580

tgactgagac accgcaaagt gaggtgtacc agtccgggcc agactatttt ttccagacca 2640

gtagacaagg cctgcagacc gtaaacctga gccaggcttt caagaacttg caggggctgt 2700

ggggggtgcg ggctcccaca ggcgaccgcg cgaccgtgtc tagcttgctg acgcccaact 2760

cgcgcctgtt gctgctgcta atagcgccct tcacggacag tggcagcgtg tcccgggaca 2820

catacctagg tcacttgctg acactgtacc gcgaggccat aggtcaggcg catgtggacg 2880

agcatacttt ccaggagatt acaagtgtca gccgcgcgct ggggcaggag gacacgggca 2940

gcctggaggc aaccctgaac tacctgctga ccaaccggcg gcagaagatc ccctcgttgc 3000

acagtttaaa cagcgaggag gagcgcatct tgcgctatgt gcagcagagc gtgagcctta 3060

acctgatgcg cgacggggta acgcccagcg tggcgctgga catgaccgcg cgcaacatgg 3120

aaccgggcat gtatgcctca aaccggccgt ttatcaatcg cctaatggac tacttgcatc 3180

gcgcggccgc cgtgaacccc gagtatttca ccaatgccat cttgaacccg cactggctac 3240

cgccccctgg tttctacacc gggggatttg aggtgcccga gggtaacgat ggattcctct 3300

gggacgacat agacgacagc gtgttttccc cgcaaccgca gaccctgcta gagttgcaac 3360

agcgcgagca ggcagaggcg gcgctgcgaa aggaaagctt ccgcaggcca agcagcttgt 3420

ccgatctagg cgctgcggcc ccgcggtcag atgcgagtag cccatttcca agcttgatag 3480

ggtcttttac cagcactcgc accacccgcc cgcgcctgct gggcgaggag gagtacctaa 3540

acaactcgct gctgcagccg cagcgcgaaa agaacctgcc tccggcattt cccaacaacg 3600

ggatagagag cctagtggac aagatgagta gatggaagac gtatgcgcag gagcacaggg 3660

atgtgcccgg cccgcgcccg cccacccgtc gtcaaaggca cgaccgtcag cggggtctgg 3720

tgtgggagga cgatgactcg gcagacgaca gcagcgtcct ggatttggga gggagtggca 3780

acccgtttgc gcaccttcgc cccaggctgg ggagaatgtt ttaaaaaaaa aaaaaaaaag 3840

catgatgcaa aataaaaaac tcaccaaggc catggcaccg agcgttggtt ttcttgtatt 3900

ccccttagta tgcagcgcgc ggcgatgtat gaggaaggtc ctcctccctc ctacgagagc 3960

gtggtgagcg cggcgccagt ggcggcggcg ctgggttccc ccttcgatgc tcccctggac 4020

ccgccgtttg tgcctccgcg gtacctgcgg cctaccgggg ggagaaacag catccgttac 4080

tctgagttgg cacccctatt cgacaccacc cgtgtgtacc ttgtggacaa caagtcaacg 4140

gatgtggcat ccctgaacta ccagaacgac cacagcaact ttctaaccac ggtcattcaa 4200

aacaatgact acagcccggg ggaggcaagc acacagacca tcaatcttga cgaccgttcg 4260

cactggggcg gcgacctgaa aaccatcctg cataccaaca tgccaaatgt gaacgagttc 4320

atgtttacca ataagtttaa ggcgcgggtg atggtgtcgc gctcgcttac taaggacaaa 4380

caggtggagc tgaaatatga gtgggtggag ttcacgctgc ccgagggcaa ctactccgag 4440

accatgacca tagaccttat gaacaacgcg atcgtggagc actacttgaa agtgggcagg 4500

cagaacgggg ttctggaaag cgacatcggg gtaaagtttg acacccgcaa cttcagactg 4560

gggtttgacc cagtcactgg tcttgtcatg cctggggtat atacaaacga agccttccat 4620

ccagacatca ttttgctgcc aggatgcggg gtggacttca cccacagccg cctgagcaac 4680

ttgttgggca tccgcaagcg gcaacccttc caggagggct ttaggatcac ctacgatgac 4740

ctggagggtg gtaacattcc cgcactgttg gatgtggacg cctaccaggc aagcttaaaa 4800

gatgacaccg aacagggcgg ggatggcgca ggcggcggca acaacagtgg cagcggcgcg 4860

gaagagaact ccaacgcggc agccgcggca atgcagccgg tggaggacat gaacgatcat 4920

gccattcgcg gcgacacctt tgccacacgg gcggaggaga agcgcgctga ggccgaggca 4980

gcggcagaag ctgccgcccc cgctgcgcaa cccgaggtcg agaagcctca gaagaaaccg 5040

gtgatcaaac ccctgacaga ggacagcaag aaacgcagtt acaacctaat aagcaatgac 5100

agcaccttca cccagtaccg cagctggtac cttgcataca actacggcga ccctcagacc 5160

gggatccgct catggaccct cctttgcact cctgacgtaa cctgcggctc ggagcaggtc 5220

tactggtcgt tgccagacat gatgcaagac cccgtgacct tccgctccac gagccagatc 5280

agcaactttc cggtggtggg cgccgagctg ttgcccgtgc actccaagag cttctacaac 5340

gaccaggccg tctactccca gctcatccgc cagtttacct ctctgaccca cgtgttcaat 5400

cgctttcccg agaaccagat tttggcgcgc ccgccagccc ccaccatcac caccgtcagt 5460

gaaaacgttc ctgctctcac agatcacggg acgctaccgc tgcgcaacag catcggagga 5520

gtccagcgag tgaccattac tgacgccaga cgccgcacct gcccctacgt ttacaaggcc 5580

ctgggcatag tctcgccgcg cgtcctatcg agccgcactt tttgagcaaa catgtccatc 5640

cttatatcgc ccagcaataa cacaggctgg ggcctgcgct tcccaagcaa gatgtttggc 5700

ggggcaaaga agcgctccga ccaacaccca gtgcgcgtgc gcgggcacta ccgcgcgccc 5760

tggggcgcgc acaaacgcgg ccgcactggg cgcaccaccg tcgatgacgc cattgacgcg 5820

gtggtggagg aggcgcgcaa ctacacgccc acgccgccac cagtgtccac agtggacgcg 5880

gccattcaga ccgtggtgcg cggagcccgg cgttatgcta aaatgaagag acggcggagg 5940

cgcgtagcac gtcgccaccg ccgccgaccc ggcactgccg cccaacgcgc ggcggcggcc 6000

ctgcttaacc gcgcacgtcg caccggccga cgggcggcca tgcgggccgc tcgaaggctg 6060

gccgcgggta ttgtcactgt gccccccagg tccaggcgac gagcggccgc cgcagcagcc 6120

gcggccatta gtgctatgac tcagggtcgc aggggcaacg tgtactgggt gcgcgactcg 6180

gttagcggcc tgcgcgtgcc cgtgcgcacc cgccccccgc gcaactagat tgcaagaaaa 6240

aactacttag actcgtactg ttgtatgtat ccagcggcgg cggcgcgcaa cgaagctatg 6300

tccaagcgca aaatcaaaga agagatgctc caggtcatcg cgccggagat ctatggcccc 6360

ccgaagaagg aagagcagga ttacaagccc cgaaagctaa agcgggtcaa aaagaaaaag 6420

aaagatgatg atgatgatga acttgacgac gaggtggaac tgctgcacgc aaccgcgccc 6480

aggcggcggg tacagtggaa aggtcgacgc gtaagacgtg ttttgcgacc cggcaccacc 6540

gtagttttta cgcccggtga gcgctccacc cgcacctaca agcgcgtgta tgatgaggtg 6600

tacggcgacg aggacctgct tgagcaggcc aacgagcgcc tcggggagtt tgcctacgga 6660

aagcggcata aggacatgtt ggcgttgccg ctggacgagg gcaacccaac acctagccta 6720

aagcccgtga cactgcagca ggtgctgccc acgcttgcac cgtccgaaga aaagcgcggc 6780

ctaaagcgcg agtctggtga cttggcaccc accgtgcagc tgatggtacc caagcgccag 6840

cgactggaag atgtcttgga aaaaatgacc gtggagcctg ggctggagcc cgaggtccgc 6900

gtgcggccaa tcaagcaggt ggcaccggga ctgggcgtgc agaccgtgga cgttcagata 6960

cccaccacca gtagcactag tattgccact gccacagagg gcatggagac acaaacgtcc 7020

ccggttgcct cggcggtggc agatgccgcg gtgcaggcgg ccgctgcggc cgcgtccaaa 7080

acctctacgg aggtgcaaac ggacccgtgg atgtttcgcg tttcagcccc ccggcgcccg 7140

cgccgttcca ggaagtacgg caccgccagc gcactactgc ccgaatatgc cctacatcct 7200

tccatcgcgc ctacccccgg ctatcgtggc tacacctacc gccccagaag acgagcgact 7260

acccgacgcc gaaccaccac tggaacccgc cgccgccgtc gccgtcgcca gcccgtgctg 7320

gccccgattt ccgtgcgcag ggtggctcgc gaaggaggca ggaccctggt gctgccaaca 7380

gcgcgctacc accccagcat cgtttaaaag ccggtctttg tggttcttgc agatatggcc 7440

ctcacctgcc gcctccgttt cccggtgccg ggattccgag gaagaatgca ccgtaggagg 7500

ggcatggccg gccacggcct gacgggcggc atgcgtcgtg cgcaccaccg gcggcggcgc 7560

gcgtcgcacc gtcgcatgcg cggcggtatc ctgcccctcc ttattccact gatcgccgcg 7620

gcgattggcg ccgtgcccgg aattgcatcc gtggccttgc aggcgcagag acactgatta 7680

aaaacaagtt gcatgtggaa aaatcaaaat aaaaagtctg gagtctcacg ctcgcttggt 7740

cctgtaacta ttttgtagaa tggaagacat caactttgcg tctctggccc cgcgacacgg 7800

ctcgcgcccg ttcatgggaa actggcaaga tatcggcacc agcaatatga gcggtggcgc 7860

cttcagctgg ggctcgctgt ggagcggcat taaaaatttc ggttccacca ttaagaacta 7920

tggcagcaag gcctggaaca gcagcacagg ccagatgctg agggacaagt tgaaagagca 7980

aaatttccaa caaaaggtgg tagatggcct ggcctctggc attagcgggg tggtggacct 8040

ggccaaccag gcagtgcaaa ataagattaa cagtaagctt gatccccgcc ctcccgtaga 8100

ggagcctcca ccggccgtgg agacagtgtc tccagagggg cgtggcgaaa agcgtccgcg 8160

gcccgacagg gaagaaactc tggtgacgca aatagatgag cctccctcgt acgaggaggc 8220

actaaagcaa ggcctgccca ccacccgtcc catcgcgccc atggctaccg gagtgctggg 8280

ccagcacaca cctgtaacgc tggacctgcc tccccccgct gacacccagc agaaacctgt 8340

gctgccaggg ccgtccgccg ttgttgtaac ccgccctagc cgcgcgtccc tgcgccgtgc 8400

cgccagcggt ccgcgatcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct 8460

gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 8520

aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 8580

actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 8640

cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 8700

gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 8760

atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 8820

caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 8880

gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 8940

ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 9000

cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 9060

taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 9120

cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 9180

acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 9240

aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 9300

atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 9360

atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 9420

gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 9480

gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 9540

ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 9600

ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 9660

tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 9720

accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 9780

atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 9840

cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 9900

tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 9960

tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 10020

gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 10080

agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 10140

aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 10200

gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 10260

tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 10320

gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 10380

tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 10440

aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 10500

catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 10560

acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 10620

tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtc 10673

<210> 104

<211> 22563

<212> DNA

<213> 人工

<220>

<223> 质粒pXba

<400> 104

tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat 420

ccttctagac cgtgcaaaag gagagcctgt aagcgggcac tcttccgtgg tctggtggat 480

aaattcgcaa gggtatcatg gcggacgacc ggggttcgaa ccccggatcc ggccgtccgc 540

cgtgatccat gcggttaccg cccgcgtgtc gaacccaggt gtgcgacgtc agacaacggg 600

ggagcgctcc ttttggcttc cttccaggcg cggcggctgc tgcgctagct tttttggcca 660

ctggccgcgc gcggcgtaag cggttaggct ggaaagcgaa agcattaagt ggctcgctcc 720

ctgtagccgg agggttattt tccaagggtt gagtcgcagg acccccggtt cgagtctcgg 780

gccggccgga ctgcggcgaa cgggggtttg cctccccgtc atgcaagacc ccgcttgcaa 840

attcctccgg aaacagggac gagccccttt tttgcttttc ccagatgcat ccggtgctgc 900

ggcagatgcg cccccctcct cagcagcggc aagagcaaga gcagcggcag acatgcaggg 960

caccctcccc ttctcctacc gcgtcaggag gggcaacatc cgcggctgac gcggcggcag 1020

atggtgatta cgaacccccg cggcgccggg cccggcacta cctggacttg gaggagggcg 1080

agggcctggc gcggctagga gcgccctctc ctgagcgaca cccaagggtg cagctgaagc 1140

gtgacacgcg cgaggcgtac gtgccgcggc agaacctgtt tcgcgaccgc gagggagagg 1200

agcccgagga gatgcgggat cgaaagttcc acgcagggcg cgagttgcgg catggcctga 1260

accgcgagcg gttgctgcgc gaggaggact ttgagcccga cgcgcggacc gggattagtc 1320

ccgcgcgcgc acacgtggcg gccgccgacc tggtaaccgc gtacgagcag acggtgaacc 1380

aggagattaa ctttcaaaaa agctttaaca accacgtgcg cacgcttgtg gcgcgcgagg 1440

aggtggctat aggactgatg catctgtggg actttgtaag cgcgctggag caaaacccaa 1500

atagcaagcc gctcatggcg cagctgttcc ttatagtgca gcacagcagg gacaacgagg 1560

cattcaggga tgcgctgcta aacatagtag agcccgaggg ccgctggctg ctcgatttga 1620

taaacattct gcagagcata gtggtgcagg agcgcagctt gagcctggct gacaaggtgg 1680

ccgccattaa ctattccatg ctcagtctgg gcaagtttta cgcccgcaag atataccata 1740

ccccttacgt tcccatagac aaggaggtaa agatcgaggg gttctacatg cgcatggcgt 1800

tgaaggtgct taccttgagc gacgacctgg gcgtttatcg caacgagcgc atccacaagg 1860

ccgtgagcgt gagccggcgg cgcgagctca gcgaccgcga gctgatgcac agcctgcaaa 1920

gggccctggc tggcacgggc agcggcgata gagaggccga gtcctacttt gacgcgggcg 1980

ctgacctgcg ctgggcccca agccgacgcg ccctggaggc agctggggcc ggacctgggc 2040

tggcggtggc acccgcgcgc gctggcaacg tcggcggcgt ggaggaatat gacgaggacg 2100

atgagtacga gccagaggac ggcgagtact aagcggtgat gtttctgatc agatgatgca 2160

agacgcaacg gacccggcgg tgcgggcggc gctgcagagc cagccgtccg gccttaactc 2220

cacggacgac tggcgccagg tcatggaccg catcatgtcg ctgactgcgc gtaaccctga 2280

cgcgttccgg cagcagccgc aggccaaccg gctctccgca attctggaag cggtggtccc 2340

ggcgcgcgca aaccccacgc acgagaaggt gctggcgatc gtaaacgcgc tggccgaaaa 2400

cagggccatc cggcccgatg aggccggcct ggtctacgac gcgctgcttc agcgcgtggc 2460

tcgttacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg atgtgcgcga 2520

ggccgtggcg cagcgtgagc gcgcgcagca gcagggcaac ctgggctcca tggttgcact 2580

aaacgccttc ctgagtacac agcccgccaa cgtgccgcgg ggacaggagg actacaccaa 2640

ctttgtgagc gcactgcggc taatggtgac tgagacaccg caaagtgagg tgtaccagtc 2700

cgggccagac tattttttcc agaccagtag acaaggcctg cagaccgtaa acctgagcca 2760

ggctttcaag aacttgcagg ggctgtgggg ggtgcgggct cccacaggcg accgcgcgac 2820

cgtgtctagc ttgctgacgc ccaactcgcg cctgttgctg ctgctaatag cgcccttcac 2880

ggacagtggc agcgtgtccc gggacacata cctaggtcac ttgctgacac tgtaccgcga 2940

ggccataggt caggcgcatg tggacgagca tactttccag gagattacaa gtgtcagccg 3000

cgcgctgggg caggaggaca cgggcagcct ggaggcaacc ctgaactacc tgctgaccaa 3060

ccggcggcag aagatcccct cgttgcacag tttaaacagc gaggaggagc gcatcttgcg 3120

ctatgtgcag cagagcgtga gccttaacct gatgcgcgac ggggtaacgc ccagcgtggc 3180

gctggacatg accgcgcgca acatggaacc gggcatgtat gcctcaaacc ggccgtttat 3240

caatcgccta atggactact tgcatcgcgc ggccgccgtg aaccccgagt atttcaccaa 3300

tgccatcttg aacccgcact ggctaccgcc ccctggtttc tacaccgggg gatttgaggt 3360

gcccgagggt aacgatggat tcctctggga cgacatagac gacagcgtgt tttccccgca 3420

accgcagacc ctgctagagt tgcaacagcg cgagcaggca gaggcggcgc tgcgaaagga 3480

aagcttccgc aggccaagca gcttgtccga tctaggcgct gcggccccgc ggtcagatgc 3540

gagtagccca tttccaagct tgatagggtc ttttaccagc actcgcacca cccgcccgcg 3600

cctgctgggc gaggaggagt acctaaacaa ctcgctgctg cagccgcagc gcgaaaagaa 3660

cctgcctccg gcatttccca acaacgggat agagagccta gtggacaaga tgagtagatg 3720

gaagacgtat gcgcaggagc acagggatgt gcccggcccg cgcccgccca cccgtcgtca 3780

aaggcacgac cgtcagcggg gtctggtgtg ggaggacgat gactcggcag acgacagcag 3840

cgtcctggat ttgggaggga gtggcaaccc gtttgcgcac cttcgcccca ggctggggag 3900

aatgttttaa aaaaaaaaaa aaaaagcatg atgcaaaata aaaaactcac caaggccatg 3960

gcaccgagcg ttggttttct tgtattcccc ttagtatgca gcgcgcggcg atgtatgagg 4020

aaggtcctcc tccctcctac gagagcgtgg tgagcgcggc gccagtggcg gcggcgctgg 4080

gttccccctt cgatgctccc ctggacccgc cgtttgtgcc tccgcggtac ctgcggccta 4140

ccggggggag aaacagcatc cgttactctg agttggcacc cctattcgac accacccgtg 4200

tgtaccttgt ggacaacaag tcaacggatg tggcatccct gaactaccag aacgaccaca 4260

gcaactttct aaccacggtc attcaaaaca atgactacag cccgggggag gcaagcacac 4320

agaccatcaa tcttgacgac cgttcgcact ggggcggcga cctgaaaacc atcctgcata 4380

ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa gtttaaggcg cgggtgatgg 4440

tgtcgcgctc gcttactaag gacaaacagg tggagctgaa atatgagtgg gtggagttca 4500

cgctgcccga gggcaactac tccgagacca tgaccataga ccttatgaac aacgcgatcg 4560

tggagcacta cttgaaagtg ggcaggcaga acggggttct ggaaagcgac atcggggtaa 4620

agtttgacac ccgcaacttc agactggggt ttgacccagt cactggtctt gtcatgcctg 4680

gggtatatac aaacgaagcc ttccatccag acatcatttt gctgccagga tgcggggtgg 4740

acttcaccca cagccgcctg agcaacttgt tgggcatccg caagcggcaa cccttccagg 4800

agggctttag gatcacctac gatgacctgg agggtggtaa cattcccgca ctgttggatg 4860

tggacgccta ccaggcaagc ttaaaagatg acaccgaaca gggcggggat ggcgcaggcg 4920

gcggcaacaa cagtggcagc ggcgcggaag agaactccaa cgcggcagcc gcggcaatgc 4980

agccggtgga ggacatgaac gatcatgcca ttcgcggcga cacctttgcc acacgggcgg 5040

aggagaagcg cgctgaggcc gaggcagcgg cagaagctgc cgcccccgct gcgcaacccg 5100

aggtcgagaa gcctcagaag aaaccggtga tcaaacccct gacagaggac agcaagaaac 5160

gcagttacaa cctaataagc aatgacagca ccttcaccca gtaccgcagc tggtaccttg 5220

catacaacta cggcgaccct cagaccggga tccgctcatg gaccctcctt tgcactcctg 5280

acgtaacctg cggctcggag caggtctact ggtcgttgcc agacatgatg caagaccccg 5340

tgaccttccg ctccacgagc cagatcagca actttccggt ggtgggcgcc gagctgttgc 5400

ccgtgcactc caagagcttc tacaacgacc aggccgtcta ctcccagctc atccgccagt 5460

ttacctctct gacccacgtg ttcaatcgct ttcccgagaa ccagattttg gcgcgcccgc 5520

cagcccccac catcaccacc gtcagtgaaa acgttcctgc tctcacagat cacgggacgc 5580

taccgctgcg caacagcatc ggaggagtcc agcgagtgac cattactgac gccagacgcc 5640

gcacctgccc ctacgtttac aaggccctgg gcatagtctc gccgcgcgtc ctatcgagcc 5700

gcactttttg agcaaacatg tccatcctta tatcgcccag caataacaca ggctggggcc 5760

tgcgcttccc aagcaagatg tttggcgggg caaagaagcg ctccgaccaa cacccagtgc 5820

gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa acgcggccgc actgggcgca 5880

ccaccgtcga tgacgccatt gacgcggtgg tggaggaggc gcgcaactac acgcccacgc 5940

cgccaccagt gtccacagtg gacgcggcca ttcagaccgt ggtgcgcgga gcccggcgtt 6000

atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg ccaccgccgc cgacccggca 6060

ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc acgtcgcacc ggccgacggg 6120

cggccatgcg ggccgctcga aggctggccg cgggtattgt cactgtgccc cccaggtcca 6180

ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc tatgactcag ggtcgcaggg 6240

gcaacgtgta ctgggtgcgc gactcggtta gcggcctgcg cgtgcccgtg cgcacccgcc 6300

ccccgcgcaa ctagattgca agaaaaaact acttagactc gtactgttgt atgtatccag 6360

cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat caaagaagag atgctccagg 6420

tcatcgcgcc ggagatctat ggccccccga agaaggaaga gcaggattac aagccccgaa 6480

agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga tgatgaactt gacgacgagg 6540

tggaactgct gcacgcaacc gcgcccaggc ggcgggtaca gtggaaaggt cgacgcgtaa 6600

gacgtgtttt gcgacccggc accaccgtag tttttacgcc cggtgagcgc tccacccgca 6660

cctacaagcg cgtgtatgat gaggtgtacg gcgacgagga cctgcttgag caggccaacg 6720

agcgcctcgg ggagtttgcc tacggaaagc ggcataagga catgttggcg ttgccgctgg 6780

acgagggcaa cccaacacct agcctaaagc ccgtgacact gcagcaggtg ctgcccacgc 6840

ttgcaccgtc cgaagaaaag cgcggcctaa agcgcgagtc tggtgacttg gcacccaccg 6900

tgcagctgat ggtacccaag cgccagcgac tggaagatgt cttggaaaaa atgaccgtgg 6960

agcctgggct ggagcccgag gtccgcgtgc ggccaatcaa gcaggtggca ccgggactgg 7020

gcgtgcagac cgtggacgtt cagataccca ccaccagtag cactagtatt gccactgcca 7080

cagagggcat ggagacacaa acgtccccgg ttgcctcggc ggtggcagat gccgcggtgc 7140

aggcggccgc tgcggccgcg tccaaaacct ctacggaggt gcaaacggac ccgtggatgt 7200

ttcgcgtttc agccccccgg cgcccgcgcc gttccaggaa gtacggcacc gccagcgcac 7260

tactgcccga atatgcccta catccttcca tcgcgcctac ccccggctat cgtggctaca 7320

cctaccgccc cagaagacga gcgactaccc gacgccgaac caccactgga acccgccgcc 7380

gccgtcgccg tcgccagccc gtgctggccc cgatttccgt gcgcagggtg gctcgcgaag 7440

gaggcaggac cctggtgctg ccaacagcgc gctaccaccc cagcatcgtt taaaagccgg 7500

tctttgtggt tcttgcagat atggccctca cctgccgcct ccgtttcccg gtgccgggat 7560

tccgaggaag aatgcaccgt aggaggggca tggccggcca cggcctgacg ggcggcatgc 7620

gtcgtgcgca ccaccggcgg cggcgcgcgt cgcaccgtcg catgcgcggc ggtatcctgc 7680

ccctccttat tccactgatc gccgcggcga ttggcgccgt gcccggaatt gcatccgtgg 7740

ccttgcaggc gcagagacac tgattaaaaa caagttgcat gtggaaaaat caaaataaaa 7800

agtctggagt ctcacgctcg cttggtcctg taactatttt gtagaatgga agacatcaac 7860

tttgcgtctc tggccccgcg acacggctcg cgcccgttca tgggaaactg gcaagatatc 7920

ggcaccagca atatgagcgg tggcgccttc agctggggct cgctgtggag cggcattaaa 7980

aatttcggtt ccaccattaa gaactatggc agcaaggcct ggaacagcag cacaggccag 8040

atgctgaggg acaagttgaa agagcaaaat ttccaacaaa aggtggtaga tggcctggcc 8100

tctggcatta gcggggtggt ggacctggcc aaccaggcag tgcaaaataa gattaacagt 8160

aagcttgatc cccgccctcc cgtagaggag cctccaccgg ccgtggagac agtgtctcca 8220

gaggggcgtg gcgaaaagcg tccgcggccc gacagggaag aaactctggt gacgcaaata 8280

gatgagcctc cctcgtacga ggaggcacta aagcaaggcc tgcccaccac ccgtcccatc 8340

gcgcccatgg ctaccggagt gctgggccag cacacacctg taacgctgga cctgcctccc 8400

cccgctgaca cccagcagaa acctgtgctg ccagggccgt ccgccgttgt tgtaacccgc 8460

cctagccgcg cgtccctgcg ccgtgccgcc agcggtccgc gatcgatgcg gcccgtagcc 8520

agtggcaact ggcaaagcac actgaacagc atcgtgggtc tgggggtgca atccctgaag 8580

cgccgacgat gcttctaaat agctaacgtg tcgtatgtgt catgtatgcg tccatgtcgc 8640

cgccagagga gctgctgagc cgccgtgcgc ccgctttcca agatggctac cccttcgatg 8700

atgccgcagt ggtcttacat gcacatctcg ggccaggacg cctcggagta cctgagcccc 8760

gggctggtgc agtttgcccg cgccaccgag acgtacttca gcctgaataa caagtttaga 8820

aaccccacgg tggcacctac gcacgacgta accacagacc ggtcccagcg tttgacgctg 8880

cggttcatcc ctgtggaccg cgaggatacc gcgtactcgt acaaagcgcg gttcaccctg 8940

gctgtgggtg acaaccgtgt gcttgatatg gcttccacgt actttgacat ccgcggcgtg 9000

ctggacaggg ggcctacttt taagccctac tccggcactg cctacaacgc tctagctccc 9060

aagggcgctc ctaactcctg tgagtgggaa caaaccgaag atagcggccg ggcagttgcc 9120

gaggatgaag aagaggaaga tgaagatgaa gaagaggaag aagaagagca aaacgctcga 9180

gatcaggcta ctaagaaaac acatgtctat gcccaggctc ctttgtctgg agaaacaatt 9240

acaaaaagcg ggctacaaat aggatcagac aatgcagaaa cacaagctaa acctgtatac 9300

gcagatcctt cctatcaacc agaacctcaa attggcgaat ctcagtggaa cgaagctgat 9360

gctaatgcgg caggagggag agtgcttaaa aaaacaactc ccatgaaacc atgctatgga 9420

tcttatgcca ggcctacaaa tccttttggt ggtcaatccg ttctggttcc ggatgaaaaa 9480

ggggtgcctc ttccaaaggt tgacttgcaa ttcttctcaa atactacctc tttgaacgac 9540

cggcaaggca atgctactaa accaaaagtg gttttgtaca gtgaagatgt aaatatggaa 9600

accccagaca cacatctgtc ttacaaacct ggaaaaggtg atgaaaattc taaagctatg 9660

ttgggtcaac aatctatgcc aaacagaccc aattacattg ctttcaggga caattttatt 9720

ggcctaatgt attataacag cactggcaac atgggtgttc ttgctggtca ggcatcgcag 9780

ctaaatgccg tggtagattt gcaagacaga aacacagagc tgtcctatca actcttgctt 9840

gattccatag gtgatagaac cagatatttt tctatgtgga atcaggctgt agacagctat 9900

gatccagatg ttagaatcat tgaaaaccat ggaactgagg atgaattgcc aaattattgt 9960

tttcctcttg ggggtattgg ggtaactgac acctatcaag ctattaaggc taatggcaat 10020

ggctcaggcg ataatggaga tactacatgg acaaaagatg aaacttttgc aacacgtaat 10080

gaaataggag tgggtaacaa ctttgccatg gaaattaacc taaatgccaa cctatggaga 10140

aatttccttt actccaatat tgcgctgtac ctgccagaca agctaaaata caaccccacc 10200

aatgtggaaa tatctgacaa ccccaacacc tacgactaca tgaacaagcg agtggtggct 10260

cccgggcttg tagactgcta cattaacctt ggggcgcgct ggtctctgga ctacatggac 10320

aacgttaatc cctttaacca ccaccgcaat gcgggcctcc gttatcgctc catgttgttg 10380

ggaaacggcc gctacgtgcc ctttcacatt caggtgcccc aaaagttttt tgccattaaa 10440

aacctcctcc tcctgccagg ctcatataca tatgaatgga acttcaggaa ggatgttaac 10500

atggttctgc agagctctct gggaaacgat cttagagttg acggggctag cattaagttt 10560

gacagcattt gtctttacgc caccttcttc cccatggccc acaacacggc ctccacgctg 10620

gaagccatgc tcagaaatga caccaacgac cagtccttta atgactacct ttccgccgcc 10680

aacatgctat accccatacc cgccaacgcc accaacgtgc ccatctccat cccatcgcgc 10740

aactgggcag catttcgcgg ttgggccttc acacgcttga agacaaagga aaccccttcc 10800

ctgggatcag gctacgaccc ttactacacc tactctggct ccataccata ccttgacgga 10860

accttctatc ttaatcacac ctttaagaag gtggccatta cctttgactc ttctgttagc 10920

tggccgggca acgaccgcct gcttactccc aatgagtttg agattaaacg ctcagttgac 10980

ggggagggct acaacgtagc tcagtgcaac atgaccaagg actggttcct ggtgcagatg 11040

ttggccaact acaatattgg ctaccagggc ttctacattc cagaaagcta caaggaccgc 11100

atgtactcgt tcttcagaaa cttccagccc atgagccggc aagtggttga cgatactaaa 11160

tacaaggagt atcagcaggt tggaattctt caccagcata acaactcagg attcgtaggc 11220

tacctcgctc ccaccatgcg cgagggacag gcttaccccg ccaacgtgcc ctacccacta 11280

ataggcaaaa ccgcggttga cagtattacc cagaaaaagt ttctttgcga tcgcaccctt 11340

tggcgcatcc cattctccag taactttatg tccatgggcg cactcacaga cctgggccaa 11400

aaccttctct acgccaactc cgcccacgcg ctagacatga cttttgaggt ggatcccatg 11460

gacgagccca cccttcttta tgttttgttt gaagtctttg acgtggtccg tgtgcaccag 11520

ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc 11580

acaacataaa agaagcaagc aacatcaaca acagctgccg ccatgggctc cagtgagcag 11640

gaactgaaag ccattgtcaa agatcttggt tgtgggccat attttttggg cacctatgac 11700

aagcgctttc caggctttgt ttctccacac aagctcgcct gcgccatagt caatacggcc 11760

ggtcgcgaga ctgggggcgt acactggatg gcctttgcct ggaacccgcg ctcaaaaaca 11820

tgctacctct ttgagccctt tggcttttct gaccaacgac tcaagcaggt ttaccagttt 11880

gagtacgagt cactcctgcg ccgtagcgcc attgcttctt cccccgaccg ctgtataacg 11940

ctggaaaagt ccacccaaag cgtgcagggg cccaactcgg ccgcctgtgg actattctgc 12000

tgcatgtttc tccacgcctt tgccaactgg ccccaaactc ccatggatca caaccccacc 12060

atgaacctta ttaccggggt acccaactcc atgcttaaca gtccccaggt acagcccacc 12120

ctgcgtcgca accaggaaca gctctacagc ttcctggagc gccactcgcc ctacttccgc 12180

agccacagtg cgcagattag gagcgccact tctttttgtc acttgaaaaa catgtaaaaa 12240

taatgtacta ggagacactt tcaataaagg caaatgtttt tatttgtaca ctctcgggtg 12300

attatttacc ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg 12360

catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 12420

actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcacca 12480

tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 12540

cctgcgcgcg cgagttgcga tacacagggt tgcagcactg gaacactatc agcgccgggt 12600

ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 12660

tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggt gcatgcccag 12720

gctttgagtt gcactcgcac cgtagtggca tcagaaggtg accgtgcccg gtctgggcgt 12780

taggatacag cgcctgcatg aaagccttga tctgcttaaa agccacctga gcctttgcgc 12840

cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 12900

catgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 12960

tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 13020

tcacatccat ttcaatcacg tgctccttat ttatcataat gctcccgtgt agacacttaa 13080

gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtggt 13140

gcttgtaggt tacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 13200

tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgtttagcc 13260

aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagcttg aagtttgcct 13320

ttagatcgtt atccacgtgg tacttgtcca tcaacgcgcg cgcagcctcc atgcccttct 13380

cccacgcaga cacgatcggc aggctcagcg ggtttatcac cgtgctttca ctttccgctt 13440

cactggactc ttccttttcc tcttgcgtcc gcataccccg cgccactggg tcgtcttcat 13500

tcagccgccg caccgtgcgc ttacctccct tgccgtgctt gattagcacc ggtgggttgc 13560

tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgatcacct 13620

ctggggatgg cgggcgctcg ggcttgggag aggggcgctt ctttttcttt ttggacgcaa 13680

tggccaaatc cgccgtcgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcat 13740

cttgtgacga gtcttcttcg tcctcggact cgagacgccg cctcagccgc ttttttgggg 13800

gcgcgcgggg aggcggcggc gacggcgacg gggacgacac gtcctccatg gttggtggac 13860

gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 13920

ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag gaggacagcc 13980

taaccgcccc ctttgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 14040

ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 14100

gttttgtaag cgaagacgac gaggatcgct cagtaccaac agaggataaa aagcaagacc 14160

aggacgacgc agaggcaaac gaggaacaag tcgggcgggg ggaccaaagg catggcgact 14220

acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 14280

gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 14340

acgaacgcca cctgttctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 14400

agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 14460

atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 14520

cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcgacg 14580

aagtgccaaa aatctttgag ggtcttggac gcgacgagaa acgcgcggca aacgctctgc 14640

aacaagaaaa cagcgaaaat gaaagtcact gtggagtgct ggtggaactt gagggtgaca 14700

acgcgcgcct agccgtgctg aaacgcagca tcgaggtcac ccactttgcc tacccggcac 14760

ttaacctacc ccccaaggtt atgagcacag tcatgagcga gctgatcgtg cgccgtgcac 14820

gacccctgga gagggatgca aacttgcaag aacaaaccga ggagggccta cccgcagttg 14880

gcgatgagca gctggcgcgc tggcttgaga cgcgcgagcc tgccgacttg gaggagcgac 14940

gcaagctaat gatggccgca gtgcttgtta ccgtggagct tgagtgcatg cagcggttct 15000

ttgctgaccc ggagatgcag cgcaagctag aggaaacgtt gcactacacc tttcgccagg 15060

gctacgtgcg ccaggcctgc aaaatttcca acgtggagct ctgcaacctg gtctcctacc 15120

ttggaatttt gcacgaaaac cgcctcgggc aaaacgtgct tcattccacg ctcaagggcg 15180

aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctgtgctac acctggcaaa 15240

cggccatggg cgtgtggcag caatgcctgg aggagcgcaa cctaaaggag ctgcagaagc 15300

tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 15360

acctggcgga cattatcttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 15420

acttcaccag tcaaagcatg ttgcaaaact ttaggaactt tatcctagag cgttcaggaa 15480

ttctgcccgc cacctgctgt gcgcttccta gcgactttgt gcccattaag taccgtgaat 15540

gccctccgcc gctttggggt cactgctacc ttctgcagct agccaactac cttgcctacc 15600

actccgacat catggaagac gtgagcggtg acggcctact ggagtgtcac tgtcgctgca 15660

acctatgcac cccgcaccgc tccctggtct gcaattcgca actgcttagc gaaagtcaaa 15720

ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 15780

tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 15840

accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 15900

ccgcctgcgt cattacccag ggccacatcc ttggccaatt gcaagccatc aacaaagccc 15960

gccaagagtt tctgctacga aagggacggg gggtttacct ggacccccag tccggcgagg 16020

agctcaaccc aatccccccg ccgccgcagc cctatcagca gccgcgggcc cttgcttccc 16080

aggatggcac ccaaaaagaa gctgcagctg ccgccgccgc cacccacgga cgaggaggaa 16140

tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggagatgat ggaagactgg 16200

gacagcctag acgaagcttc cgaggccgaa gaggtgtcag acgaaacacc gtcaccctcg 16260

gtcgcattcc cctcgccggc gccccagaaa ttggcaaccg ttcccagcat cgctacaacc 16320

tccgctcctc aggcgccgcc ggcactgcct gttcgccgac ccaaccgtag atgggacacc 16380

actggaacca gggccggtaa gtctaagcag ccgccgccgt tagcccaaga gcaacaacag 16440

cgccaaggct accgctcgtg gcgcgggcac aagaacgcca tagttgcttg cttgcaagac 16500

tgtgggggca acatctcctt cgcccgccgc tttcttctct accatcacgg cgtggccttc 16560

ccccgtaaca tcctgcatta ctaccgtcat ctctacagcc cctactgcac cggcggcagc 16620

ggcagcggca gcaacagcag cggtcacaca gaagcaaagg cgaccggata gcaagactct 16680

gacaaagccc aagaaatcca cagcggcggc agcagcagga ggaggagcgc tgcgtctggc 16740

gcccaacgaa cccgtatcga cccgcgagct tagaaatagg atttttccca ctctgtatgc 16800

tatatttcaa caaagcaggg gccaagaaca agagctgaaa ataaaaaaca ggtctctgcg 16860

ctccctcacc cgcagctgcc tgtatcacaa aagcgaagat cagcttcggc gcacgctgga 16920

agacgcggag gctctcttca gcaaatactg cgcgctgact cttaaggact agtttcgcgc 16980

cctttctcaa atttaagcgc gaaaactacg tcatctccag cggccacacc cggcgccagc 17040

acctgtcgtc agcgccatta tgagcaagga aattcccacg ccctacatgt ggagttacca 17100

gccacaaatg ggacttgcgg ctggagctgc ccaagactac tcaacccgaa taaactacat 17160

gagcgcggga ccccacatga tatcccgggt caacggaatc cgcgcccacc gaaaccgaat 17220

tctcctcgaa caggcggcta ttaccaccac acctcgtaat aaccttaatc cccgtagttg 17280

gcccgctgcc ctggtgtacc aggaaagtcc cgctcccacc actgtggtac ttcccagaga 17340

cgcccaggcc gaagttcaga tgactaactc aggggcgcag cttgcgggcg gctttcgtca 17400

cagggtgcgg tcgcccgggc agggtataac tcacctgaaa atcagagggc gaggtattca 17460

gctcaacgac gagtcggtga gctcctctct tggtctccgt ccggacggga catttcagat 17520

cggcggcgct ggccgctctt catttacgcc ccgtcaggcg atcctaactc tgcagacctc 17580

gtcctcggag ccgcgctccg gaggcattgg aactctacaa tttattgagg agttcgtgcc 17640

ttcggtttac ttcaacccct tttctggacc tcccggccac tacccggacc agtttattcc 17700

caactttgac gcggtgaaag actcggcgga cggctacgac tgaatgacca gtggagaggc 17760

agagcgactg cgcctgacac acctcgacca ctgccgccgc cacaagtgct ttgcccgcgg 17820

ctccggtgag ttttgttact ttgaattgcc cgaagagcat atcgagggcc cggcgcacgg 17880

cgtccggctc accacccagg tagagcttac acgtagcctg attcgggagt ttaccaagcg 17940

ccccctgcta gtggagcggg agcggggtcc ctgtgttctg accgtggttt gcaactgtcc 18000

taaccctgga ttacatcaag atctttgttg tcatctctgt gctgagtata ataaatacag 18060

aaattagaat ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtt tttacccacc 18120

caaagcagac caaagcaaac ctcacctccg gtttgcacaa gcgggccaat aagtacctta 18180

cctggtactt taacggctct tcatttgtaa tttacaacag tttccagcga gacgaagtaa 18240

gtttgccaca caaccttctc ggcttcaact acaccgtcaa gaaaaacacc accaccacca 18300

ccctcctcac ctgccgggaa cgtacgagtg cgtcaccggt tgctgcgccc acacctacag 18360

cctgagcgta accagacatt actcccattt ttccaaaaca ggaggtgagc tcaactcccg 18420

gaactcaggt caaaaaagca ttttgcgggg tgctgggatt ttttaattaa gtatatgagc 18480

aattcaagta actctacaag cttgtctaat ttttctggaa ttggggtcgg ggttatcctt 18540

actcttgtaa ttctgtttat tcttatacta gcacttctgt gccttagggt tgccgcctgc 18600

tgcacgcacg tttgtaccta ttgtcagctt tttaaacgct gggggcaaca tccaagatga 18660

ggtacatgat tttaggcttg ctcgcccttg cggcagtctg cagcgctgcc aaaaaggttg 18720

agtttaagga accagcttgc aatgttacat ttaaatcaga agctaatgaa tgcactactc 18780

ttataaaatg caccacagaa catgaaaagc ttattattcg ccacaaagac aaaattggca 18840

agtatgctgt atatgctatt tggcagccag gtgacactaa cgactataat gtcacagtct 18900

tccaaggtga aaatcgtaaa acttttatgt ataaatttcc attttatgaa atgtgcgata 18960

ttaccatgta catgagcaaa cagtacaagt tgtggccccc acaaaagtgt ttagagaaca 19020

ctggcacctt ttgttccacc gctctgctta ttacagcgct tgctttggta tgtaccttac 19080

tttatctcaa atacaaaagc agacgcagtt ttattgatga aaagaaaatg ccttgatttt 19140

ccgcttgctt gtattcccct ggacaattta ctctatgtgg gatatgctcc aggcgggcaa 19200

gattataccc acaaccttca aatcaaactt tcctggacgt tagcgcctga tttctgccag 19260

cgcctgcact gcaaatttga tcaaacccag cttcagcttg cctgctccag agatgaccgg 19320

ctcaaccatc gcgcccacaa cggactatcg caacaccact gctaccggac taacatctgc 19380

cctaaattta ccccaagttc atgcctttgt caatgactgg gcgagcttgg acatgtggtg 19440

gttttccata gcgcttatgt ttgtttgcct tattattatg tggcttattt gttgcctaaa 19500

gcgcagacgc gccagacccc ccatctatag gcctatcatt gtgctcaacc cacacaatga 19560

aaaaattcat agattggacg gtctgaaacc atgttctctt cttttacagt atgattaaat 19620

gagacatgat tcctcgagtt cttatattat tgacccttgt tgcgcttttc tgtgcgtgct 19680

ctacattggc cgcggtcgct cacatcgaag tagattgcat cccacctttc acagtttacc 19740

tgctttacgg atttgtcacc cttatcctca tctgcagcct cgtcactgta gtcatcgcct 19800

tcattcagtt cattgactgg gtttgtgtgc gcattgcgta cctcaggcac catccgcaat 19860

acagagacag gactatagct gatcttctca gaattcttta attatgaaac ggagtgtcat 19920

ttttgttttg ctgatttttt gcgccctacc tgtgctttgc tcccaaacct cagcgcctcc 19980

caaaagacat atttcctgca gattcactca aatatggaac attcccagct gctacaacaa 20040

acagagcgat ttgtcagaag cctggttata cgccatcatc tctgtcatgg ttttttgcag 20100

taccattttt gccctagcca tatatccata ccttgacatt ggctggaatg ccatagatgc 20160

catgaaccac cctactttcc cagtgcccgc tgtcatacca ctgcaacagg ttattgcccc 20220

aatcaatcag cctcgccccc cttctcccac ccccactgag attagctact ttaatttgac 20280

aggtggagat gactgaatct ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat 20340

ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 20400

ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 20460

cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 20520

tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 20580

ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 20640

taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 20700

agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 20760

cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 20820

tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 20880

tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 20940

gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 21000

acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 21060

acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 21120

cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 21180

gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 21240

gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 21300

agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 21360

ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 21420

ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 21480

atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 21540

tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 21600

gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 21660

ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 21720

caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 21780

cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 21840

cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 21900

cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 21960

agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 22020

tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 22080

agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 22140

atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 22200

ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 22260

cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 22320

caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 22380

attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 22440

agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 22500

aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 22560

gtc 22563

<210> 105

<211> 8350

<212> DNA

<213> 人工

<220>

<223> 质粒psyx20-lacIq

<400> 105

cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 60

gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 120

gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 180

ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 240

agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 300

ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 360

gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 420

ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 480

ttaacaaaaa tttaacgcga attttaacaa aattcgaccg atgcccttga gagccttcaa 540

cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac ttatgactgt 600

cttctttatc atgcaactcg taggacaggt gccggcagcg ctctgggtca ttttcggcga 660

ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg cttgcggtat tcggaatctt 720

gcacgccctc gctcaagcct tcgtcactgg tcccgccacc aaacgtttcg gcgagaagca 780

ggccattatc gccggcatgg cggccgacgc gctgggctac gtcttgctgg cgttcgcgac 840

gcgaggctgg atggccttcc ccattatgat tcttctcgct tccggcggca tcgggatgcc 900

cgcgttgcag gccatgctgt ccaggcaggt agatgacgac catcagggac agcttcaagg 960

atcgctcgcg gctcttacca gcctaacttc gatcattgga ccgctgatcg tcacggcgat 1020

ttatgccgcc tcggcgagca catggaacgg gttggcatgg attgtaggcg ccgccctata 1080

ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc cgggccacct cgacctgaat 1140

ggaagccggc ggcacctcgc taacggattc accactccgc agacccgcca taaaacgccc 1200

tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 1260

aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 1320

aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 1380

gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 1440

gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 1500

gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 1560

tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 1620

cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 1680

ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 1740

gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 1800

atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 1860

gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 1920

tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 1980

tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 2040

aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 2100

tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 2160

atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 2220

taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 2280

ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 2340

ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 2400

agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 2460

tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 2520

ttacatcaga ttcctaccta cataacggac taagaaaaac actacacgat gctttaactg 2580

caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagtatg 2640

atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 2700

tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 2760

agactaacaa acaaaagtag aacaactgtt caccgttaca tatcaaaggg aaaactgtcc 2820

atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 2880

ggtgcattca aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 2940

acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 3000

ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 3060

cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 3120

tcatggcaat tctggaagaa atagcgcttt cagccggcaa accggctgaa gccggatctg 3180

cgattctgat aacaaactag caacaccaga acagcccgtt tgcgggcagc aaaacccgta 3240

cttttggacg ttccggcggt tttttgtggc gagtggtgtt cgggcggtgc gcgattattg 3300

aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 3360

taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 3420

cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca 3480

agaattcgcg cgcgaaggcc aagcggcatg catttacgtt gacaccatcg aatggcgcaa 3540

aacctttcgc ggtatggcat gatagcgccc ggaagagagt caattcaggg tggtgaatgt 3600

gaaaccagta acgttatacg atgtcgcaga gtatgccggt gtctcttatc agaccgtttc 3660

ccgcgtggtg aaccaggcca gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc 3720

gatggcggag ctgaattaca ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc 3780

gttgctgatt ggcgttgcca cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc 3840

ggcgattaaa tctcgcgccg atcaactggg tgccagcgtg gtggtgtcga tggtagaacg 3900

aagcggcgtc gaagcctgta aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg 3960

gctgatcatt aactatccgc tggatgacca ggatgccatt gctgtggaag ctgcctgcac 4020

taatgttccg gcgttatttc ttgatgtctc tgaccagaca cccatcaaca gtattatttt 4080

ctcccatgaa gacggtacgc gactgggcgt ggagcatctg gtcgcattgg gtcaccagca 4140

aatcgcgctg ttagcgggcc cattaagttc tgtctcggcg cgtctgcgtc tggctggctg 4200

gcataaatat ctcactcgca atcaaattca gccgatagcg gaacgggaag gcgactggag 4260

tgccatgtcc ggttttcaac aaaccatgca aatgctgaat gagggcatcg ttcccactgc 4320

gatgctggtt gccaacgatc agatggcgct gggcgcaatg cgcgccatta ccgagtccgg 4380

gctgcgcgtt ggtgcggata tctcggtagt gggatacgac gataccgaag acagctcatg 4440

ttatatcccg ccgtcaacca ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt 4500

ggaccgcttg ctgcaactct ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt 4560

ctcactggtg aaaagaaaaa ccaccctggc gcccaatacg caaaccgcct ctccccgcgc 4620

gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg 4680

agcgcaacgc aattaatgtg agttagctca ctcattaggc gaattctcat gtttgacagc 4740

ttatcatcga taagctttaa tgcggtagtt tatcacagtt aaattgctaa cgcagtcagg 4800

caccgtgtat gaaatctaac aatgcgctca tcgtcatcct cggcaccgtc accctggatg 4860

ctgtaggcat aggcttggtt atgccggtac tgccgggcct cttgcgggat atcgtccatt 4920

ccgacagcat cgccagtcac tatggcgtgc tgctagcgct atatgcgttg atgcaatttc 4980

tatgcgcacc cgttctcgga gcactgtccg accgctttgg ccgccgccca gtcctgctcg 5040

cttcgctact tggagccact atcgactacg cgatcatggc gaccacaccc gtcctgtgga 5100

tcctctacgc cggacgcatc gtggccggca tcaccggcgc cacaggtgcg gttgctggcg 5160

cctatatcgc cgacatcacc gatggggaag atcgggctcg ccacttcggg ctcatgagcg 5220

cttgtttcgg cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg ggcgccatct 5280

ccttgcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct 5340

gcttcctaat gcaggaatcg cataagggag agcgtcgacc gatgcccttg agagccttca 5400

acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg 5460

tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc attttcggcg 5520

aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta ttcggaatct 5580

tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc ggcgagaagc 5640

aggccattat cgccggcatg gcggccgacg cgctgggcta cgtcttgctg gcgttcgcga 5700

cgcgaggctg gatggccttc cccattatga ttcttctcgc ttccggcggc atcgggatgc 5760

ccgcgttgca ggccatgctg tccaggcagg tagatgacga ccatcaggga cagcttcaag 5820

gatcgctcgc ggctcttacc agcctaactt cgatcattgg accgctgatc gtcacggcga 5880

tttatgccgc ctcggcgagc acatggaacg ggttggcatg gattgtaggc gccgccctat 5940

accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 6000

tggaagccgg cggcacctcg ctaacggatt caccactcca agaattggag ccaatcaatt 6060

cttgcggaga actgtgaatg cgcaaaccaa cccttggcag aacatatcca tcgcgtccgc 6120

catctccagc agccgcacgc ggcgcatctc gggcagcgtt gggtcctggc cacgggtgcg 6180

catgatcgtg ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta 6240

gcagaatgaa tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc 6300

gacctgagca acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg 6360

gaagtcagcg ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc 6420

ctgtggaaca cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct 6480

ctggtcccgc cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc 6540

atgttcatca tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac 6600

ccccatgaac agaaatcccc cttacacgga ggcatcagtg accaaacagg aaaaaaccgc 6660

ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga aactcaacga 6720

gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg ctgatgagct 6780

ttaccgcagc gcgcagggtc agcctgaata cgcgtttaat gaccagcaca gtcgtgatgg 6840

caaggtcaga atagcgctga ggtctgcctc gtgaagaagg tgttgctgac tcataccagg 6900

cctgaatcgc cccatcatcc agccagaaag tgagggagcc acggttgatg agagctttgt 6960

tgtaggtgga ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt 7020

cgggaagatg cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc 7080

acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa 7140

caataaaact gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac 7200

gggaaacgtc ttgctcgagg ccgcgattaa attccaacat ggatgctgat ttatatgggt 7260

ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga 7320

agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta 7380

cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc 7440

attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc gggaaaacag 7500

cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag 7560

tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg 7620

tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt 7680

ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataagcttt 7740

tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt 7800

ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat 7860

accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac 7920

ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga 7980

tgctcgatga gtttttctaa tcagaattgg ttaattggtt gtaacactgg cagagcatta 8040

cgctgacttg acgggacggc ggctttgttg aataaatcga acttttgctg agttgaagga 8100

tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat 8160

caccaactgg tccacctaca acaaagctct catcaaccgt ggctccctca ctttctggct 8220

ggatgatggg gcgattcagg cctggtatga gtcagcaaca ccttcttcac gaggcagacc 8280

tcagcgctat tctgaccttg ccatcacgac tgtgctggtc attaaacgcg tattcaggct 8340

gaccctgcgc 8350

<210> 106

<211> 3190

<212> DNA

<213> 人工

<220>

<223> pAGR3

<400> 106

aagtgaccaa acaggaaaaa accgccctta acatggcccg ctttatcaga agccagacat 60

taacgcttct ggagaaactc aacgagctgg acgcggatga acaggcagac atctgtgaat 120

cgcttcacga ccacgctgat gagctttacc gcagctgcct cgcgcgtttc ggtgatgacg 180

gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 240

ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 300

ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga 360

gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 420

aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 480

tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 540

aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 600

aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 660

tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 720

ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 780

cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 840

ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 900

ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 960

gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1020

agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 1080

cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1140

aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1200

aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1260

ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1320

aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1380

ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 1440

agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 1500

cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 1560

ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 1620

gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 1680

cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 1740

cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 1800

ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 1860

catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 1920

tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 1980

ctcttgcccg gcgtcaacac gggataatac cgcgccacat agcagaactt taaaagtgct 2040

catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2100

cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2160

cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2220

acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2280

ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2340

tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 2400

attaacctat aaaaataggc gtatcacgag gccctttcgt cttcaagaat taattcccaa 2460

ttccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 2520

ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 2580

tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggaatta 2640

attccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 2700

gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg 2760

ttgcgaagca acggcccgga gggtggcggg caggacgccc gccataaact gccaggaatt 2820

aattccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 2880

tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac 2940

gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggaat 3000

taattccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 3060

ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgggag cggatttgaa 3120

cgttgcgaag caacggcccg gagggtggcg ggcaggacgc ccgccataaa ctgccaggaa 3180

ttggggatcg 3190

相关技术
  • 高保真度限制性内切核酸酶
  • 高保真度限制性内切核酸酶
技术分类

06120113152980