高保真度限制性内切核酸酶
文献发布时间:2023-06-19 12:04:09
本申请是申请日为2008年07月14日、申请号为200880106647.5(PCT/US2008/069997)、题为“高保真限制性内切核酸酶”的专利申请的分案申请(其申请日为2008年07月14日、申请号为201610041448.7、题为“高保真限制性内切核酸酶”)的分案申请。
背景技术
限制性内切核酸酶是以序列特异性方式切割双链DNA的酶(Roberts,R.J.,ProcNatl Acad Sci U S A,102:5905-5908(2005);Roberts,et al.,Nucleic Acids Res,31:1805-1812(2003);Roberts,et al.,Nucleic Acids Res,33:D230-232(2005);Alves,etal.,
大约3,000种已知的限制性内切核酸酶对它们的超过250种不同靶序列的特异性可以被考虑为它们最令人感兴趣的特性。在发现第一种限制性内切核酸酶的序列特异性性质(Danna,et al.,Proc Natl Acad Sci U S A,68:2913-2917(1971);Kelly,et al.,JMol Biol,51:393-409(1970))之后,科学家们没有花费太长时间发现了某些限制性内切核酸酶在非最适条件下切割与其限定识别序列相似但不相同的序列(Polisky,et al.,ProcNatl Acad Sci U S A,72:3310-3314(1975);Nasri,et al.,Nucleic Acids Res,14:811-821(1986))。该松弛的特异性(relaxed specificity)被称为限制性内切核酸酶的星号活性(star activity)。已提出,限制性内切核酸酶和DNA之间水介导的相互作用是特异性复合物和星复合物(star complexes)之间的主要差异(Robinson,et al.,J Mol Biol,234:302-306(1993);Robinson,et al.,Proc Natl Acad Sci U S A,92:3444-3448(1995),Sidorova,et al.,Biophys J,87:2564-2576(2004))。
星号活性是分子生物学反应中的问题。星号活性在克隆载体或其他DNA中引入不希望的切割。在例如法医应用的情况中,在这种情况下某些DNA底物需要被限制性内切核酸酶切割以产生独特的指纹图谱,星号活性将改变切割图案特性,从而使分析复杂化。避免星号活性在例如链置换扩增技术(Walker,et al.,Proc Natl Acad Sci U S A,89:392-396(1992))和基因表达的系列分析(Velculescu,et al.,Science,270:484-487(1995))的应用中也是关键的。
发明概述
在本发明的一个实施方式中,提供组合物,所述组合物包含具有至少一个人工引入突变和至少2的总保真度指数(FI)改进因子(overall fidelity index improvementfactor)的限制性内切核酸酶,在预定的缓冲液中所述限制性内切核酸酶能以与不存在所述人工引入突变的限制性内切核酸酶的切割活性至少相似的切割活性切割底物,所述人工引入突变是靶向突变、饱和诱变或通过PCR扩增过程引入的突变的至少一个的产物。
在本发明的进一步的实施方式中,人工引入突变中的至少一个是靶向突变,其是由用带相反电荷的残基置换天然存在的残基产生的。丙氨酸或苯丙氨酸可以置换靶位点处的天然存在的残基。
在本发明的进一步的实施方式中,上面描述类型的组合物包括选自下列的不存在人工引入突变的限制酶:BamHI、EcoRI、ScaI、SalI、SphI、PstI、NcoI、NheI、SspI、NotI、SacI、PvuII、MfeI、HindIII、SbfI、EagI、EcoRV、AvrII、BstXI、PciI、HpaI、AgeI、BsmBI、BspQI、SapI、KpnI和BsaI。
本发明进一步的实施方式包括在表4中列出的组分。
在本发明的进一步的实施方式中,提供编码在表4中列出的酶的任一种的DNA,包含该DNA的载体和从该载体表达蛋白质的宿主细胞。
在本发明的一个实施方式中,提供具有下列步骤的方法:(a)鉴定在具有星号活性的限制性内切核酸酶的氨基酸序列中,哪些氨基酸残基是带电荷的氨基酸;(b)在编码该限制性内切核酸酶的基因序列中,突变编码一个或更多个带电荷的残基的一个或更多个密码子;(c)产生在不同的带电荷的残基具有一个或更多个不同密码子突变的基因序列文库;(d)获得突变的基因序列表达的蛋白质组(a set of proteins);和(e)测定每一表达蛋白质在预定缓冲液中的FI和切割活性。
该方法的一个实施方式包括在限定的缓冲液组中对属于该蛋白质组的蛋白质测定总FI改进因子的步骤,其中例如,缓冲液组包含NEB1、NEB2、NEB3和NEB4缓冲液。
该方法的一个实施方式包括上面描述的步骤和另外地,在突变带电荷的氨基酸的密码子的同一步骤或随后步骤中,突变编码羟化氨基酸或酰胺氨基酸的密码子。
在上面描述的本发明的一个实施方式中,将除了酪氨酸以外的密码子突变为丙氨酸,将酪氨酸突变为苯丙氨酸。
在一个进一步的实施方式中,使用对一个或更多个突变密码子的饱和诱变,改进总FI改进因子。
附图简述
对于图1-32:
*标记表示其左侧的泳道含有最低浓度的观察到星号活性的酶。
#标记指示出不完全切割的泳道,该泳道与含有足够完全切割底物的浓度的酶的泳道相邻并位于其右侧。
灰色三角形表示限制性内切核酸酶浓度的连续减少(serial decrease)。
“U”表示酶单位。
在图1-32中描述的每一反应中,反应混合物含有3μl体积的——除非另外规定——来自New England Biolabs,Inc.(NEB),Ipswich,MA的缓冲液(参见表1和NEB目录),3μl体积的——除非另外规定——来自NEB,Ipswich,MA的稀释剂中的指定限制性内切核酸酶(参见表1和NEB目录),以及不定体积的指定底物(含有0.6μg)和使反应混合物达到总共30μl的体积的水。在37℃下进行反应,温育时间为1小时。在0.8%琼脂糖凝胶上分析结果。当反应混合物总体积、底物量、反应温度或温育时间与上述不同时,在图的说明中提供数值。
在图1、5、8、11-18和20-32中,在凝胶的右侧提供理论消化图谱。那些仅具有一个限制性内切核酸酶位点的底物应该从超螺旋形式消化为一个线性带。
图1显示通过在NEB3缓冲液中使用稀释剂A对WT ScaI(1,200U)制剂进行两倍连续稀释而消化1.2μlλDNA底物(0.6μg)、并在琼脂糖凝胶上检查消化产物,对野生型(WT)ScaI的FI进行的测定。没有星号活性的限制性内切核酸酶的最高浓度用实心箭头显示;和引起底物完全消化的最小浓度用空心箭头示出。
图2A-D示出用WT BamHI或BamHI(E86P)酶消化0.5μl pUC19底物(0.5μg)1小时的结果,所述WT BamHI或BamHI(E86P)酶是用稀释剂A三倍连续稀释的,其起始浓度为172U或512U。中间的泳道是NEB 1kb标记(New England Biolabs,Inc.(NEB),Ipswich,MA)。
图2A示出使用NEB1缓冲液的结果。
图2B示出使用NEB2缓冲液的结果。
图2C示出使用NEB3缓冲液的结果。
图2D示出使用NEB4缓冲液的结果。
图3A-B示出在两个时间期间BamHI(E86P)活性的比较,其在NEB2缓冲液使用0.6μlpBR322底物(其仅包含1个BamHI切割位点),使用初始浓度600U、用稀释剂A以2-倍连续稀释的酶。
图3A示出1小时的结果。
图3B示出14小时的结果。
图4A-B示出在琼脂糖凝胶上,在两种不同的缓冲液中温育14小时后,使用以稀释剂A 2倍连续稀释的BamHI-HF(E163A/E167T),对0.6μl pBR322底物的切割。
图4A示出使用NEB2缓冲液和600U初始浓度酶的结果。
图4B示出使用NEB1缓冲液和2,400U初始浓度酶的结果。
图5A-B示出在NEB4缓冲液中应用BamHI-HF和WT BamHI的切割反应的比较。该反应在NEB4缓冲液中进行,使用1.2μlλDNA底物,处于使用稀释剂A的2-倍连续稀释中。
图5A示出起始浓度1,200U的WT BamHI,其中FI等于4。
图5B示出起始浓度2,400U的BamHI-HF,其中FI≥4000。
图6A-D示出在使用NEB稀释剂C 3-倍连续稀释下,在NEB1-4缓冲液中WT EcoRI和EcoRI(K62A)的比较。反应混合物包含在NEB1-4缓冲液中的2μlλDNA底物(1μg)。
图6A示出两倍连续稀释后,在NEB2缓冲液中120U WT EcoRI和240U的EcoRI(K62A)的切割结果。
图6B示出两倍连续稀释后,在NEB4缓冲液中120U WT EcoRI和240U的EcoRI(K62A)的切割结果。
图6C示出两倍连续稀释后,在NEB1缓冲液中60U WT EcoRI和120U的EcoRI(K62A)的切割结果。
图6D示出两倍连续稀释后,在NEB3缓冲液中120U WT EcoRI和60U的EcoRI(K62A)的切割结果。
图7A-C示出用两种不同的EcoRI突变体和WT EcoRI的切割结果。示出100,000U酶和其在稀释剂C中的10倍连续稀释物在10小时中的消化,其在各种缓冲液中使用0.6μl的Litmus28底物进行。在Litmus28底物中仅存在一个EcoRI切割位点。
图7A:在NEB4缓冲液中的EcoRI突变体K62E。
图7B:在NEB4缓冲液中的EcoRI突变体K62A。
图7C:在EcoRI缓冲液中的WT EcoRI(参见NEB目录2007-8)。
图8A-B示出在NEB4缓冲液中EcoRI-HF和WT EcoRI的比较。反应使用1.2μlλDNA底物,其处于使用稀释剂C的2-倍连续稀释下。
图8A:在NEB4缓冲液中,具有19,200U起始浓度的WT EcoRI显示FI=4。
图8B:在NEB4缓冲液中,具有38,400起始浓度的UEcoRI-HF显示FI=16,000。
图9A-B示出WT ScaI(4.8U)、ScaI(H193A)(9.6U)、ScaI(S201F)(19.2U)和ScaI(H193A/S201F)(19.2U)的连续稀释的比较。每一样品最初稀释1/10,然后在具有指定百分比甘油的NEB2缓冲液中2-倍连续稀释。每一反应混合物包含2μl的λDNA底物(1μg)。
图9A:5%甘油。
图9B:37%甘油。
图10A-D示出WT ScaI和ScaI-HF(H193A/S201F)的比较。酶(如规定的单位浓度)各自用稀释剂A以2.5-倍连续稀释。该反应混合物含有2μlλDNA底物和NEB1-4缓冲液。
图10A:在NEB2缓冲液中切割。
图10B:在NEB4缓冲液中切割。
图10C:在NEB1缓冲液中切割。
图10D:在NEB3缓冲液中切割。
图11A-H示出对SalI-HF和WT SalI的FI测定。两种酶都使用稀释剂A以2-倍连续稀释。该反应混合物含有2μl HindIII-消化的λDNA底物。
图11A、B、C和D示出1,200U、1,200U、300U和1,200U的SalI-HF的连续稀释,其分别在NEB1、2、3和4缓冲液中显示FI≥1,000、FI≥2,000、FI≥500和FI≥2,000。
图11E、F、G和H示出19.2U、150U、9,600U和38.4U的WT SalI的连续稀释,其分别在NEB1、2、3和4缓冲液中显示FI=8、FI=1、FI=32和FI=1。
图12A-B示出在NEB 4缓冲液中与1.2μlλDNA底物反应的、在稀释剂A中的SphI-HF(19,200U)和在稀释剂B中的WT SphI(143,600U)的2-倍连续稀释的结果。
图12A示出WT SphI的切割。
图12B示出SphI-HF的切割。
图13A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的PstI-HF(300U和150U)和2-倍连续稀释的WT PstI(2,400U和4,800U)对1.2μlλDNA底物的切割。连续稀释在稀释剂C中进行。
图13A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中PstI-HF的切割。
图13B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT PstI的切割。
图14A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NcoI-HF(4,800U和600U)和2-倍连续稀释的WT NcoI(4,800U和1,200U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。
图14A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NcoI-HF的切割。
图14B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NcoI的切割。
图15A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NheI-HF(287,200U和76.8U)和2-倍连续稀释的WT NheI(9,600U和300U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂A中进行。
图15A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NheI-HF的切割。
图15B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NheI的切割。
图16A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的SspI-HF(9,600U和38.4U)和2-倍连续稀释的WT SspI(19,200U和19,200U)对1.2μlλDNA底物的切割。连续稀释在稀释剂C中进行。
图16A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中SspI-HF的切割。
图16B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT SspI的切割。
图17A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的NotI-HF(287,200U和19,200U)和2-倍连续稀释的WT NotI(19,200U和76,800U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂C中进行。
图17A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中NotI-HF的切割。
图17B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT NotI的切割。
图18A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的SacI-HF(4,800U和76.8U)和2-倍连续稀释的WT SacI(19,200U和1200U)对1.2μl pXba DNA底物的切割。连续稀释在稀释剂A中进行。
图18A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中SacI-HF的切割。
图18B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT SacI的切割。
图19A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的PvuII-HF(9,600U和19.2U)和2-倍连续稀释的WT PvuII(19,200U和300U)对0.6μl pBR322DNA底物的切割。连续稀释在稀释剂A中进行。
图19A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中PvuII-HF的切割。
图19B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT PvuII的切割。
图20A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的MfeI-HF(300U和19.2U)和2-倍连续稀释的WT MfeI(2,400U和38.4U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。
图20A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中MfeI-HF的切割。
图20B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT MfeI的切割。
图21A-B示出分别在NEB3和NEB4缓冲液中,使用2-倍连续稀释的HindIII-HF(4,800U和1,200U)和2-倍连续稀释的WT HindIII(9,600U和4,800U)对1.2μlλDNA底物的切割。连续稀释在稀释剂A中进行。
图21A示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中HindIII-HF的切割。
图21B示出NEB4缓冲液(上图)和NEB3缓冲液(下图)中WT HindIII的切割。
图22A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释SbfI-HF(起始浓度:76,800U)和WT SbfI(起始浓度:76,800U),对1.2μlλDNA底物的切割。
图22A示出通过WT SbfI的切割。
图22B示出通过SbfI-HF的切割。
图23A-B示出分别在NEB2和NEB1缓冲液中,使用2-倍连续稀释的EagI-HF(1,200U和600U)和2-倍连续稀释的WT EagI(150U和38.4U)对1.2μl pXba DNA底物的切割,其应用稀释剂C。
图23A示出NEB2缓冲液(上图)和NEB1缓冲液(下图)中EagI-HF的切割。
图23B示出NEB2缓冲液(上图)和NEB1缓冲液(下图)中WT EagI的切割。
图24A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释EcoRV-HF(起始浓度:38,400U)和WT EcoRV(起始浓度:2400U),对1.2μl pXba DNA底物的切割。
图24A示出通过WT EcoRV的切割。
图24B示出通过EcoRV-HF的切割。
图25A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释AvrII-HF(起始浓度:1,200U)和WT AvrII(起始浓度:1,200U),对1.2μl T7 DNA底物的切割。
图25A示出通过WT AvrII的切割。
图25B示出通过AvrII-HF的切割。
图26A-B示出在NEB4缓冲液中,在稀释剂A中2倍连续稀释BstXI-HF(起始浓度:300U)和WT BstXI(起始浓度:38.4U),对1.2μlλDNA底物的切割。该反应在55℃进行。
图26A示出通过WT BstXI的切割。
图26B示出通过BstXI-HF的切割。
图27A-B示出在NEB4缓冲液中,使用稀释剂A以2倍连续稀释PciI-HF(起始浓度:600U)和WT PciI(起始浓度:300U),对1.2μl pXba DNA底物的切割。
图27A示出通过WT PciI的切割。
图27B示出通过PciI-HF的切割。
图28A-B示出在NEB2缓冲液中,使用稀释剂A以2倍连续稀释HpaI-HF(起始浓度:4,800U)和WT HpaI(起始浓度:9,600U),对1.2μlλDNA底物的切割。
图28A示出通过WT HpaI的切割。
图28B示出通过HpaI-HF的切割。
图29A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释AgeI-HF(起始浓度:600U)和WT AgeI(起始浓度600U),对1.2μl pXba DNA底物的切割。
图29A示出通过WT AgeI的切割。
图29B示出通过AgeI-HF的切割。
图30A-B示出在NEB4缓冲液中,使用稀释剂C以2-倍连续稀释BsmBI-HF(起始浓度:300U)和WT BsmBI(起始浓度4,800U),对1.2μlλDNA底物的切割。该反应在55℃下进行。
图30A示出通过WT BsmBI的切割。
图30B示出通过BsmBI-HF的切割。
图31A-B分别示出MluCIM的DNA序列(SEQ ID NO:1)和蛋白序列(SEQ ID NO:2),用于EcoRI和MfeI的表达。
图32示出Hpy166IIM的DNA序列(SEQ ID NO:3),用于SalI的表达。
图33A-B分别示出MfeI的DNA序列(SEQ ID NO:4)和蛋白序列(SEQ ID NO:5)。
图34A-B分别示出BstXI的DNA序列(SEQ ID NO:6)和蛋白序列(SEQ ID NO:7)。
图35A-B分别示出M.BstXI的DNA序列(SEQ ID NO:8)和蛋白序列(SEQ ID NO:9)。
图36A-B分别示出S.BstXI的DNA序列(SEQ ID NO:10)和蛋白序列(SEQ ID NO:11)。
图37A-B分别示出PciI的DNA序列(SEQ ID NO:12)和蛋白序列(SEQ ID NO:13)。
图38A-B分别示出M.PciI的DNA序列(SEQ ID NO:14)和蛋白序列(SEQ ID NO:15)。
图39示出编码MI.EarI的DNA序列(SEQ ID NO:17),所述MI.EarI识别CTCTTC并且在N4胞嘧啶或N6腺嘌呤处甲基化,用于克隆SapI和BspQI。
图40示出编码M2.EarI的DNA序列(SEQ ID NO:18),所述M2.EarI识别CTCTTC并且在N4胞嘧啶或N6腺嘌呤处甲基化,用于克隆SapI和BspQI。
图41A-B示出测定1μl WT BspQI和1μl突变体(K279P/R388F)BspQI(起始浓度分别为512U和1,024U)的FI的琼脂糖凝胶,其通过使用稀释剂A和NEB1缓冲液加10%甘油以2倍连续稀释来切割1μl pUC19 DNA底物进行。该反应在50℃进行。
图42示出测定5μl WT SapI和5μl突变体(K273A)SapI(起始浓度分别为32U和16U)的FI的琼脂糖凝胶,其通过使用稀释剂A和NEB2缓冲液加25%DMSO以2倍连续稀释来切割pUC19 DNA底物进行。
图43A-B示出通过5μl WT KpnI和5μl D16N/E132A/D148E KpnI(初始浓度分别为32U和256U)得到的pXba的催化活性和星号活性。使用含有10mM pH 7.4的Tris-HCl、50mMKCl、0.1mM EDTA、1mM DTT和50%甘油的稀释剂在NEB2缓冲液中,以2-倍连续稀释的该酶消化2μl pXba DNA底物(0.5μg),其中使用水补充至50μl的总体积。
图44A-G示出表1中的酶的氨基酸序列,和以前没有公开的表1中酶的DNA序列。
发明详述
本发明的实施方式提供选择具有希望特性的限制性内切核酸酶的一般方法。该一般方法依赖于适当的分析测定希望的限制性内切核酸酶是否已经产生。特别地,该一般方法的一个实施方式提供具有一组步骤的系统筛查方法。通过使用多种限制性内切核酸酶实施数百个反应,已经推导出该方法。本文提供的实例的大多数涉及鉴定具有降低星号活性但是其切割活性至少与WT限制性内切核酸酶相似的限制性内切核酸酶。然而,期望可以成功地运用同一方法以改变(修饰)限制性内切核酸酶的其他性质,例如涉及在期望缓冲液中的改进的切割活性、热稳定性、在限定条件中的反应速率等。
如上所述,所关心的终点是将具有星号活性的限制性内切核酸酶转化为具有显著减少星号活性的高保真度限制性内切核酸酶。星号活性指单个限制性内切核酸酶在切割特异性方面的混乱。术语“星号活性降低”和“保真度增加”在本文可互换使用。尽管限制性内切核酸酶特征为其在特定序列处切割DNA的性质,但是一些限制性内切核酸酶另外地在该DNA的第二(次级)位点处无效率地切割DNA。该种次级切割可以一贯地发生或者可以仅仅在某些条件例如下列条件之一下出现:浓度增加、某些缓冲液、温度、底物类型、存储和温育时间。
通常承认对由构成蛋白质和决定特异性的数以百计的氨基酸产生的复杂环境所知甚少。现有技术的一个方法已经利用晶体学来鉴定酶和其底物之间的接触点。但是,晶体学对于在非自然化学环境中及时冷冻结构方面具有局限性。
使用现有的分析技术,已经证明确定蛋白质中任何位点处氨基酸的贡献和底物分子结构所起的作用的规则是难以捉摸的。例如,这里显示,突变限制性内切核酸酶中的一个氨基酸可以引起所有或部分的活性损失。
在本文中,没有提出结构解释以说明为什么星号活性可以随着高甘油浓度(>5%v/v)、高的酶与DNA比例(通常每μg DNA>100单位的酶)、低离子强度(<25mM的盐)、高pH(>8.0)、存在有机溶剂(例如DMSO、乙醇)和用其他的二价阳离子(Mn
本发明的实施方式涉及产生具有特定提高性质的修饰的限制性内切核酸酶,即具有增强的切割保真度而没有总切割活性的显著减少或从制造该蛋白质的宿主细胞的显著产量下降。本文已经发展用于发现具有提高性质的突变体的方法是详尽试验的结果,并且生成酶的性质已经在指定条件的背景中限定。本文描述的方法可用来在预定条件下改变任何限制性内切核酸酶的酶促性质,但是不限于所述具体的限定条件。
该方法从负责同源活性和星号活性的氨基酸是不同的这一认识而得出。本文描述的高保真度限制性内切核酸酶的工程化显示同源活性和星号活性可以分开,并且存在影响这些不同活性的不同的关键氨基酸残基。被发现影响星号活性的氨基酸的位置不一定在蛋白质的活性部位内发现。通过发展在确定FI(也参见Wei et al.Nucleic Acid Res.,36,9,e50(2008))和总保真度指数改进因子的形式方面成功的标准,本文已经第一次确定任何限制性内切核酸酶的切割性质。
“总保真度指数改进因子(overall fidelity index improvement factor)”指在选择的缓冲液组中具有最大切割活性的突变体的最高FI除以具有最大切割活性的相应WT内切核酸酶的最高FI。选择的组可以是大于1的任何大小,但是实际上将含有小于10种不同的缓冲液,并且更优选地含有4种缓冲液。该组也可包括小于4种缓冲液。另外地而不仅仅对于由NEB1、NEB2、NEB3和NEB4组成的缓冲液组,至少2的总FI改进因子应优选地适用于要求保护的发明的任何突变限制性内切核酸酶。
通过将相同量的酶与相同量和类型的底物在相同条件下反应,并且视觉上比较电泳后凝胶上的切割图,以便切割产物的量表现在误差的标准容限内是相同的并且其中定量相似性大于10%,可以测量“相似的切割活性”。
“人工的”指“人造的”。
“标准条件”指从在NEB1-4缓冲液中获得的结果计算的总FI改进因子。
本文描述的一般方法已经用27种限制性内切核酸酶示例:AgeI、AvrII、BamHI、BsaI、BsmBI、BspQI、BstXI、EagI、EcoRI、EcoRV、HindIII、HpaI、KpnI、MfeI、NcoI、NheI、NotI、PciI、PstI、PvuII、SacI、SalI、SapI、SbfI、ScaI、SphI和SspI限制性内切核酸酶。然而,如上所述,预期该方法对工程化具有显著星号活性的任何限制性内切核酸酶是有效的。
该方法的实施方式利用一般的方法产生具有减少星号活性的突变体限制性内切核酸酶。对于某些酶,已经证明突变被确定在两个同切点酶之间保守的带电荷的残基是有用的(参见例如实施例25中的SapI)。然而,一般而言,该方法包括鉴定内切核酸酶的蛋白序列内所有的带电荷和极性残基的第一步骤。例如,带电荷的氨基酸和极性残基包括酸性残基Glu和Asp;碱性残基His、Lys和Arg;酰胺残基Asn和Gln;芳族残基Phe、Tyr和Trp;和亲核残基Cys。各残基被靶向并突变为Ala,并且针对希望的保真度增加的性质,筛查这些靶向突变的产物。如果获得的突变体没有一个提供令人满意的结果,下一步是靶向突变所有的羟化氨基酸,即Ser、Thr和Tyr,优选的突变是Ser和Thr突变为Ala和Tyr突变为Phe。也可能同时靶向突变两类残基,如在实施例16-23中所做的。突变为Ala可以被突变为Val、Leu或Ile所取代。
在这些分析之后,如果上述步骤中产生的一种或更多种优选的突变体在选择的检验下仍然具有低于标准的性能,这些突变体可以被选择并再次突变为另外可能的18种氨基酸的每一种。这被称为饱和诱变。饱和诱变提供EcoRI(实施例2)、部分BamHI(实施例1)和PvuII(实施例12)的优选的高保真度突变体。依赖饱和诱变的结果,下一步将以靶向或随机或者这两种方式将另外的突变引入限制性内切核酸酶。在实施例11中,SacI-HF包括在反向PCR期间偶然产生的随机突变。在实施例20中,PciI-HF是随机突变的结果,而不是靶向突变的结果。在实施例26中,BspQI-HF含有被发现在增强保真度中协同作用的两个突变。
不同的靶向诱变方法例如反向PCR的应用可包括在蛋白质的第二位点引入非靶向突变。这些第二突变可偶然地提供需要的性质(参见实施例20)。检查那些具有多突变的突变酶是希望的,以确定是否所有的突变对观测的效果是必需的。在实施例11中,双突变体中Q117H对活性没有影响。在实施例20中,另外的自发突变表现独自为观察到的提高的保真度的原因,而在实施例24中,各个突变协同地作用。
在一些情况中,突变可提供除了提高的保真度之外的另外的优点(参见例如BamHI,其中E163A或P173A引起酶变得更热不稳定)。
根据其在一组标准缓冲液中的功能,选择实施例中提供的突变体的高保真度/减少星号活性的性质。如果选择不同的缓冲液组合物,那么其他的突变可以是优选的。然而,可以运用相同的方法来发现突变体。表4列出运用于每一限制性内切核酸酶并在标准缓冲液中提供总FI改进因子的突变。
提供至少2的总FI改进因子的高保真度限制性内切核酸酶的工程化包括一个或更多个下列步骤:
1.WT限制性内切核酸酶的星号活性的评估
在本发明的一个实施方式中,限制性内切核酸酶的星号活性的程度通过下列方法检测:对于适当的底物,使用高初始浓度的原液(stock)内切核酸酶和其连续稀释物(例如2倍或3倍稀释),测定内切核酸酶活性。限制性内切核酸酶的初始浓度是不重要的,只要其足以使在至少一个浓度中观察到星号活性,这样通过稀释,不再检测到星号活性。
适当的底物含有被同源内切核酸酶活性切割的核苷酸序列,并且在其中可以观察到星号活性。该底物可以是含有限制性内切核酸酶基因的载体或第二DNA底物。在表2中使用的底物的实例是pBC4、pXba、T7、lambda和pBR322。
原液限制性内切核酸酶的浓度最初被选择,以便星号活性可以容易地在WT和突变限制性内切核酸酶中识别和分析。根据2007-08NEB目录的指导,选择适当的稀释缓冲液例如NEB稀释剂A、B或C进行连续稀释。连续稀释的限制性内切核酸酶与预定浓度的适当的底物以反应容器大小确定的总反应体积进行反应。例如,在微量滴定板中进行多个反应是方便的,在微量滴定板中,30μl反应混合物是每孔适当的体积。因此,实例通常应用30μl中0.6μg的底物,其相当于50μl中的1μg底物。反应混合物中的底物的量不是关键的,但是优选其在反应之间为恒定。切割反应在预定温度(例如25℃、30℃、37℃、50℃、55℃或65℃)下进行标准时间例如一小时。可以通过任何标准技术例如通过0.8%琼脂糖凝胶电泳测定切割产物,以测定上面定义的保真度指数。
不是所有的限制性内切核酸酶都具有显著的星号活性,如从它们的FI确定的。然而,如果内切核酸酶具有不超过大约250的最高FI和小于100的最低FI,那么该限制性内切核酸酶被分类为具有显著的星号活性。这样的内切核酸酶被选为酶工程的标靶以增加对单一底物的保真度。在一些情况中,具有FI大于约500和FI小于约100的限制性内切核酸酶也被工程化以获得更好的切割活性。
下面表2列出一些工程化限制性内切核酸酶在工程化之前的FI。所有的样品在0.8%琼脂糖凝胶上进行分析。
表2
*底物:λ是λ噬菌体DNA;λ(H3)是HindIII-消化的λ噬菌体DNA;pXba是pUC19,具有XbaI-消化的腺病毒片段;pBC4:较短形式的pXba;T7:T7 DNA
**FI-1到FI-4:NEB缓冲液1、2、3和4中的酶的保真度指数。括号中的数是与缓冲液组的任何缓冲液中突变体限制性内切核酸酶的“最好”切割活性相比,在该缓冲液组的指定缓冲液中同一突变体限制性内切核酸酶的相对切割活性的值。
NEB缓冲液的组成如下:
NEB1:10mM Bis Tris丙烷-HCl、10mM MgCl
NEB2:50mM NaCl、10mM Tris-HCl、10mM MgCl
NEB3:100mM NaCl、50mM Tris-HCl、10mM MgCl
NEB4:50mM乙酸钾、20mM Tris-乙酸盐、10mM乙酸镁、1mM二硫苏糖醇(25℃下,pH7.9)。
***NEB稀释剂的组成如下。(在稀释中使用稀释剂代替水将保持反应中甘油浓度为常数。)
稀释剂A:50mM KCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、200mg/ml BSA。50%甘油(25℃下,pH7.4);
稀释剂B:300mM NaCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、500mg/mlBSA、50%甘油(25℃下,pH7.4);
稀释剂C:250mM NaCl、10mM Tris-HCl、0.1mM EDTA、1mM二硫苏糖醇、0.15%Triton X-100、200mg/ml BSA、50%甘油(25℃下,pH 7.4)。
2.高表达宿主细胞株的构建
如果宿主细胞能过表达针对其寻找减少星号活性的突变体限制性内切核酸酶,这是方便的。如果该限制酶在大肠杆菌中高度表达,那么星号活性可以容易在粗提物中检测到,这简化了高保真度限制性内切核酸酶的筛查。然而,突变的限制性内切核酸酶可以在任何宿主细胞中表达,条件是宿主细胞以某些方式被保护免于从酶切割产生的毒性。这可能包括:甲基化酶的存在;在提供接近基因组的屏障的细胞区室(例如包含体或周质)中产生;体外合成;在缺少宿主基因组中的切割位点的情况下在乳液(参见美国专利申请序列号12/035,872)中产生;在经受内含肽介导的连接的构成部件中制造酶,等。
为了生产,突变限制性内切核酸酶的过表达可以使用标准克隆技术来实现,例如使用大肠杆菌(E.coli)宿主,将内切核酸酶插入pUC19-衍生的表达载体,这是高拷贝的;和使用相对小的质粒,其能持续表达重组蛋白质。该载体可优选地含有适当的启动子例如lac启动子和邻近该启动子定位的多拷贝插入位点。可选地,可以选择需要基因表达的IPTG诱导的启动子。如果粗提物中的活性不是足够的,那么在粗提物中限制性内切核酸酶的柱纯化步骤可被进行。
3.限制性内切核酸酶的诱变
编码限制性内切核酸酶内的每个带电荷的基团或极性基团的DNA可以被单独靶向,并且突变的DNA被克隆并制备进行检测。可将多突变引入单独的限制性内切核酸酶基因。限制性内切核酸酶的靶向诱变可通过本领域已知的方法完成。本文使用的一个便利的方法是反向PCR。在该方法中,合成含有靶向密码子加在该密码子5’和3’侧上的多个核苷酸(例如18nt)的互补引物对。通过评估目的氨基酸残基周围的目的内切核酸酶的基因序列,可容易地完成适当引物的选择。通过REBASE和GenBank提供对基因序列的访问。本文在实施例中描述的内切核酸酶的序列在图31到38和44中提供。PCR的模板是含有限制性内切核酸酶基因的质粒。优选地,聚合酶为高保真度聚合酶,例如
4.筛查具有减少的星号活性的突变体限制性内切核酸酶
条件例如缓冲液组成、温度和稀释剂应该被限定,以测定突变体限制性内切核酸酶中的星号活性。表2和3示出重组内切核酸酶在37℃下使用三种不同的稀释剂在四种不同的缓冲液中突变之前和之后的FI。因此,可能确定哪些突变体具有至少2、超过10、至少50或超过500的总的希望提高的保真度指数因子并且选择酶作为优选的高保真度突变体。
在本发明的一个实施方式中,首先,在正常缓冲液条件下(不超过5%甘油),筛查突变体限制性内切核酸酶的活性。对于那些具有至少大约10%的WT限制性内切核酸酶活性的突变体,在促进星号活性的星号活性提高条件下——例如高甘油浓度和任选地高pH下,也测定活性。优选地,选择在正常的缓冲液中具有最小星号活性但是具有可接受的同源活性的突变体。然后,可提取质粒并测序,以验证该突变体。在一些情况中,星号活性不容易测量——甚至在高甘油和高pH条件下。替代地,测量和比较不同缓冲液中的活性,并且NEB4与NEB3切割活性比率最高的突变体可进一步针对星号活性改进进行检测。
5.对一个单个残基的饱和诱变
如前面部分所述的,第一步是将限制性内切核酸酶中的靶氨基酸突变为Ala。如果该结果不令人满意,那么进行饱和诱变。优选地,这通过两个方法之一进行。一个方法是将意图密码子改为NNN。诱变后,在正常条件下和促进星号活性的条件下分析多个菌落。可选地,可以选择不同的密码子,用于进行下列靶氨基酸的每一个的诱变,例如:Ala:GCT;Cys:TGC;Asp:GAC;Glu:GAA;His:CAC;Ile:ATC;Lys:AAA;Leu:CTG;Met:ATG;Asn:AAC;Pro:CCG;Gln:CAG;Arg:CGT;Ser:TCC;Thr:ACC;Val:GTT;Trp:TGG和Tyr:TAC。
6.组合
如果单一突变不充分减少星号活性,那么可以将超过一个的突变引入限制性内切核酸酶基因。突变组合和饱和诱变可以以任何顺序进行。
7.突变体纯化和改进的评估
高保真度突变体可以以多种方式纯化,其包括使用不同的色谱柱。对于常规的质量评估,一个FPLC肝素柱足以从该制品除去DNA和非特异性核酸酶。包括离子交换柱、疏水柱、大小排阻柱和亲和柱的多个柱可被用于进一步纯化。
在四种NEB缓冲液中,测量纯化的高保真度限制性内切核酸酶的FI,并且将其与WT限制性内切核酸酶的FI进行比较。高保真度限制性内切核酸酶在其最佳缓冲液中的FI与WT的FI的比率是总改进因子。
表3–示例性限制性内切核酸酶的FI*
*FI是不示出星号活性的最高浓度与完全消化底物的最低浓度的比率。
**括号中的数是与缓冲液组的任何缓冲液中突变体限制性内切核酸酶的最大切割活性相比,在该缓冲液组的指定缓冲液中同一突变体限制性内切核酸酶的相对切割活性的值。
表4–提供具有高保真度的限制性内切核酸酶的突变
对每种酶的突变通过分号分开。
所有上面和下面引用的参考文献,以及美国临时申请序列号60/959,203,被通过引用并入。
实施例
在氨基酸用单字母代码表示时,这拟为标准命名。该代码的解答例如在NEB目录2007/2008第280页上提供。
被用来克隆和作为底物的质粒具有如下序列:
pLaczz2(SEQ ID NO:102)、pSyx20-lacIq(SEQ ID NO:105)、pBC4(SEQ ID NO:103)、pXba(SEQ ID.NO:104)和pAGR3(SEQ ID NO:106)。pACYC在GenBank XO 6403中描述,T7在GenBank NC001604中描述,pUC18在GenBank L09136中描述,和pRRS在Skoglund etal.Gene,88:1-5(1990)中描述。pSX33通过将lacI基因插入pLG339中EcoRI位点处进行构建。pLG339在Stoker,et al.Gene 19,335-341(1982)中描述。
本文使用的称为NEB缓冲液的所有缓冲液可从New England Biolabs,Inc.(NEB),Ipswich,MA获得。
1.提取包含BamHI甲基化酶和BamHI内切核酸酶的质粒
用pUC18-BamHIR和pACYC184-BamHIM转化感受态大肠杆菌宿主细胞,并且通过使用标准小量制备技术的标准Qiagen小量制备方法(Qiagen,Valencia,CA)提取BamHIR。
2.诱变靶的选择
克隆并测序BamHI和相关的限制性内切核酸酶OkrAI。如果反应在37℃下、在NEB缓冲液(1、2和4)中进行,那么发现OkrAI具有显著的星号活性。本分析检验如此假设:作为星号活性原因的氨基酸残基(一个或更多个)在BamHI和OkrAI内切核酸酶之间是相似的。
BamHI的完整蛋白序列(SEQ ID NO:19)为:
OkrAI的完整蛋白序列(SEQ ID NO:20)为:
通过GCG对BamHI和OkrAI内切核酸酶的蛋白序列的“最佳拟合(Bestfit)”相似性分析示出下列结果,其中上面的蛋白序列是BamHI,下面的蛋白序列是OkrAI:
bamhir.pep x okrair.pep
发现BamHI中相似的带电荷的残基(D、E、H、K、R)是E28、K30、K52、K61、E77、K84、E86、K88、D94、K97、K106、E111、E113、H121、R122、K126、K146、D154、R155、E161、E163、E170、E182、K193、D196和R201。在上面的比较中,这些残基被加下划线。已知的突变体E77K、D94N、E111K和E113K以前被报道为失活的(Xu,Shuang-yong et al.J.Bacteriol.266:4425-4429(1991)),所以排除它们。最初的诱变选择靶向22个共有的带电荷的氨基酸残基,将其突变为丙氨酸:E28A、K30A、K52A、K61A、K84A、E86A、K88A、K97A、K106A、H121A、R122A、K126A、K146A、D154A、R155A、E161A、E163A、E170A、E182A、K193A、D196A和R201A。
3.BamHI的诱变
选择突变的点诱变通过反向PCR进行。将相应密码子全部变为GCA(丙氨酸)。下列引物用于诱变:
E28A
5’ATTCAACAAGCATACAAT
5’ACAAATAGATGTTTTAAC
K30A
5’CAAGCATACAATGAAGTT
5’AGGTGAACAAATAGATGT
K52A
5’ACGATTAACAACACCGAA
5’TACTACACCGTTACAATT
K61A
5’AACGGTGTAGTACCAATT
5’TAAGGTGTAACATAGTTC
K84A
5’AACCCCCTTGATATACTT
5’ACCTTTTTTCTTTTCAAG
E86A
5’GATATACTTAAACTT
5’CGGACCACCTTTTTTCTT
K88A
5’ATACTTAAACTTGAAAAG
5’ATCAATCGGACCACCTTT
K97A
5’GGTCCGATTGATGTTTAT
5’ACTGTTTTCTATGAACTC
K106A
5’ATAGAAAAACAGTGAACTT
5’AAATTCCATACCTACACG
H121A
5’GGAAATATTAGTTCTGCC
5’AAGTTTGTTCATTGAAACG
R122A
5’AATATTAGTTCTGCCCAC
5’TAGAAGTTTGTTCATTGA
K126A
5’GCCCACCGTTCAATGAAC
5’ATGTTTTAATCCTAATAGAAG
K146A
5’ATTATCCTTATGCCTATT
5’AAGATAATAGGCCAATTG
D154A
5’TTGGCCTATTATCTTACA
5’CTCGAAATTGGTAACACG
R155A
5’GCCTATTATCTTACAGAT
5’TTCCTCGAAATTGGTAAC
E161A
5’CGTGTTACCAATTTCGAG
5’TTCAAAATAAGGTTCTAA
E163A
5’ACCAATTTCGAGGAATTA
5’AGTAAGTTCAAAATAAGG
E170A
5’CCTTATTTTGAACTTACT
5’AATAAAAATAAATGGTTG
E182A
5’TTTATTTTTATTGGATTTAAT
5’GACATTAGAATTATAAGCTGC
K193A
5’AATGTCCCTTTAATTCCC
5’TGACATACCGTCAGAACC
D196A
5’TTAATTCCCAAAGGTTCT
5’TGAGCGTTTTGACATACC
R201A
5’TCTGACGGTATGTCAAAA
5’TTTCCATTTCTTAATTGA
PCR反应的反应体积为100μl,包含2μl的每种PCR引物、1μl pUC18-bamhiR、400μMdNTP、4单位的Deep Vent
PCR反应条件是94℃进行5min,然后25个循环的94℃30sec、55℃30sec、72℃4min,并且在72℃下最后延伸时间为7mins。PCR产物在标准Qiagen离心柱(Qiagen,Valencia,CA)上纯化。用20单位的DpnI消化6到16μl的PCR产物1小时。将消化的产物转化入大肠杆菌(pACYC-bamHIM)。
6个PCR反应后,获得工程化的22种突变中的14种:E28A、K30A、K61A、E86A、K97A、H121A、K126A、K146A、E161A、E163A、E170A、E182A和R201A。从过夜培养物中的细胞溶胞产物中提取突变体蛋白质,并且将其活性与WT BamHI比较。在有或者没有5%甘油的NEB2缓冲液中,分析正常的酶活性,而在具有39.2%甘油的NEB2中测定星号活性,尽管最初可以使用较低百分比的甘油。用于不同的反应的底物是pBR322、pUC19或λDNA。切割反应在37℃下进行30分钟或1小时。发现突变体K97A、H121A、K126A、E161A、E182A、R201A是失活的(小于1%的WT BamHI活性),而E28A、K146A、E163A、E170A突变体具有与WT酶相似水平的包括星号活性在内的活性。发现与WT BamHI相比,三种突变体K30A、E86A和K126A具有显著减少的星号活性。也发现K30A和E86A具有与WT酶相似的总切割活性,同时其示出星号活性明显减少。相反,K126A仅具有25%的总WT酶切割活性,并且与对K30A和E86A观察到的星号活性相比具有较不显著的改进。
对pUC18-bamHIR质粒再检查显示正常的高拷贝质粒已突变为低拷贝质粒。设计引物对以将bamHIR基因转移入高拷贝质粒:
5’GGTGGT
5’GGTGGT
模板是pUC18-bamhIR WT,其在K30A、E86A或K126A处带有突变。PCR组合物包含:5μl模板、2μl每种引物、400μM dNTP、10μl 10x Thermopol缓冲液、4单位2μl Deep Vent
使用pUC19-BamHI(K30A)载体重复那些在pUC18-BamHIR中不成功的突变。PCR混合物包含:1μl模板和含有2μl每种引物、400μM dNTP、10μl 10 x Thermopol缓冲液、4单位2μlDeep Vent
使用反向PCR,组合在K30、E86和K106位点上的突变:K30A/E86A、E86A/K106A、K30A/K106A和K30A/E86A/K106A。K30A/E86A表现为优选的突变体。纯化后,发现BamHI突变体的FI在所有NEB缓冲液中提高25%。
在K30和E86位点上,随机进行进一步诱变:
对K30:
5’CAAGCATACAATGAAGTTNNNACATCTATTTGTTCACCT3’(SEQ ID NO:69)
5’AGGTGAACAAATAGATGTNNNAACTTCATTGTATGCTTG3’(SEQ ID NO:70)
对E86:
5’GATATACTTAAACTTNNNAAGAAAAAAAGGTGGTCCG3’(SEQ ID NO:71)
5’CGGACCACCTTTTTTCTTNNNAAGTTTAAGTATATCAAG3’(SEQ ID NO:72)
PCR组合物是:1μl模板(pUC19-BamHIR(K30A)或pUC19-BamHIR(E86A))并且使用如上描述的扩增混合物。进行PCR:94℃5min,然后94℃30sec、55℃30sec和72℃3分30秒25个循环和7分钟的最终延伸时期。通过DpnI消化PCR产物,并将其转化入大肠杆菌(pACYC-BamHIM)。
对K30随机突变选取共155个菌落,和对E86位点选取158个菌落。将菌落生长过夜并制成细胞提取物。在具有42.5%甘油的NEB2缓冲液中用1μl细胞提取物在37℃下,消化0.5μg pUC19,1小时。在具有39.2%甘油的NEB2缓冲液中,具有明显更少星号活性的细胞提取物在37℃下在1、4、16倍稀释下对0.5μg pUC19进行重新分析30分钟。对于观察到具有减少星号活性的那些突变体,提取相应的质粒并且测序以证实突变。总共3个克隆(#12、#66和#82)含有K30突变,并且总过33个克隆(#5、#15、#16、#19、#29、#47、#51、#55、#56、#58、#61、#69、#71、#73、#76、#82、#86、#88、#93、#94、#97、#98、#100、#104、#107、#113、#117、#118、#129、#132、#136、#139和#151)被测序。测序后,发现#12和#66含有K30G突变,和#82含有K30N突变。令人惊奇地,所有33个突变是E86P突变,恰好在不同的密码子中(CCA、CCT、CCC、CCG)。在这些密码子中,CCG在大肠杆菌以最高频率发生(克隆#98、#136和#139)。
相应于K30G、K30N和K30A的细胞提取物被连续稀释为1、2、4、8、16和32倍,而E86P和E86A被连续稀释1、2、4、8、16、32、64、128和256倍。连续稀释的提取物与0.5μg pUC19在具有39.2%甘油的NEB2中在37℃下反应30分钟。在极端的条件下,E86P显示比其他突变体更优良。在上至32倍消化下,没有明显星号活性带。E86P和K30突变体(K30G、K30N和K30A)之间的差异是如此大以致不另外需要在E86P突变体中组合这些突变中的任一个。
对1μgλDNA——底物——测定BamHI(E86P)活性(也用于WT BamHI活性测定)。在NEB1缓冲液中,在37℃下,进行分析1小时。
4.BamHI(E86P)和WT BamHI的详细比较
A.不同NEB缓冲液中BamHI(E86P)的活性
使用λDNA底物在37℃下,在NEB1、NEB2、NEB3、NEB4和NEB BamHI缓冲液中测定纯化的BamHI(E86P)的活性1小时。BamHI(E86P)在NEB1缓冲液和NEB2中是最有活性的,而在NEB3、NEB4和BamHI缓冲液中具有50%、50%和25%的活性水平。
B.比较BamHI(E86P)和WT BamHI对pUC19的切割活性
在pUC19中具有一个GGATCC位点(BamHI位点)和6个AGATCC位点(BamHI星号活性位点),所以pUC19被选择作为比较BamHI(E86P)和WT BamHI的优选底物。
在不同的缓冲液中,用NEB稀释缓冲液A以1、3、9、27、81、243、729、2181、6561和19683倍连续稀释的WT BamHI和BamHI(E86P)消化0.5mg pUC19。WT BamHI示出每种NEB正常缓冲液中的星号活性,而BamHI(E86P)根本没有示出星号活性带(图2-5)。这证明BamHI(E86P)已经极大地减少星号活性,同时保持同源切割活性。
C.BamHI(E86P)和WT BamHI对λDNA底物切割活性的比较
为了计算保真度指数,用稀释缓冲液稀释限制酶,并且将甘油浓度恒定保持在5%。在本文使用的标准反应条件中,λDNA底物浓度为1μg,并且总反应体积为50μl。为了保持酶体积为10%,酶以5μl的体积加入。这等于在30μl总体积中3μl限制酶消化的0.6μg的底物。在NEB1、NEB2、NEB3、NEB4和NEB BamHI缓冲液中,从1到32768的1:2连续稀释的3μl WTBamHI和BamHI(E86P)在37℃下对0.6mgλDNA消化1小时。
表5:在不同缓冲液中,WT和突变体BamHI的保真度指数
5.针对高保真度突变体的BamHI的进一步改进
在一小时水平,BamHI(E86P)表现为好的高保真度BamHI突变体。然而,尽管E86P的星号活性在一小时没有检测到,但是当延长反应时间时(例如过夜或14小时),星号活性带出现。(图3)。继续进行对改进高保真度BamHI的研究。
6.其他带电荷的和极性残基的突变
在SEQ ID NO:19中位置2、4、5、6、10、11、13、14、18、19、20、43、51、62、69、70、76、77、78、81、87、89、94、98、101、104、107、111、113、132、133、135、137、160、167、200、204、205、207、208、209、211、213处,将其他带电荷的残基(Arg、Lys、His、Asp、Glu)突变为Ala。在pUC19-BamHI(K30A)的模板上进行突变。
在SEQ ID NO:19的位置9、17、26、32、36、41、42、44、46、50、65、66、71、72、75、96、103、114、118、119、123、150、151、153、157、165、169、184、186、195、199、202处,将其他极性残基(Ser、Thr和Tyr)突变为Ala,而将Tyr突变为Phe。
通过使用相似的突变和筛查方法,发现下列突变具有减少的星号活性:K30A/K87A、E86P/K87E、E86A/Y165F和K30A/E167A。鉴定E86P/K87E为在存在另外的DMSO情况下具有改进性质的突变体。然而,在正常反应缓冲液中该突变体的活性比WT BamHI的活性低得多。
进行下列突变组合:E86P/Y165F、E86P/E167A、E86P/Y165F/E167A、K30A/Y165F/E167A、K30G/Y165F/E167A、K30A/Y165F/E167A、E86A/Y165F/E167A。它们都具有低活性。
到现在为止,发现对BamHI星号活性,E167A和Y165F具有强效果,K87A具有中等效果,以及K30A和E86A具有弱效果。E86P是在1小时水平而非过夜地减少星号活性的特异性突变。
7.将E167和Y165突变为所有其他残基
在pUC19-BamHI中,将E167突变为所有其他的残基,这通过将密码子改变为GCA——Ala、TGC——Cys、GAC——Asp、TTC——Phe、GGT——Gly、CAC——His、ATC——Ile、AAA——Lys、CTG——Leu、ATG——Met、AAC——Asn、CCG——Pro、CAG——Gln、CGT——Arg、TCC——Ser、ACC——Thr、GTT——Val、TGG——Trp和TAC——Tyr进行。
在比较所有的突变体之后,优选E167T突变,而与E167A相比,E167R、E167K、E167L和E167I突变示出在减少星号活性方面的改进。
也将Y165突变为所有其他氨基酸残基,这通过将相应的密码子改变为GCT——Ala、TGC——Cys、GAC——Asp、GAA——Glu、GGT——Gly、CAC——His、ATC——Ile、AAA——Lys、CTG——Leu、ATG——Met、AAC——Asn、CCG——Pro、CAG——Gln、CGT——Arg、TCC——Ser、ACC——Thr、GTT——Val、TGG——Trp进行。
在比较所有的突变体之后,Y165F的存在导致显著的切割活性,而刚刚在上文列出的其他突变示出低活性或没有切割活性。
8.对BamHI(E167T)进一步突变
在puc19-BamHI(E167T)的模板上,将所有带电荷的和极性残基突变为Ala,方法同上。
作为优选突变,将E163A/E167T鉴定为BamHI-HF。
9.BamHI-HF与WT BamHI的比较
在E163处引入突变产生减少热稳定性的BamHI突变体,这与突变P173A被加入其他负责减少星号活性的突变时一样。
与BamHI(E86P)不同,BamHI-HF在NEB1-4缓冲液中过夜反应没有显著的星号活性。图4示出在NEB1和NEB2中的结果。因此,选择BamHI(E163A/E167T)为优选的高保真度BamHI。
在37℃下,在所有四种NEB缓冲液中,用稀释剂A,在λDNA底物上,测量BamHI-HF的保真度指数,并且与WT酶比较。
表6:BamHI-HF和WT BamHI的比较
在NEB1中,BamHI-HF具有最高的活性,保真度指数为≥8000,在NEB2和NEB3中,WTBamHI具有最高的活性,并且最高的FI为32。总FI改进因子——其为每种突变体和WT酶在最好的缓冲液中的FI的比率,是≥8000/32=250倍。
10.BamHI的另外突变
预测E163A/E167T/P173A具有优选的星号活性减少,并且另外是热不稳定的。
检测(E86P/K87S/K88P/E163S/E170T/P173A)。该突变体在比活性方面显示10倍减少,而具有来自宿主细胞的补偿增加的蛋白质产率。
共享减少的热稳定性、减少的星号活性和可接受的比活性的其他BamHI突变体包括:
E86P/K87R/K88G/E163S/E170T/P173A
E86P/K87P/K88R/E163S/E170T/P173A/E211K
E86P/K87T/K88R/E163S/E170T/P173A/N158S
E86P/K87S/K88P/E163S/E170T/P173A
E86P/K87G/K88S/E163S/E170T/P173A
E86P/K87R/K88Q/E163S/E170T/P173A
1.EcoRI的表达
对EcoRI的PCR使用下列引物:
GGTGGT
GGTGGT
然后,用第二对限制性内切核酸酶——SphI和Acc65I——消化PCR产物,并且连接入用同样的第二对限制性内切核酸酶消化的pUC19。然后,连接的质粒被转化入用pACYC-MlucIM预修饰的感受态大肠杆菌。
2.EcoRI的诱变
靶氨基酸残基的最初选择是EcoRI与其同切点酶RsrI比较的结果,RsrI的星号活性也是已知的。
EcoRI对RsrI
除了D91、E111和K113——其为已知的活性中心残基,在两种内切核酸酶中,42个带电荷的残基是相同或相似的。带电荷的残基如下:
K4、R9、K15、K29、H31、D32、E37、E49、R56、R58、K63、E68、K71、D74、K89、E96、K98、K99、R105、H114、D118、K130、D133、D135、E144、R145、H147、K148、E152、E160、H162、E170、E177、R183、D185、R200、D202、R203、E253、R264、D269。
将所有这些带电荷的残基突变为Ala(密码子GCA、GCT、GCC或GCG),并且突变的基因被如下扩增和克隆:
扩增混合物与在实施例1中使用的扩增混合物相同(2μl每种PCR引物,400mMdNTP,4单位Deep Vent DNA聚合酶,具有另外0、2、6μl MgSO
PCR反应条件为94℃持续5min,然后25个循环的94℃30sec、55℃30sec、72℃3分30秒,并且在72℃下最后延伸时间为7min。PCR后,产物通过标准Qiagen离心柱(Qiagen,Valencia,CA)纯化。用20单位的DpnI消化16μl的PCR产物1小时。将消化的产物转化入甲基化酶保护的感受态大肠杆菌制品。
3.筛查EcoRI高保真度突变体
对每一突变选取3个菌落,并且在具有氨苄青霉素和氯霉素的LB中生长过夜。对pBR322和λDNA进行活性分析以确保突变体与WT EcoRI至少具有相似的活性。然后,使用2倍连续稀释的3μl的细胞抽提物、12μl 50%甘油、3μl NEB1缓冲液、0.5μl pBR322和11.5μl水,检测这些突变体,其在37℃下反应1小时。然而,没有突变改进星号活性的性能。
从该结果,推导出在同切点酶之间有效突变不总是被识别为同源残基。
4.对剩余的32个带电荷的残基重复诱变
如在步骤2中所述的,通过靶向氨基酸残基5、12、14、26、40、43、44、59、62、65、72、76、100、103、117、123、131、192、221、225、226、227、228、242、244、245、247、249、257、268、272和277,将所有剩余的32个带电荷的残基突变为Ala。
上面的数字相应于EcoRI蛋白序列(SEQ ID NO:83)中的氨基酸位置。
5.重复选择
从含有不同类型突变的每种样品中选取四个菌落,并且在4ml具有CAM的LB中生长。超声处理后,在NEB1缓冲液中在正常甘油条件下,在λDNA底物上检测细胞提取物。通过在3μl NEB2缓冲液中加入2倍连续稀释的3μl细胞提取物至0.5μl的pUC19和23.5μl 50%甘油以在反应混合物中提供39.2%甘油的终浓度,具有相似活性的那些提取物在pUC19底物上再次检测。
在所有这些突变体中,发现K62A是具有最少星号活性和高FI的突变。R9A、K15A、R123A、K130A、R131A、R183A突变体都示出星号活性的部分减少。令人感兴趣地,含有靶向突变K5A的一个克隆示出部分改进。另外地,测序后,发现第二突变S2Y。分离这两个突变显示该分离物有效的突变是S2Y。D135A和R187A EcoRI也具有少得多的星号活性。然而,这些突变体的切割活性不是最佳的。
6.EcoRI(K62A)与WT EcoRI的比较
通过在四种不同NEB缓冲液中消化0.6μg的λDNA,在使用NEB稀释缓冲液C进行3倍连续稀释中进行并行比较(图6)。EcoRI(K62A)具有实质上比WT EcoRI小的星号活性。
通过测定EcoRI(K62A)和WT EcoRI的保真度指数量度,进行更定量的比较。保真度指数测量的条件与表2相同,其使用λDNA作为底物并使用稀释缓冲液C。该反应在37℃温育1小时,并且在0.8%琼脂糖凝胶上分析消化产物。
表7:EcoRI(K62A)和WT EcoRI的保真度指数
7.EcoRI的进一步突变
尽管对于λDNA底物,EcoRI(K62A)并不明显具有星号活性,但是使用Litmus28底物在10小时消化之后观察到星号活性。与EcoRI缓冲液中的WT EcoRI相比,NEB4中的EcoRI(K62A)具有显著减少的星号活性(图7)。
研究进一步的改进。通过如在实施例1中将K改变为相应密码子,将EcoRI(K62)突变为所有其他的氨基酸残基。K62S和K62L与K62A相似。当与EcoRI(K62A)相比时,EcoRI(K62E)具有≥100倍总保真度指数改进因子,如在图6中所示。EcoRI(K62E)被命名为EcoRI-HF。
8.EcoRI-HF和WT EcoRI的比较
通过在稀释剂C中EcoRI-HF和WT EcoRIA上的FI测量,进行定量比较。FI测量的条件与表2中相同,其使用λDNA作为底物。反应条件是37℃持续1小时,并且在0.8%琼脂糖凝胶上分析结果(图8)。
表8:EcoRI-HF和WT EcoRI的比较
发现总保真度指数改进因子为64倍(EcoRI-HF在NEB4中的16000比NEB3中WTEcoRI的250)。
1.ScaI的表达
ScaI限制性内切核酸酶和甲基化酶的序列在REBASE和GenBank中描述,并且在图44(SEQ ID NO:97)中提供。将表达这些酶的基因插入质粒以分别产生pRRS-ScaI和pACYC184-ScaIM。然后,将pACYC184-ScaIM转化入感受态大肠杆菌宿主细胞。pRRS载体从pUC19得到,并且差异仅仅为存在多克隆位点。将pRRS-ScaIR转化入大肠杆菌(pACYC-ScaIM)以制造表达菌株。铺板和细胞培养在30℃下进行。
2.ScaI的诱变
ScaI具有两种测序的同切点酶:LlaDI和NmeSI。然而,没有已知的关于LlaDI或NmeSI的星号活性的信息,也没有关于这些酶活性位点的任何信息。因此,最初选择在该蛋白质的位置4、8、11、12、14、18、25、27、30、37、39、40、43、46、51、57、61、68、72、74、80、86、97、103、108、112、114、119、120、121、127、128、129、133、135、139、140、141、147、152、156、158、159、161、162、171、172、175、179、182、184、187、172、175、192、193、195、200、222、227处所有58个带电荷的残基进行靶向突变。
上面的数字相应于ScaI蛋白序列(SEQ ID NO:97)中的氨基酸位置。
引物设计方法和PCR方法与对实施例1中BamHI和实施例2中EcoRI描述的相似。通过改变退火温度和DNA聚合酶,实现诱变。用DpnI消化PCR产物,并转化入感受态大肠杆菌(pACYC184-ScaIM)。
3.ScaI高保真度突变体的选择
选取来自ScaI突变体的每个突变体的4个菌落,并且在30℃下、4ml具有100μg/mlAmp和33μg/ml Cam的LB中生长过夜。将每个细胞培养物进行超声处理,并且在NEB2缓冲液中对λDNA检测活性。明显具有活性的那些以10、100和1000倍稀释再次检验。因为ScaI具有非常显著的星号活性,所以对于突变体对WT限制性内切核酸酶,星号活性带容易比较。具有减少的星号活性的那些用使用NEB稀释缓冲液A进行2倍连续稀释再次检验。对每一突变体测量FI。对于NEB 2缓冲液中的WT ScaI,FI为1/8。发现具有相似活性水平的四种突变体与WT ScaI相比具有大量减少的星号活性。突变体#6-3ScaI与WT ScaI相比具有2倍的活性并且FI为4或32倍。#26-2ScaI与WT相比具有2倍的活性并且FI为8或64倍;#28-2ScaI与WT相比具有2倍的活性并且FI为120或1000倍;#54-3与WT具有相似的活性,并且FI为WT的250或2000倍。
四种突变体:#6-3、#26-2、#28-2和#54-3ScaI在存在36.7%甘油的情况下进一步检测消化λDNA底物。#54-3在减少星号活性方面示出比其他3种突变体更大的提高。
在提取质粒后,测序#6-3,并且发现其具有R18A的突变。测序#26-2,并且发现其具有R112A的突变。测序#28-2,并且发现其具有E119A的突变。这些突变被预测到。然而,发现#54-3具有双突变体——H193A/S201F。S201F是在PCR期间发生的自发第二突变,并且位于H193A突变的引物区域外。
为了理解哪个残基主要负责星号活性的减少,使用下列引物,将单一突变(S201F)引入ScaI:
5’-GATTGGGTGGCGCAGAAATTTCAAACGGGCCAGCAGTCG-3’(SEQ ID NO:77)
5’-CGACTGCTGGCCCGTTTGAAATTTCTGCGCCACCCAATC-3’(SEQ ID NO:78)。
证实ScaI(H193A)、ScaI(S201F)和ScaI(H193A/S201F)的序列。在5%和37%甘油水平下,比较三种突变体和WT ScaI(图9)。与仅微弱有助于FI的H193A相反,S201F明显有助于FI。然而,这两种突变在提高FI方面表现是加和的。在5%甘油中,S201F没有显示星号活性,但是在37%甘油中显示一些星号活性。在5%甘油中,H193A具有一些星号活性,在37%甘油中具有显著的星号活性。然而,对于这两种突变的组合,在5%或37%甘油中,都没有检测到星号活性。该发现不但示出具有羟基的氨基酸可以是星号活性的主要活性残基,而且该突变的正确组合可以推动保真度提高到非常高的水平。如果带电荷的残基的突变不能改进星号活性,这里观察到对Ser、Thr和Tyr的突变可成功提高保真度指数。将ScaI(H193A/S201F)标记为ScaI-HF。
4.ScaI-HF和WT ScaI的比较
37℃下,在不同的NEB缓冲液中,用NEB稀释缓冲液A进行的2.5倍连续稀释下,对4种不同的NEB稀释液中的1μgλDNA,比较ScaI-HF和WT ScaI,1小时(图10)。
表9:ScaI-HF与WT ScaI的保真度指数的比较
在NEB2和NEB4缓冲液中,ScaI-HF表现最好,其中最好的FI为250;在NEB2缓冲液中,WT ScaI表现最好,其中FI为1/8。总FI改进因子为250/(1/8)=4000。
1.SalI的表达
SalI在用placzz1-SalIR和pACYC-Hpy166IIM转化的大肠杆菌中表达,其中placzzI是pUC19质粒,其利用lac启动子表达插入到邻近多拷贝位点的限制性内切核酸酶基因。Hpy166IIM保护SalI的外部4个碱基。
2.SalI的诱变
使用在先前实施例中相似的PCR方法,将SalI的86个带电荷的残基突变为Ala:5、6、8、9、12、13、19、27、31、34、35、37、42、43、45、50、60、63、65、67、73、82、83、84、90、93、97、100、101、103、107、109、111、114、116、119、126、129、131、134、140、143、145、147、148、156、157、164、168、172、173、174、180、181、186、190、191、193、210、218、226、232、235、237、238、244、246、250、256、257、258、259、260、261、264、266、271、275、297、300、304、305、306、308、309、311。
上面的数字相应于SalI蛋白序列(SEQ ID NO:94)中的氨基酸位置。
突变体在30℃下,在具有Amp和Cam的LB中生长过夜。
3.SalI-HF的选择
SalI-HF的选择如在前面实施例中描述的进行。主要差别是SalI的星号活性在粗提物中不能容易地分析——不论在5%甘油或更高甘油浓度中。甘油不仅促进SalI的星号活性,而且极大地抑制同源活性。
在5%甘油和37%甘油中,对HindIII消化的λDNA分析活性突变体。在所有4种NEB缓冲液中,检测突变体#22、#26、#29、#31、#43和#51的切割活性。在不同条件和底物中数轮比较后,发现#31——SalI(R107A)——是优选的突变体,其保留高的切割活性,但是显示大量减少的星号活性。将SalI(R107A)标记为SalI-HF。
4.SalI-HF和WT SalI的比较
测定SalI-HF和WT SalI的FI(图11)。结果如在表10(下面)中所示出的:
表10:SalI-HF和WT SalI的比较
在NEB 2和NEB 4缓冲液中,SalI-HF表现最好,其中FI都≥2000;WT SalI在NEB 3缓冲液中表现最好,其中FI为4。总FI改进因子为≥2000/4=≥500。
1.SphI的表达
在大肠杆菌(placzz1-SphIR、pACYC184-CviAIIM)中表达SphI。CviAIIM保护SphI的内部四个碱基。转化的细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.SphI的诱变
使用在实施例1至实施例4中描述的方法,将SphI的所有带电荷的残基突变为Ala。进行共71个突变:3、5、12、18、21、24、25、30、31、35、43、46、51、54、57、58、60、61、72、75、77、78、87、90、91、95、100、104、107、108、110、113、120、123、124、125、129、130、131、139、140、142、146、147、155、157、159、164、170、172、173、175、178、184、186、190、194、196、197、198、206、207、209、212、215、221、227、230、231、232、235。
上面的数字相应于SphI蛋白序列(SEQ ID NO:98)中的氨基酸位置。
3.SphI-HF的选择
每种突变的四个菌落在在37℃下,在具有Amp和Cam的LB中生长过夜。活性选择主要针对NEB2中的5%甘油和30%甘油中的pBR322。使用前面实施例的经验,高保真度SphI的选择是简单的。发现SphI突变体D91A、K100A、D139A和D164A显著减少SphI中的星号活性。在它们中,K100A是具有最小星号活性的优选突变。SphI(K100A)被命名为SphI-HF。
4.SphI-HF和WT SphI的比较
在它们各自优选的缓冲液中,并行进行SphI-HF和WT SphI的比较。使用NEB稀释缓冲液A,将SphI-HF 2倍连续稀释,并且在NEB4中反应,使用NEB稀释缓冲液B,将WT SphI 2倍连续稀释。对λDNA的消化在图12中进行比较。
表11:SphI-HF和WT SphI的FI的比较
在NEB4中,SphI-HF表现最好,其中FI≥2000;WT SphI在NEB1或NEB2中表现最好,其中优选的FI是64。总FI改进因子为≥32。
1.PstI的表达
从大肠杆菌(pACYC-HpyCH4VM、pPR594-PstIR)表达PstI。HpyCH4VM保护PstI的内部四个碱基。pPR594是具有Amp抗性和ptac启动子的表达载体。细胞在30℃下,在具有Amp和Cam的LB中生长,然后通过IPTG诱导培养物过夜。
2.PstI的诱变
使用在先前实施例中描述的方法,将92个带电荷的残基突变为Ala。这些是:8、10、11、14、25、26、38、40、41、44、45、47、58、61、63、66、67、69、73、74、77、78、82、85、88、91、92、94、95、99、104、105、116、119、127、128、136、142、145、146、150、151、152、156、159、169、170、174、176、179、180、184、188、191、197、202、204、207、212、214、217、218、226、227、228、231、236、237、238、239、240、246、251、257、258、261、263、273、282、284、286、287、295、297、302、305、306、309、313、314、319和320。
上面的数字相应于PstI蛋白序列(SEQ ID NO:91)中的氨基酸位置。
在用DpnI消化PCR产物后,将样品转化入感受态大肠杆菌(pACYC-HpyCH4VM),并且在具有Amp和Cam的LB板上生长。
3.PstI-HF的选择
PstI-HF的选择与前面的样品相似。在5%甘油下,在λDNA上检测正常活性酶活性,并且在NEB4缓冲液和20%DMSO的条件下在pBR322底物上检测星号活性。DMSO比相同浓度的甘油更显著地增强星号活性。在选择期间,#26、#56和#65与WT相比,具有减少的星号活性。当对每一个测序时,发现突变为D91A、E204G和K228A/A289V。将突变体#26PstI(D91A)标记为PstI-HF。
4.PstI-HF和WT PstI的比较
在NEB1-4缓冲液中,对λDNA底物,分别测量PstI-HF和WT PstI的FI。稀释缓冲液是NEB稀释缓冲液C。比较如在图13中所示,并且结果在表12(下面)中列出。
表12:PstI-HF和WT PstI的比较
在NEB2和NEB4缓冲液中,PstI-HF表现最好,其中优选的FI为≥2000;WT PstI在NEB 3缓冲液中表现最好,其中FI为120。总FI改进因子为≥2000/120=16倍。
1.NcoI的表达
在大肠杆菌(pSYX20-NcoIM、pRRS-NcoIR)中实现NcoI的表达。pRRS是pUC19衍生质粒,并且pSYX20是与pRRS载体相容的低拷贝数质粒。细胞在30℃下,在具有Amp和卡那霉素(Kan)的LB中生长过夜。
2.NcoI的诱变
将NcoI中所有66个带电荷的残基突变为Ala。这些残基是:7、8、19、22、27、30、31、32、33、37、39、42、46、55、56、61、62、64、68、69、75、84、88、89、92、93、95、97、100、116、136、144、146、162、166、170、178、183、185、187、188、189、196、199、202、204、209、211、212、213、216、219、227、229、237、241、244、250、251、257、259、261、268、279、282、285。
上面的数字相应于NcoI蛋白序列(SEQ ID NO:88)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pSYX20-NcoIM)。
3.NcoI-HF的选择
NcoI-HF的选择与PstI-HF的选择相似。如上所述,在5%甘油下,用λDNA作为底物,检测活性。使用pBR322或λ在19%DMSO中测定星号活性。发现下面的突变改进星号活性:A2T/R31A、D56A、H143A、E166A、R212A和D268A。在这些突变体中,选择NcoI(A2T/R31A)为NcoI-HF。
4.NcoI-HF和WT NcoI的比较
在NEB1-4缓冲液中,对λDNA,分开测定NcoI-HF和WT NcoI的FI。比较在图14中示出,并且结果在表13(下面)中列出。
表13:NcoI-HF和WT NcoI的比较
在NEB4中,NcoI-HF示出最大的星号活性减少,其中优选的FI为≥16000;WT NcoI在NEB1、NEB2和NEB4中表现最好,其中优选的FI为120。总FI改进因子为≥16000/120=125。
1.NheI的表达
NheI在用pACYC-NheIM和placzz1-NheIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。
2.NheI的诱变
将NheI中所有92个带电荷的残基突变为Ala,其为下面的残基:5、6、7、14、17、19、22、25、28、31、38、39、42、47、49、52、56、58、59、60、64、74、75、76、77、80、91、93、104、105、110、112、116、117、123、126、130、131、133、135、137、147、149、152、159、160、165、167、170、171、174、179、183、195、202、205、207、209、210、211、214、216、218、221、225、231、241、243、244、250、252、256、257、259、264、266、267、281、285、287、288、289、291、297、300、307、313、315、318、321、324、325。
上面的数字相应于NheI蛋白序列(SEQ ID NO:89)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-NheIM)。
3.NheI-HF的选择
根据前面的实施例,进行NheI-HF的选择。标准和星号活性分析包含NEB4缓冲液以及分别5%甘油和39%甘油中的pBR322作为底物。发现仅一种突变显著改进NheI。这是E77A。选择NheI(E77A)作为NheI-HF。
4.NheI-HF和WT NheI的比较
在NEB1-4缓冲液的每一种中,在pXba上,分开测定NheI-HF和WT NheI的FI,pXba是含有来自腺病毒的XbaI消化片段的质粒底物。比较在图15中示出,并且结果在表14(下面)中列出。
表14:NheI-HF和WT NheI的比较
在NEB1缓冲液中,NheI-HF示出最佳活性,其中其FI为≥128,000。WT NheI在NEB1和NEB4缓冲液具有最大的活性,其中其最佳FI是32。所以,总FI改进因子为≥128,000/32=≥4000。
1.SspI的表达
从用pACYC-SspIM和placzz1-SspIR转化的大肠杆菌表达SspI。placzz1是pUC19衍生质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。
2.SspI的诱变
将SspI中所有81个带电荷的残基突变为Ala;这些是:3、8、12、13、18、19、20、35、40、42、44、47、52、60、62、65、68、69、72、74、76、77、78、79、83、85、88、89、90、96、100、108、109、118、119、127、128、129、131、132、137、144、153、154、155、156、158、165、168、170、172、177、178、179、181、185、186、187、191、194、195、197、202、204、215、222、229、237、240、246、250、256、257、259、260、264、265、267、268、269、274。
上面的数字相应于SspI蛋白序列(SEQ ID NO:99)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后进行DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-SspIM)。
3.SspI高保真度突变体的选择
在NEB4缓冲液以及分别5%甘油和39%甘油中,使用ΦX174底物,进行NheI的标准同源和星号活性分析。突变体#16(H65A)、#20(K74A)、#23(E78A)、#26(E85A)、#28(E89A)、#33(K109A)、#34(E118A)、#52(R177A)、#62(K197A)、#67(D229A)都示出减少的星号活性。K109A示出星号活性的最大减少。决定寻求星号活性的进一步改进。
4.进一步突变
将最初鉴定为Tyr的所有残基突变为Phe,而将其他残基Cys、Phe、Met、Asn、Gln、Ser、Thr和Trp突变为Ala。该组包括在下列位置处的95个残基突变:2、6、7、9、10、13、22、25、26、27、29、30、32、33、34、39、41、51、53、55、56、57、58、59、61、63、71、75、81、84、87、91、94、98、104、106、107、110、111、113、114、123、125、134、136、139、140、141、142、143、146、152、157、159、160、164、173、175、180、183、190、192、193、196、198、199、201、205、207、211、214、218、219、220、221、223、225、226、227、228、230、232、233、235、238、239、241、249、254、255、272、275、276、277、280。
上面的数字相应于SspI蛋白序列(SEQ ID NO:113)中的氨基酸位置。
通过上面相同的方法,进行PCR和选择。在这些突变体中,发现Y98F具有最少的星号活性,并且其在这方面比SspI(K109A)好。将SspI(Y98F)标记为SspI-HF,并且作为生产株储存。
5.SspI-HF和WT SspI的比较
在NEB1-4缓冲液中,使用λDNA底物,分开测定SspI-HF和WT SspI的FI。稀释剂是NEBC。比较在图16中示出,并且结果在表15(下面)中列出。
表15:SspI-HF和WT SspI的比较
在NEB4中,SspI-HF表现最好,其中优选的FI是500;WT SspI在NEB1、NEB2和NEB4中表现最好,其中优选的FI是64。总FI改进因子为500/64=8。
1.NotI的表达
NotI在NEB4缓冲液中具有显著的星号活性,并且在NEB3缓冲液中具有较少的星号活性。工程化NotI以在任何NEB缓冲液中减少星号活性。NotI在用pACYC184-EagIM和placzz2-NotIR转化的感受态大肠杆菌中表达。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.NotI的诱变
将NotI中所有97个带电荷的残基突变为Ala,如下列残基:2、4、8、10、17、21、22、26、31、34、35、36、49、52、57、59、62、72、74、75、77、84、87、96、97、105、117、121、122、125、126、129、130、133、140、141、145、150、152、156、160、165、167、174、176、177、182、187、189、193、194、200、205、208、210、219、224、225、227、236、237、245、251、253、267、271、272、280、283、290、292、294、296、304、306、308、310、314、319、321、323、327、331、335、336、339、353、354、356、358、361、365、367、368、369、370、378、382。
上面的数字相应于NotI蛋白序列(SEQ ID NO:90)中的氨基酸位置。
将突变体引入酶的方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入含有pACYC-EagIM的大肠杆菌。
3.NotI-HF的选择
如在前面实施例中描述的,进行NotI-HF的选择。标准同源和星号活性分析使用pXba底物,在NEB4缓冲液以及分别5%甘油和NEB ExoI缓冲液(67mM甘氨酸-KOH,pH 9.5,6.7mM MgCl
4.NotI-HF和WT NotI的比较
在NEB1-4缓冲液中,使用pXba底物,分开测定NotI-HF和WT NotI的FI。比较在图17中示出,并且结果在表16(下面)中列出。
表16:NotI-HF和WT NotI的比较
ND:不可检测,因为两个FI都是超出限度的不确定数。
在NEB2中,NotI-HF表现最好,其中优选的FI是≥128000;WT NheI在NEB3中表现最好,其中优选的FI是4000。总保真度指数改进因子为≥128000/4000=≥32。工程化NotI不但进一步提高NotI的FI,而且改变最佳缓冲液。
1.SacI的表达
SacI在用pLG-SacIM和pRRS-SacIR转化的大肠杆菌中表达。pRRS是pUC19衍生质粒,pLG是低拷贝相容性质粒。细胞在30℃下,在具有Amp和Kan的LB中生长过夜。
2.SacI的诱变
将SacI中所有101个带电荷的残基突变为Ala,如下列残基:6、7、11、15、16、19、24、25、29、30、39、40、42、45、58、61、62、63、65、67、70、71、72、74、75、76、81、85、94、98、104、105、114、116、120、123、127、129、133、134、141、143、144、145、146、150、151、154、169、170、172、181、187、196、197、200、201、211、216、220、221、224、227、228、232、238、240、246、248、250、258、270、271、277、281、288、289、295、296、297、299、303、306、313、314、321、322、324、332、336、337、340、342、344、345、347、349、350、353、357。
上面的数字相应于SacI蛋白序列(SEQ ID NO:93)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pLG-SacIM)。
3.SacI-HF的选择
使用与前面实施例相似的方法,完成SacI-HF的选择。标准活性检查使用pUC19、在NEB4中、具有5%甘油,并且星号活性检查在39%甘油下、在NEB4缓冲液中对pUC19进行。#52SacI(Q117H/R154A/L284P)和#60SacI(Q117H/R200A)都具有减少的星号活性,和SacIQ117H/R200A证明是优选的突变。Q117H是来自模板的遗留突变,其不影响SacI的活性。选择SacI(Q117H/R200A)为SacI-HF。
4.SacI-HF和WT SacI的比较
在NEB1-4缓冲液中,对pXba底物,分开测定SacI-HF和WT SacI的FI。比较在图18中示出,并且结果在表17(下面)中列出。
表17:SacI-HF和WT SacI的比较
在NEB4中,SacI-HF表现最好,其中FI是4000;WT SacI在NEB1和NEB4中表现最好,其中优选的FI是120。总FI改进因子为4000/120=32。
1.PvuII的表达
PvuII在用pACYC-PvuIIM和placzz2-PvuIIR转化的大肠杆菌中表达。Placzz2是pUC19衍生质粒;pACYC是低拷贝相容性质粒。细胞在30℃下,在具有Amp和Cam的LB中生长过夜。
2.PvuII的诱变
将PvuII中所有47个带电荷的残基突变为Ala,如下列残基:3、5、8、11、15、18、21、25、26、30、34、38、54、55、58、61、66、68、70、75、78、83、84、85、93、95、105、110、114、116、118、119、121、125、126、128、129、130、134、136、137、138、143、147、151、152和155。
上面的数字相应于PvuII蛋白序列(SEQ ID NO:92)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PvuIIM)。
3.PvuII高保真度突变体的选择
PvuII-HF的选择与前面的实施例相似。标准活性检查使用λDNA底物、在NEB4中、具有5%甘油,并且星号活性检查在39%甘油下、在NEB4缓冲液中对pBR322进行。没有突变体具有高保真度PvuII的资格。
4.另外的诱变步骤
另外的诱变步骤是在PvuII中将所有Ser、Thr突变为Ala,将Tyr突变为Phe。突变的位置是:2、19、46、49、67、71、77、81、82、94、104、113、123、124、132、133、148、154和157。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PvuIIM)。
PvuII(T46A)表现具有比WT PvuII更少的星号活性,然而,期望进一步改进。
将T46突变为所有其他氨基酸残基,这通过将密码子改变为相应氨基酸进行。在所有这些突变中,T46H、T46K、T46Y、T46G都比T46A更好。选择T46G作为PvuII-HF。
5.PvuII-HF和WT PvuII的比较
在NEB1-4缓冲液中,使用稀释剂A,分开测定PvuII-HF和WT PvuII对pBR322的FI。比较在图19中示出,并且结果在表18(下面)中列出。
表18:PvuII-HF和WT PvuII的比较
在NEB4中,PvuII-HF表现最好,其中FI是500;WT PvuII在NEB1和NEB4中表现最好,其中优选的FI是250。总FI改进因子为500/250=2。尽管总FI改进因子对PvuII不高,但是在NEB4中FI提高2000倍。
1.MfeI的表达
MfeI在用pACYC-MluCIM和pRRS-MfeIR转化的大肠杆菌中表达。pRRS是pUC19衍生质粒;pACYC是低拷贝相容性质粒。MluCIM甲基化AATT,其是MfeI的内部四个核酸序列。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.MfeI的诱变
分三批进行MfeI的诱变。第一批是所有的带电荷的残基,将其突变为Ala,如下列氨基酸位置:5、9、19、24、36、39、44、45、47、48、50、60、61、64,65、72、83、87、90、92、93、98、100、101、103、107、109、110、115、119、120、121、124、132、135、142、143、144、153、155、158、159、161、162、164、165、171、172、175、181、184、187、188、192、195、196、198、199、200;第二批是具有羟基的所有残基:Ser、Thr和Tyr,其中Ser和Thr被改变为Ala,并且Tyr被改变为Phe。所述残基是在:4、7、21、28、38、40、43、53、74、75、76、81、89、91、112、122、127、134、136、157、167、170、173、177、185和200。第三批是残基Cys、Phe、Met、Asn、Gln、Trp,都改变成Ala,所述残基是在:10、12、13、25、26、29、31、32、35、51、55、67、68、77、78、84、88、96、102、105、117、123、126、141、148、149、152、168、169、174、176、178、179、180、183、191、193、194。
上面的数字相应于MfeI蛋白序列(SEQ ID NO:5)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-MluCIM)。
3.MfeI-HF的选择
使用与前面实施例相似的方法,完成MfeI-HF的选择。在NEB4中,应用5%甘油、使用ΦX174底物测定切割活性,并且在NEB4中,应用39%甘油、使用ΦX174底物测定星号活性。该酶的显著困难是许多突变改进了酶的切割活性且星号活性减少,但是比WT酶需要更高的甘油浓度。MfeI(K50A)是一个实例,其在高浓度甘油中具有减少的星号活性和高切割活性,而在较低甘油浓度中,所述活性是低的。MfeI(Y173A)也减少星号活性。优选的突变为Q13A/F35Y。F35Y的突变来自模板,并且Q13A是靶向突变。将MfeI(Q13A/F35Y)标记为MfeI-HF。
4.MfeI-HF和WT MfeI的比较
在NEB1-4缓冲液中,对λDNA底物,分开测定MfeI-HF和WT MfeI的FI,其中在NEB稀释剂A中进行稀释。比较在图20中示出,并且结果在表19(下面)中列出。
表19:MfeI-HF和WT MfeI的比较
在NEB1和NEB4中,MfeI-HF表现最好,其中优选的FI为≥1000;在NEB1和NEB4中,WTMfeI表现最好,其中优选的FI为32。总FI改进因子是≥1000/32=32倍。
1.HindIII的表达
HindIII在用pUC19-HindIIIRM转化的大肠杆菌中表达,所述pUC19-HindIIIRM含有HindIII内切核酸酶和甲基化酶基因。细胞在30℃下,在具有Amp的LB中生长过夜。
2.HindIII的诱变
将HindIII中88个带电荷的残基突变为Ala。这些是:2、3、7、8、14、20、22、34、37、39、42、45、52、55、61、62、66、69、74、84、87、89、94、100、101、109、111、114、117、120、123、124、126、128、132、134、135、136、137、138、153、158、162、163、171、172、180、182、183、190、197、198、201、202、207、209、214、215、218、222、225、227、228、229、237、238、243、244、245、249、250、251、254、255、261、265、266、267、270、274、275、281、283、286、290、293、296、297。
在位置4、11、15、17、18、19、21、23、26、27、30、31、36、38、46、57、58、59、60、63、64、76、77、80、82、83、88、91、99、102、103、104、112、113、116、118、121、122、125、131、133、139、143、146、147、148、149、151、152、154、155、157、159、160、164、168、169、170、178、184、185、187、188、189、191、193、194、195、199、200、203、204、206、210、211、212、213、216、217、219、220、221、224、230、232、233、236、240、241、246、252、253、256、258、262、263、264、277、278、279、280、284、287、288、294、295、299处,将所有残基Cys、Met、Asn、Gln、Ser、Thr、Trp改变为Ala,而将Tyr改变为Phe。
上面的数字相应于HindIII蛋白序列(SEQ ID NO:85)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER3081。
3.HindIII-HF的选择
使用与前面的实施例相似的方法,完成HindIII-HF的选择。标准活性检查使用λDNA、在NEB4中并具有5%甘油,并且星号活性在具有39%甘油的NEB4缓冲液中使用λDNA底物测量。发现HindIII的两个突变体具有减少的星号活性。这些是HindIII(K198A)和S188P/E190A。将HindIII(K198A)标记为HindIII-HF。
4.HindIII-HF和WT HindIII的比较
在NEB1-4缓冲液中的每一种中,使用λDNA底物,用稀释剂B,分开测定HindIII-HF和WT HindIII的FI。比较在图21中示出,并且结果在表20(下面)中列出。
表20:HindIII-HF和WT HindIII的比较
在NEB2中,HindIII-HF表现最好,其中优选FI是≥64000;WT HindIII在NEB2中表现最好,其中优选的FI是250。总FI改进因子是4000/120=32。
1.SbfI的表达
SbfI在用pUC19-SbfIRM转化的大肠杆菌中表达。细胞在30℃下,在具有Amp的LB中生长过夜。
2.SbfI的诱变
将SbfI中78个带电荷的残基突变为Ala。这些残基是:5、8、15、18、23、27、30、34、46、49、50、53、58、63、66、70、71、74、81、82、83、85、86、87、90、94、103、115、120、121、127、132、135、136、143、144、147、150、152、154、164、169、170、183、184、187、188、192、196、204、206、208、213、214、215、218、219、226、228、230、233、237、238、239、241、248、251、253、257、258、259、260、262、266、282、284、285、288、293、297、299、304、305、307、311、316和322。
也将SbfI中的Ser和Thr残基突变为Ala。将Tyr突变为Phe。靶向下列位置:3、4、5、10、13、16、31、35、38、54、55、56、68、76、78、80、88、109、111、116、119、129、131、137、146、162、174、197、198、201、205、210、224、252、263、270、272、286、298、315、321。
也将下列位置的另外55个Cys、Phe、Met、Asn、Gln、Trp残基突变为Ala:2、24、26、29、32、51、62、65、67、72、84、91、92、95、97、101、104、106、110、112、114、117、124、134、140、157、160、171、178、179、185、189、193、212、217、225、231、243、245、247、256、265、268、277、279、280、281、283、287、289、290、296、301、313和317。
上面的数字相应于SbfI蛋白序列(SEQ ID NO:96)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将突变的产物转化入大肠杆菌菌株ER2984。
3.SbfI-HF的选择
如在前面的实施例中描述的,完成SbfI-HF的选择。标准活性检查使用λDNA、在NEB4中并具有5%甘油,并且星号活性检查针对λDNA在核酸外切酶I缓冲液中进行。将SbfI(K251A)标记为SbfI-HF。
4.SbfI-HF和WT SbfI的比较
在NEB1-4缓冲液中,对λDNA,用稀释剂C,分开测定SbfI-HF和WT SbfI的FI。比较在图22中示出,并且结果在表21(下面)中列出。
表21:SbfI-HF和WT SbfI的比较
在NEB1和NEB4中,SbfI-HF表现最好,其中优选FI是1000;WT SbfI在NEB1中表现最好,其中优选的FI是8。总FI改进因子是1000/8=125倍。
1.EagI的表达
EagI在用pBR322-EagIRM转化的大肠杆菌中表达。细胞在30℃下,在具有20μg/ml四环素的LB中生长过夜。
2.EagI的诱变
将Asp、Glu、His、Lys、Arg、Ser、Thr、Asn和Gln残基突变为Ala。将Tyr突变为Phe。这些是下列残基:2、3、4、5、6、9、13、14、17、19、21、23、27、35、36、37、40、42、43、44、45、46、49、51、53、55、56、58、60、66、67、69、71、72、73、74、75、77、78、80、82、86、87、92、93、94、95、98、99、100、102、103、104、105、112、113、114、116、117、119、122、125、127、132、134、135、137、139、140、141、145、147、148、150、152、154、155、156、157、160、162、163、164、166、169、172、173、176、177、178、179、182、185、187、188、189、193、196、197、201、202、203、204、205、206、208、209、212、217、220、221、222、224、225、230、235、236、237、238、239、240、241、243、245、246、247、248、251、255、257、258、259、260、263、264、265、266、270、272、273、275、276、277、279、280、283、286、288、289、291、295、296。
上面的数字相应于EagI蛋白序列(SEQ ID NO:82)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER 3081中,并且在具有四环素的LB琼脂平板上生长。
3.EagI-HF的选择
使用与前面实施例不同的方法,完成EagI-HF的选择,所述方法使用高浓度甘油、高浓度DMSO或高pH。在粗提物中,因为表达太低而不能示出星号活性,纯化每一突变体以检查星号活性会是非常冗长的。根据前面的实施例,推断与NEB3相比,在NEB4中HF内切核酸酶倾向具有增加的切割活性。因此,粗提物中EagI的活性在NEB3和NEB4中都测量;选择具有最高NEB4/NEB3比率的一个。将EagI(H43A)标记为EagI-HF。
4.EagI-HF和WT EagI的比较
在NEB1-4缓冲液的每一个中,对pXba底物,分开测定EagI-HF和WT EagI的FI。比较在图23中示出,并且结果在表22(下面)中列出。
表22:EagI-HF和WT EagI的比较
在NEB2和NEB4中,EagI-HF表现最好,其中优选FI是500;WT EagI在NEB3和NEB4中表现最好,其中优选的FI是250。总FI改进因子是500/250=2。
1.EcoRV的表达
EcoRV在用pACYC-EcoRVM和placzz1-EcoRV转化的大肠杆菌中表达。Placzz1是pUC19衍生质粒,并且pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.EcoRV的诱变
将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr和Trp残基改变为Ala。将Tyr改变为Phe。这些是:2、4、5、6、9、12、13、14、15、16、17、18、19、21、25、27、29、31、35、36、37、38、41、42、44、45、47、48、49、53、54、57、58、59、61、64、65、67、68、69、70、71、72、74、75、76、78、79、81、82、84、85、86、90、92、93、94、95、96、97、98、99、100、101、102、104、105、106、110、111、112、113、114、115、116、117、118、119、120、123、125、126、127、128、131、132、136、138、139、140、143、144、145、146、147、149、150、151、152、154、155、157、158、161、163、164、167、169、171、172、173、174、179、183、185、186、187、188、191、193、195、196、197、198、199、201、203、206、207、208、209、210、211、212、214、215、216、217、218、219、220、221、222、223、224、226、227、228、229、230、231、232、234、235、236、237、238、239、241、242、244和245。
上面的数字相应于EcoRV蛋白序列(SEQ ID NO:84)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-EcoRVM)。
3.EcoRV-HF的选择
使用与前面实施例相似的方法,完成EcoRV-HF的选择。标准活性检查在NEB4中、应用5%甘油使用pXba进行,并且星号活性检查针对pXba、应用39%甘油在核酸外切酶I缓冲液中进行。发现EcoRV(D19A/E27A)与WT EcoRV相比具有减少的星号活性。将该突变体标记为EcoRV-HF。对于该突变体,E27A是靶向突变,并且D19A是自发突变。双突变体比D19A和E27A单突变体在星号活性方面具有更大的减少。
4.EcoRV-HF和WT EcoRV的比较
在NEB1-4缓冲液中的每一种中,对pXba底物,分开测定EcoRV-HF和WT EcoRV的FI。比较在图24中示出,并且结果在表23(下面)中列出。
表23:EcoRV-HF和WT EcoRV的比较
在NEB2和NEB4中,EcoRV-HF表现最好,其中优选FI是≥64000;WT EcoRV在NEB3中表现最好,其中优选的FI是1000。总FI改进因子为≥64000/1000=64。
1.AvrII的表达
AvrII在用pUC19-AvrIIRM转化的大肠杆菌中表达。细胞在30℃下,在具有Amp的LB中生长过夜。
2.AvrII的诱变
将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr和Trp残基突变为Ala。将Tyr改变为Phe。这些是:2、3、4、6、8、9、10、12、15、17、19、20、22、23、27、29、30、31、32、34、36、40、41、42、43、44、46、47、48、50、51、53、55、56、57、58、59、60、65、68、70、72、74、75、76、77、79、80、82、83、84、86、87、88、94、95、96、97、100、104、105、106、107、108、110、112、113、116、117、119、120、121、122、123、124、126、127、129、130、131、132、134、136、139、142、143、144、145、150、151、152、153、154、156、157、158、161、163、164、165、166、168、169、173、174、177、178、181、182、184、186、187、188、189、190、191、192、195、198、200、202、206、207、211、215、216、220、223、224、226、229、230、231、232、233、234、235、236、237、239、243、244、245、246、248、249、253、255、256、260、262、264、265、266、267、268、269、270、272、274、276、277、278、279、280、281、284、285、286、288、289、290、291、299、302、303、304、305、306、308、310、312、314、315、316、318、321、322、324、325、328、331、333、335、337、338、339、340、342、343、346、347、348、350、351、353、354、355、356、358。
上面的数字相应于AvrII蛋白序列(SEQ ID NO:80)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌菌株ER2984中。
3.AvrII-HF的选择
使用与前面实施例相似的方法,完成AvrII-HF的选择。切割活性在NEB4中应用5%甘油使用pBC4测定,并且星号活性在具有39%甘油的ExoI缓冲液中应用pBC4测定。突变体#16(M29A)、#57(E96A)、#60(Y104F)、#62(K106A)、#154(S127A)、#170(F142A)都示出改进。将AvrII(Y104F)标记为AvrII-HF。
4.AvrII-HF和WT AvrII的比较
在NEB1-4缓冲液中的每一种中,对T7 DNA底物,使用稀释剂B,分开测定AvrII-HF和WT AvrII的FI。比较在图25中示出,并且结果在表24(下面)中列出。
表24:AvrII-HF和WT AvrII的比较
在NEB1和NEB4中,AvrII-HF表现最好,其中优选FI是1000;WT AvrII在NEB1和NEB4中表现最好,其中优选的FI是64。总FI改进因子是1000/64=16。
1.BstXI的表达
BstXI在用pACYCBstXIMS和pUC19-BstXIR转化的大肠杆菌中表达。pACYC是低拷贝相容性质粒。BstXI必须具有甲基化酶基因和特异性基因以具有甲基化酶功能。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.BstXI的诱变
如下,在BstXI中,进行237个氨基酸突变。将Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr、Trp突变为Ala。将Try突变为Phe。这些是:4、6、7、9、11、12、14、15、17、18、20、21、22、23、24、26、27、29、30、31、32、33、34、35、36、37、39、40、42、43、46、48、50、53、54、57、58、59、60、62、63、64、65、66、71、72、73、75、76、78、80、81、82、83、84、86、89、91、93、94、95、96、97、98、103.105、106、108、110、111、112、114、117、118、120、123、124、125、126、127、128、129、130、131、137、138、139、141、142、144、145、146、148、151、152、153、154、155、156、159、162、163、166、168、169、171、172、173、174、175、176、177、178、182、185、188、189、191、193、194、195、196、198、199、201、204、208、209、210、211、212、214、215、216、217、218、219、220、221、223、228、229、230、233、235、236、238、239、240、244、245、248、249、250、253、254、255、258、259、260、261、263、264、265、267、268、269、272、276、277、278、279、280、282、285、286、287、288、289、291、293、294、295、300、301、302、304、305、306、308、309、312、314、317、318、319、320、323、324、325、326、330、331、333、334、335、337、343、344、345、346、347、349、353、355、356、357、358、359、360、362、363、364、365、367、369、371、373、374、376、377、378、379、380、381、382和383。
上面的数字相应于BstXI蛋白序列(SEQ ID NO:7)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BstXIMS)。
3.BstXI-HF的选择
使用与前面实施例相似的方法,完成BstXI-HF的选择。切割活性在NEB4中应用5%甘油使用pBC4测定,并且星号活性在具有39%甘油的NEB4缓冲液中使用pBC4 DNA底物测定。突变体#36(Y57F)、#44(N65A)、#48(E75A)、#49(N76A)和#124(K199A)都具有减少的星号活性。将BstXI(N65A)标记为BstXI-HF。
4.BstXI-HF和WT BstXI的比较
在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定BstXI-HF和WT BstXI的FI。比较在图26中示出,并且结果在表25(下面)中列出。
表25:BstXI-HF和WT BstXI的比较
在NEB2和NEB4中,BstXI-HF表现最好,其中优选FI是≥250;WT BstXI在NEB2、NEB3和NEB4中表现最好,其中优选的FI是32。总FI改进因子为≥250/32=8。
1.PciI的表达
PciI在用pACYC-PciIM和placzz1-PciIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒,pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.PciI的诱变
利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser、Thr突变PciI中151个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:2、3、4、6、8、9、10、11、12、14、17、18、19、21、24、25、26、28、29、30、31、33、34、35、36、38、39、41、44、46、47、49、50、51、54、55、56、58、59、60、63、67、68、69、71、74、75、78、80、81、82、85、86、91、92、95、97、98、101、103、104、107、109、113、114、115、118、119、120、121、122、124、126、127、129、130、131、132、133、135、136、137、138、143、145、146、147、148、149、151、152、153、154、155、157、158、159、161、164、165、167、172、175、178、179、180、182、184、185、186、190、192、193、196、197、198、199、200、202、203、206、207、209、210、215、218、221、222、228、229、230、231、232、233、234、235、237、238、239、241、242、243、244、246、247、248、253、254、255、256。
上面的数字相应于PciI蛋白序列(SEQ ID NO:15)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-PciIM)。
3.PciI-HF的选择
使用与前面实施例相似的方法,完成PciI-HF的选择。切割活性在NEB4中应用5%甘油使用SalI-切割pBR322测定,并且星号活性在具有39%甘油的ExoI缓冲液中使用SalI-切割pBR322测定。双突变体PciI(E78A/S133A)具有减少的星号活性和强的切割活性。该突变体不是上面描述的靶向突变之一,而是偶然随机事件。
4.PciI-HF和WT PciI的比较
在NEB1-4缓冲液中的每一种中,对pXba底物,使用稀释剂A,分开测定PciI-HF和WTPciI的FI。比较在图27中示出,并且结果在表26(下面)中列出。
表26:PciI-HF和WT PciI的比较
在NEB2、NEB3和NEB4中,PciI-HF表现最好,其中优选FI是≥2000;WT PciI在NEB3中表现最好,其中优选的FI是120。总FI改进因子为≥2000/120=16。
1.HpaI的表达
HpaI在用pACYC-MseIM和placzz1-HpaIR转化的大肠杆菌中表达。placzz1是pUC19衍生质粒,pACYC是低拷贝相容性质粒。细胞在37℃下,在具有Amp和Cam的LB中生长过夜。
2.HpaI的诱变
利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变HpaI中的156个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:7、8、9、13、14、16、17、19、20、21、22、23、26、27、29、30、33、34、35、36、37、38、40、41、42、46、47、48、50、51、56、57、59、60、65、67、69、71、72、74、75、78、79、80、81、82、83、84、85、86、89、91、93、94、95、99、100、104、105、106、108、109、110、113、115、117、119、121、122、123、124、127、128、130、131、133、135、136、137、138、139、141、142、146、147、149、150、152、156、158、159、160、162、164、165、166、167、168、169、170、172、173、176、177、180、181、182、184、185、187、188、190、191、192、193、195、196、197、202、204、206、208、209、211、212、214、215、216、217、218、219、220、221、222、223、224、225、228、230、231、233、234、235、236、237、238、240、241、242、243、244、245、247、248、249。
上面的数字相应于HpaI蛋白序列(SEQ ID NO:86)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-MseIM)。
3.HpaI-HF的选择
使用与前面实施例不同的方法,完成HpaI-HF的选择。在NEB2缓冲液中,使用λDNA底物,测定切割活性和星号活性。在NEB2中,该HpaI具有比在NEB4中多得多的星号活性,并且可在5%甘油中明显观察到。
HpaI(Y29F)和HpaI(E56A)都是优选的具有减少星号活性的突变。将HpaI(E56A)标记为HpaI-HF。
4.HpaI-HF和WT HpaI的比较
在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定HpaI-HF和WTHpaI的FI。比较在图28中示出,并且结果在表27(下面)中列出。
表27:HpaI-HF和WT HpaI的比较
在NEB2中,HpaI-HF表现最好,其中优选FI是≥2000;WT PciI在NEB4中表现最好,其中优选FI是16。总FI改进因子为≥2000/16=120。
1.AgeI的表达
AgeI在用pRRS-AgeIRM和psyx20-lacIq转化的大肠杆菌中表达。pRRS是pUC19衍生质粒,psyx20-lacIq是低拷贝相容性质粒,其带有在lacIq启动子下表达的lacI。细胞在37℃下,在具有Amp和Kan的LB中生长至200Klett单位,然后用0.5mM IPTG在25℃下诱导过夜。AgeI的表达极难实现,因为它是不稳定的。
2.AgeI的诱变
利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变AgeI中149个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:2、4、6、7、9、14、16、18、19、21、22、23、24、25、26、27、29、30、31、32、37、38、40、42、43、44、45、49、51、53、55、56、58、60、62、64、65、67、68、69、72、73、75、77、78、79、82、83、85、86、87、88、90、91、92、94、96、97、102、103、104、105、110、111、114、116、119、120、122、123、128、129、130、134、135、138、139、140、142、144、146、147、148、152、153、155、157、159、166、168、170、173、174、176、177、178、182、183、185、186、188、192、195、198、200、201、206、211、212、214、217、219、220、222、223、224、225、226、227、229、231、233、234、235、237、238、239、240、241、243、245、247、248、250、251、253、255、256、258、260、262、265、266、267、268、269、271、272。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(psyx20-lacIq)。
上面的数字相应于AgeI蛋白序列(SEQ ID NO:79)中的氨基酸位置。
3.AgeI-HF的选择
使用与前面实施例相似的方法,完成AgeI-HF的选择。标准活性检查在NEB4中应用5%甘油使用pXba进行,并且星号活性检查在具有39%甘油的NEB4缓冲液中对pXba进行。因为表达系统的困难性,在获得有意义的突变体之前,重复该选择八次。两个突变体——S201A和R139A——具有减少的星号活性,并且将R139A标记为AgeI-HF。
4.AgeI-HF和WT AgeI的比较
在NEB1-4缓冲液中的每一种中,对pXba底物,使用稀释剂A,分开测定AgeI-HF和WTAgeI的FI。比较在图29中示出,并且结果在表28(下面)中列出。
表28:AgeI-HF和WT AgeI的比较
在NEB1和NEB4中,AgeI-HF表现最好,其中优选FI是≥500;WT AgeI在NEB3中表现最好,其中优选的FI是16。总FI改进因子为≥500/16=32。
1.BsmBI的表达
BsmBI在用pACYC-BsmAIM、ptaczz2-BsmBIR和psyx20-lacIq转化的大肠杆菌中表达。Ptaczz2是pUC19衍生质粒,其携带诱导型ptac启动子,pACYC是低拷贝相容性质粒。BsmAIM(GTCTC)遮盖(cover)BsmBI(CGTCTC)特异性。psyx20-lacIq是低拷贝载体,其具有强的lacI表达。细胞在37℃下生长,然后,在具有Amp、Cam和Kan的LB中诱导。
2.BsmBI的诱变
利用Cys、Asp、Glu、Phe、His、Lys、Met、Asn、Gln、Arg、Ser和Thr突变BsmBI中358个氨基酸残基。将Trp改变为Ala,和将Tyr改变为Phe。这些是:8、9、12、13、14、15、17、18、19、20、21、24、25、26、27、28、29、31、33、37、38、40、42、43、44、46、47、49、50、51、52、53、54、55、56、57、58、60、61、62、63、64、65、66、67、69、70、72、76、78、79、80、81、82、83、84、88、91、93、95、96、98、99、101、103、104、105、106、109、110、111、113、114、115、117、118、119、120、121、122、124、126、127、128、130、131、132、133、134、135、138、141、143、144、145、147、149、150、154、155、157、158、160、162、163、164、165、166、167、168、169、172、174、175、176、177、179、180、181、182、184、185、186、188、189、191、194、195、197、200、201、203、205、206、207、208、211、212、213、214、215、216、217、220、221、222、223、224、225、226、228、229、230、231、232、233、235、236、237、238、239、240、242、243、247、250、251、252、257、258、260、262、263、264、265、266、268、269、271、273、274、279、280、282、283、284、287、288、289、292、294、295、296、297、299、300、301、302、303、304、305、306、307、309、310、313、314、315、316、317、318、320、321、324、325、326、328、331、332、333、334、335、336、339、340、341、342、343、344、345、348、349、351、352、353、355、356、357、358、360、361、363、364、366、367、368、370、372、375、376、377、379、381、382、384、385、386、388、389、390、393、394、395、396、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、418、421、424、425、426、428、430、431、432、433、434、436、437、438、439、442、443、444、445、446、446、448、449、450、451、452、453、454、457、458、460、461、462、464、466、467、468、470、471、472、473、474、477、478、479、480、482、483、484、485、486、487、488、489、491、492、495、496、497、498、499、500、502、503、504、505、506、507、510、511、515、516、517、518、519、522、523。
上面的数字相应于BsmBI蛋白序列(SEQ ID NO:81)中的氨基酸位置。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BsmAIM,psyx20-lacIq)。
3.BsmBI-HF的选择
使用与前面实施例相似的方法,完成BsmBI-HF的选择。切割在NEB4中应用5%甘油使用λDNA测定,并且星号活性在具有39%甘油的NEB4缓冲液中使用Litmus28i测定。优选的突变体包括H230A、D231A和N185Y/R232A。标记N185Y/R232A为BsmBI-HF。
4.BsmBI-HF和WT BsmBI的比较
在NEB1-4缓冲液中的每一种中,对λDNA底物,使用稀释剂A,分开测定BsmBI-HF和WT BsmBI的FI。比较在图30中示出,并且结果在表29(下面)中列出。
表29:BsmBI-HF和WT BsmBI的比较
在NEB1、NEB2和NEB4中,BsmBI-HF表现最好,其中优选FI是≥500;WT BsmBI在NEB3中表现最好,其中优选的FI是120。总FI改进因子为≥500/120=4。
1.BspQI限制性内切核酸酶的位点定向诱变
用Km
将BspQI中122个带电荷的或不带电荷的氨基酸残基(Arg、Lys、His、Glu、Asp、Gln、Asn、Cys)通过位点定向诱变改变为Ala。在下列条件下,进行PCR:DNA变性,98℃持续30sec,1个循环;DNA变性/引物退火/延伸,98℃持续10sec,55℃到65℃进行30sec,72℃持续2min,进行18个PCR循环;72℃持续15min,1个循环。在100μl反应中,2单位的Phusion
用DpnI消化PCR DNA,以破坏模板DNA(Dam甲基化的)并与pSX33-earIM1M2共转化入大肠杆菌。培养各转化体过夜(5ml LB、50μg/ml Km
BspQI星号活性分析条件:1μg pUC19 DNA、5μl 10x NEB缓冲液1、25%DMSO、2.5μl澄清细胞提取物、无菌去离子水至50μl总体积,并且在50℃下温育1小时。通过电泳,在0.8到1%琼脂糖凝胶中,解析消化的DNA。
收获第二份细胞培养物(未诱导的),并通过Qiagen离心柱纯化方法(Qiagen,Valencia,CA)制备质粒DNA。通过大-染料双脱氧-终止子-测序方法(Big-dye dideoxy-terminator sequencing method),测序bspQIR等位基因,以证实期望的突变。在鉴定减少星号活性突变体之后,获得新转化体,并且制造IPTG-诱导的培养物。再次分析限制性活性和星号活性,以证实在所有四种缓冲液中与WT酶相比减少的星号活性。
在通过位点定向诱变构建的122个BspQI突变体中,两种BspQI变体——R388A和K279A——显示减少的星号活性。在缓冲液1和10%甘油中,R388A的星号活性减少大约16倍。然而,R388A在高酶浓度下仍旧显示星号活性。BspQI变体K279A也显示减少的星号活性(在减少星号活性方面>8-倍改进)。
为了进一步在高酶浓度下减少星号活性,将R388和K279取代为Phe、Pro、Tyr、Glu、Asp或Leu。分析各种R388X和K279X突变体的IPTG-诱导的细胞提取物的限制性活性和星号活性。发现R388F或K279P在细胞提取物或纯化酶中显示最小的星号活性。氨基酸取代不影响比活性。
为了仍进一步减少BspQI星号活性,通过位点定向诱变,将两种氨基酸取代组合进一个突变体酶中(双突变体,K279P/R388F)。该双突变体在具有10%甘油的缓冲液1和缓冲液2中缺少星号活性(图41B)。
表30:BspQI-HF对WT BspQI
在BspQI中发现保守的K279和R388氨基酸残基,其中在SapI中相应位置是K273和R380。6x His标记SapI表达克隆首先在pUC19中构建。SapI表达菌株是用Km
PCR、转化、质粒DNA制备和酶活性分析如对BspQI描述的进行,除了在37℃下,测定SapI活性。6x His-标记SapI变体K273P/R380F通过Ni-NTA柱色谱纯化,并且示出在存在25%DMSO或5%甘油情况下,显示减少的星号活性。
包含两种活性的KpnI已被改变为具有较低星号活性的突变体(国际公开号WO07/027464)。下面的实施例描述具有改进的星号活性和与野生型相似的切割活性的新的突变体。
将除了催化残基的带电荷的氨基酸残基(Asp、Glu、Arg、Lys和His)或极性氨基酸(Ser、Thr、Tyr、Asn、Gln、Phe、Trp、Cys和Met)单独突变为丙氨酸。
通过反向PCR,使用具有希望突变的引物,进行诱变。一般而言,在100μL终体积中,使用0.4mM的每种4dNTP、1x ThermoPol缓冲液(NEB)、20ng的模板DNA、40μmol的每种引物和4U的Vent DNA聚合酶(NEB),实施反向PCR。
分别含有Plac或Ptac启动子控制下的KpnIR的质粒pUC19或pAGR3被用作模板。使用下列温度方案进行PCR:94℃持续4分钟,然后94℃持续30秒进行变性、55℃持续30秒进行退火和72℃持续5分钟进行延伸的25个循环。循环后在72℃下温育7分钟,然后用20U的DpnI(NEB)在37℃下处理反应1小时,以降解模板DNA。在80℃下失活DpnI 20分钟后,使用2μl反应物转化用pSYX20-KpnIM预转化的50μL化学感受态NEB5alpha(NEB)。将转化的细菌铺板在含有100μg/ml氨苄青霉素和30μg/ml卡那霉素的LB板上,并且在37℃下温育12到15小时。每种构建物的3到4个菌落在1ml含有100μg/ml氨苄青霉素和30μg/ml卡那霉素的LB中,在37℃下培养12到15小时,并伴随200rpm的摇动。将培养物离心(spin down),并且重新悬浮在0.2ml的超声处理缓冲液(20mM Tris-HCl,pH 8.3,50mM NaCl,1mM EDTA,1mM PMSF)中。将重新悬浮的细胞超声处理20秒,然后在4℃下以13,000rpm离心5分钟。进行上清液稀释,并且分析其中5μL的KpnI切割活性。
对于筛查突变体,使用50μL总体积中5μL以10-或100-倍稀释的溶胞产物上清液、0.5μg的pXba DNA(NEB)和1x NEBuffer 4,进行活性分析反应。在37℃下温育1小时后,通过加入10μl的6x DNA上样染料停止分析反应,并且通过1xTBE中0.8%琼脂糖凝胶电泳分析。分析示出与亲代酶(KpnI D148E)相比具有增加的总切割活性的突变体在含有25%DMSO的缓冲液中减少的星号活性。
在1x NEBuffer 4中存在5%甘油和0.2mg/ml BSA的情况下(总体积=50μL),使用5μL用1μg的pXba DNA(NEB)温育的酶稀释物,进行分析。在37℃下温育1小时后,用20μg蛋白激酶K(NEB)在37℃下处理反应15分钟,然后通过1x TBE中0.8%琼脂糖凝胶电泳分析。使用50U的酶和1μg pXba DNA,在含有20mM Tris HCl、50mM NaCl,pH 7.9、1mM DTT和增加浓度的MgSO
随机诱变的结果是优选的突变体KpnI D148E,其示出比野生型酶和前面描述的KpnI D163I/K165A突变体(国际公开号WO 07/027464)低的星号活性。然而,KpnI D148E在高酶浓度下显示星号活性。在D148E背景中,构建双或三突变体以减少该观察到的星号活性。发现KpnI(D16N/E132A/D148E)具有比突变体D148E低的星号活性和高的比活性。通过位点定向诱变,引入氨基酸取代D148到E和E132到A。通过PCR引入D16到N的突变。在标准反应条件中,将纯化酶与底物DNA pXba(含有6个KpnI位点),在37℃下)温育1小时产生表31中示出的减少的星号活性。
表31:KpnI突变体的保真度指数
对于突变体D16N/E132A/D148E,上至4000U,没有观察到pXba的星号活性。当用KpnI D148E和D16N/E132A/D148E切割时,对于pBR322底物——其不含有KpnI位点——观察到的星号活性也被减少。
1.BsaI的表达
BsaI在用pACYC-BsmAIM、pUC19-BsaIR和psyx20-lacIq转化的大肠杆菌中表达。pACYC是低拷贝相容性质粒。BsmAIM(GTCTC)遮盖BsmBI特异性(CGTCTC)。psyx20-lacIq是具有强lacI表达的低拷贝载体。细胞在37℃下生长,然后在具有Amp、Cam和Kan的LB中诱导。
2.BsaI的诱变
BsaI的氨基酸与BsmBI的氨基酸相似。在相应的前述有效位点周围和相应的前述有效位点处的11个氨基酸被突变为R229A、S230A、Y231F、T232A、T233A、D234A、R235A、R236A、F238A、E239A、Y240F。
方法与在前面实施例中的方法相同,其使用反向PCR,然后为DpnI消化。然后,将处理的产物转化入大肠杆菌(pACYC-BsmAIM、psyx20-lacIq)。
3.BsaI-HF的选择
使用与前面实施例相似的方法,完成BsaI-HF的选择。标准活性检查在NEB4中应用5%甘油使用λDNA进行,并且星号活性检查在具有39%甘油的NEB4缓冲液中对litmus28i进行。在11种设计的突变体中的一种突变体Y231F减少星号活性,并将其标记为BsaI-HF。
4.BsaI-HF和WT BsaI的比较
在NEB1-4缓冲液中,对λDNA,使用稀释剂A,分开测定BsaI-HF和WT BsaI的FI。结果在表32(下面)中列出。
表32:BsaI-HF和WT BsaI的比较
在NEB2、NEB3和NEB4中,BsaI-HF表现最好,其中最好FI是≥8000;WT BsaI在NEB2和NEB4中表现最好,其中最好的FI是120。所以,总FI改进因子为≥8000/120=≥64。
序列表
<110> 新英格兰生物实验室公司
<120> 高保真度限制性内切核酸酶
<130> NEB-293-PCT
<160> 106
<170> PatentIn version 3.4
<210> 1
<211> 1089
<212> DNA
<213> 藤黄微球菌(Micrococcus luteus)
<400> 1
atgatcaagt acttgggtag caagcggacg ctcgtgcccg tcctcggtga catcgcttcg 60
gcctctgaag caacagaggc ggttgacctg ttcactggca cgacgcgtgt ggcgcaagag 120
ttcaagcgtc gcgggcttcg agttcttgct aacgacatag cgacgtactc cgaggtttta 180
gcccagtgct atatcgccac caacggccag gaagttgacc gccgtgcgct cgaggccgct 240
ctggcggagc tgaacgcctt gcccggcgaa cctggatact tcacggaaac cttctgtgag 300
gcttctcgct acttccagcc caagaacggg gctcgggtgg atgcaatcag gaatgcgatc 360
gacgaccggt acgcggactc atggatgcga ccgatcctcc tcacgagctt gatgcttgcg 420
gccgaccgcg tcgactccac taccggagtg cagatggctt acctgaagca gtgggccgcg 480
cgtgcgcaca atgatctaga gttgcggctt ccagacctaa tcgcaggtga cggtgacgct 540
gctcgtgagg atgcggtgac tctcgcacaa gagctgcctc gcgtccagct gatgtacctt 600
gatcctccct ataaccagca caggtacttc accaactacc atatttggga gaccctgatt 660
cgttgggatg cccctgagag ttatgggatc gcctgtaagc gcattgactc tcgagatgat 720
gccaccaaga gcccctataa tatgaagcgg cgaatgcccg acgagatgcg tcgcctgctg 780
atgaccatca aggcggacct cgcggttgta tcttacaaca atgagtcgtg gattgatccg 840
gagacgatga tgtcgaccct gcgcgatgcg ggatatgagg acgtgcgtct gctcgctttc 900
gactataagc gctacgttgg ggctcaaatc gggatctaca atccctccgg ggaaaaggtc 960
ggtcgtgtga gtcacctccg aaacatcgag tatctctttc ttgcgggacc aacggagcgc 1020
gttgaggtgt gcgccgcgag tgttgaacac cgagcactac ccaaggaacc ggaactcacc 1080
gcgttctag 1089
<210> 2
<211> 362
<212> PRT
<213> 藤黄微球菌
<400> 2
Met Ile Lys Tyr Leu Gly Ser Lys Arg Thr Leu Val Pro Val Leu Gly
1 5 10 15
Asp Ile Ala Ser Ala Ser Glu Ala Thr Glu Ala Val Asp Leu Phe Thr
20 25 30
Gly Thr Thr Arg Val Ala Gln Glu Phe Lys Arg Arg Gly Leu Arg Val
35 40 45
Leu Ala Asn Asp Ile Ala Thr Tyr Ser Glu Val Leu Ala Gln Cys Tyr
50 55 60
Ile Ala Thr Asn Gly Gln Glu Val Asp Arg Arg Ala Leu Glu Ala Ala
65 70 75 80
Leu Ala Glu Leu Asn Ala Leu Pro Gly Glu Pro Gly Tyr Phe Thr Glu
85 90 95
Thr Phe Cys Glu Ala Ser Arg Tyr Phe Gln Pro Lys Asn Gly Ala Arg
100 105 110
Val Asp Ala Ile Arg Asn Ala Ile Asp Asp Arg Tyr Ala Asp Ser Trp
115 120 125
Met Arg Pro Ile Leu Leu Thr Ser Leu Met Leu Ala Ala Asp Arg Val
130 135 140
Asp Ser Thr Thr Gly Val Gln Met Ala Tyr Leu Lys Gln Trp Ala Ala
145 150 155 160
Arg Ala His Asn Asp Leu Glu Leu Arg Leu Pro Asp Leu Ile Ala Gly
165 170 175
Asp Gly Asp Ala Ala Arg Glu Asp Ala Val Thr Leu Ala Gln Glu Leu
180 185 190
Pro Arg Val Gln Leu Met Tyr Leu Asp Pro Pro Tyr Asn Gln His Arg
195 200 205
Tyr Phe Thr Asn Tyr His Ile Trp Glu Thr Leu Ile Arg Trp Asp Ala
210 215 220
Pro Glu Ser Tyr Gly Ile Ala Cys Lys Arg Ile Asp Ser Arg Asp Asp
225 230 235 240
Ala Thr Lys Ser Pro Tyr Asn Met Lys Arg Arg Met Pro Asp Glu Met
245 250 255
Arg Arg Leu Leu Met Thr Ile Lys Ala Asp Leu Ala Val Val Ser Tyr
260 265 270
Asn Asn Glu Ser Trp Ile Asp Pro Glu Thr Met Met Ser Thr Leu Arg
275 280 285
Asp Ala Gly Tyr Glu Asp Val Arg Leu Leu Ala Phe Asp Tyr Lys Arg
290 295 300
Tyr Val Gly Ala Gln Ile Gly Ile Tyr Asn Pro Ser Gly Glu Lys Val
305 310 315 320
Gly Arg Val Ser His Leu Arg Asn Ile Glu Tyr Leu Phe Leu Ala Gly
325 330 335
Pro Thr Glu Arg Val Glu Val Cys Ala Ala Ser Val Glu His Arg Ala
340 345 350
Leu Pro Lys Glu Pro Glu Leu Thr Ala Phe
355 360
<210> 3
<211> 1146
<212> DNA
<213> 幽门螺旋杆菌(Helicobacter pylori) J166
<400> 3
ttggagaatt ttttgaataa tttagatatt aaaaccttag ggcaggtttt cacccctaaa 60
aagatagtgg atttcatgct cactctcaag cacaatcatg ggagtgtttt agagccaagc 120
gcgggcgatg ggagtttttt aaagcgctta aaaaaggctg tagggattga aatcgatcct 180
aaaatctgcc ctaaaaatgc cctttgcatg gacttttttg actacccttt agaaaatcaa 240
tttgacacga ttattggcaa tccgccctat gtcaagcaca aggatattgc gccaagcacg 300
aaagaaaaac tccattacag cctttttgat gaaaggagta atctatactt gtttttcata 360
gaaaaagcga tcaagcattt aaagcctaaa ggcgaattga ttttcatcac cccaagggat 420
tttttaaaat ccacttctag cgtgaaatta aacgaatgga tttacaaaga aggcacgata 480
acgcattttt ttgaattagg cgatcaaaag attttcccaa acgccatgcc taattgcgtg 540
atttttcgtt tttgtaaagg tgatttcagt agaatcacca acgatggttt gcaatttgtg 600
tgcaaaaaag gcattttgta tttcctcaac caatcttaca cgcaaaaatt aagcgaggtt 660
tttaaggtta aggtgggggc agtgagcggg tgcgataaga tttttaaaaa tgaaacatac 720
gggaatttag aatttgtcac ctcaatcacc aaaagaacca atgttttaga aaaaatggtt 780
tttgtcaata aacctaatga ttatttactc cagcataaag acagcttgat gcaaagaaag 840
attaaaaaat tcaatgaaag taattggttt gaatggggga ggatgcatca catatcccct 900
aaaaaacgca tttatgttaa cgccaaaacg cgccaaaaaa accccttttt catccaccaa 960
tgccctaatt atgacggctc tattttagcg ctattccctt ataaccaaaa tttggattta 1020
caaaacctct gcgataaact caacgctatc aactggcaag aattaggctt tgtgtgcggc 1080
gggcgttttt tgttttcgca gcgctcttta gaaaacgccc ttttgcctaa agacttttta 1140
aattag 1146
<210> 4
<211> 609
<212> DNA
<213> 发酵支原体(Mycoplasma fermentans)
<400> 4
atgggtaaat ctgaattaag tggaagatta aattggcaag cattggctgg attaaaagct 60
agtggtgctg aacaaaactt atataacgtg tttaacgctg tttttgaagg aactaaatac 120
gttttatacg agaagccaaa gcaccttaaa aatctatacg ctcaagtagt cttacctgat 180
gatgttatta aagaaatttt taatccttta attgatttat caactactca atggggtgtt 240
tctccagatt tcgcaataga aaatacagaa acgcataaaa ttctttttgg tgaaattaaa 300
agacaagatg gatgggtaga aggtaaagat cctagtgctg gcaggggtaa tgcacatgag 360
agatcttgta aattatttac tcctggatta ttaaaagctt atagaacaat tggtggaatt 420
aacgatgaag agatattgcc attctgggtt gtattcgaag gtgatataac acgagatccc 480
aaaagagtaa gagaaattac tttctggtat gaccactatc aagataatta tttcatgtgg 540
cgaccaaatg aatcaggcga aaaattagtt caacacttca atgaaaaatt aaaaaaatat 600
ttagattaa 609
<210> 5
<211> 202
<212> PRT
<213> 发酵支原体
<400> 5
Met Gly Lys Ser Glu Leu Ser Gly Arg Leu Asn Trp Gln Ala Leu Ala
1 5 10 15
Gly Leu Lys Ala Ser Gly Ala Glu Gln Asn Leu Tyr Asn Val Phe Asn
20 25 30
Ala Val Phe Glu Gly Thr Lys Tyr Val Leu Tyr Glu Lys Pro Lys His
35 40 45
Leu Lys Asn Leu Tyr Ala Gln Val Val Leu Pro Asp Asp Val Ile Lys
50 55 60
Glu Ile Phe Asn Pro Leu Ile Asp Leu Ser Thr Thr Gln Trp Gly Val
65 70 75 80
Ser Pro Asp Phe Ala Ile Glu Asn Thr Glu Thr His Lys Ile Leu Phe
85 90 95
Gly Glu Ile Lys Arg Gln Asp Gly Trp Val Glu Gly Lys Asp Pro Ser
100 105 110
Ala Gly Arg Gly Asn Ala His Glu Arg Ser Cys Lys Leu Phe Thr Pro
115 120 125
Gly Leu Leu Lys Ala Tyr Arg Thr Ile Gly Gly Ile Asn Asp Glu Glu
130 135 140
Ile Leu Pro Phe Trp Val Val Phe Glu Gly Asp Ile Thr Arg Asp Pro
145 150 155 160
Lys Arg Val Arg Glu Ile Thr Phe Trp Tyr Asp His Tyr Gln Asp Asn
165 170 175
Tyr Phe Met Trp Arg Pro Asn Glu Ser Gly Glu Lys Leu Val Gln His
180 185 190
Phe Asn Glu Lys Leu Lys Lys Tyr Leu Asp
195 200
<210> 6
<211> 1152
<212> DNA
<213> 嗜热脂肪芽胞杆菌(Bacillus stearothermophilus) X1
<400> 6
atggctatta cattatgtga cataaatggt tgtagacttg agagaggaca tactggtaaa 60
cataataaat ttcctgaatt tgtatggact tctcaattta ataaaaaaga tattgataag 120
gtcaataaag caggatatgc aacaccaaga ggtggggaca aaggagccta tcagaaccat 180
gtttacagaa ataataaagt aattattcct tttgaaaggt tggaaaatgt taatttaaat 240
aactatcaag atggatatgt tattaggtta ttccctaatc agtactttga atcagccggg 300
gtagttaagc cggaattctt acaaccaaat tcatttgtta aagttgggga caatgcattt 360
attttatatc gcacacattc atcttttgag gaattacctc ctctaccaga ctgggaggtt 420
agacatctaa aaaagaacgg taatatagtt accagaagaa gtaaggacgt aatcgatgct 480
ggacattatg tcttacgatt atcatcaatt agtaacaaaa aagaaagaaa agagggccct 540
cctcaaggta tttttgcacc tgaatatgca aatgcagaga ctaattatct gtcaaaagca 600
tttttagcct ggttaattat taaaactcaa aatagtccgt ataatgaaga acaattccaa 660
cacttaagag cgatcttaat tagtcataat ctcatcaata tttctcaact tgaagaaaag 720
gctattctaa agaatggtat cacatgctgc cctttatgcg agcaaattat tttttacgaa 780
cagctacacg aaatggtttc ttttgaaggt gcgtctggcc ttgcgaattc acaagaacag 840
gttgagggtg caactaggtc aacatcagtt aatttattcc atatggtacc attagtatat 900
gaaaccttgg aacacaaacc tgatcaaata gcatggggcc atgccatttg taatactaga 960
cttggtcaaa gagagtgcct gcctcttagt agactaaaac aagaaggtac gcccgttggt 1020
cttcttgatg aagattcgaa tcttgaagta ttaggatgga ttagtaaaga taagcaattt 1080
attcgtacag aaaatgggga agtttggatt aaaattacag atattgaatt taacgatgac 1140
tttgaagaat aa 1152
<210> 7
<211> 383
<212> PRT
<213> 嗜热脂肪芽胞杆菌 X1
<400> 7
Met Ala Ile Thr Leu Cys Asp Ile Asn Gly Cys Arg Leu Glu Arg Gly
1 5 10 15
His Thr Gly Lys His Asn Lys Phe Pro Glu Phe Val Trp Thr Ser Gln
20 25 30
Phe Asn Lys Lys Asp Ile Asp Lys Val Asn Lys Ala Gly Tyr Ala Thr
35 40 45
Pro Arg Gly Gly Asp Lys Gly Ala Tyr Gln Asn His Val Tyr Arg Asn
50 55 60
Asn Lys Val Ile Ile Pro Phe Glu Arg Leu Glu Asn Val Asn Leu Asn
65 70 75 80
Asn Tyr Gln Asp Gly Tyr Val Ile Arg Leu Phe Pro Asn Gln Tyr Phe
85 90 95
Glu Ser Ala Gly Val Val Lys Pro Glu Phe Leu Gln Pro Asn Ser Phe
100 105 110
Val Lys Val Gly Asp Asn Ala Phe Ile Leu Tyr Arg Thr His Ser Ser
115 120 125
Phe Glu Glu Leu Pro Pro Leu Pro Asp Trp Glu Val Arg His Leu Lys
130 135 140
Lys Asn Gly Asn Ile Val Thr Arg Arg Ser Lys Asp Val Ile Asp Ala
145 150 155 160
Gly His Tyr Val Leu Arg Leu Ser Ser Ile Ser Asn Lys Lys Glu Arg
165 170 175
Lys Glu Gly Pro Pro Gln Gly Ile Phe Ala Pro Glu Tyr Ala Asn Ala
180 185 190
Glu Thr Asn Tyr Leu Ser Lys Ala Phe Leu Ala Trp Leu Ile Ile Lys
195 200 205
Thr Gln Asn Ser Pro Tyr Asn Glu Glu Gln Phe Gln His Leu Arg Ala
210 215 220
Ile Leu Ile Ser His Asn Leu Ile Asn Ile Ser Gln Leu Glu Glu Lys
225 230 235 240
Ala Ile Leu Lys Asn Gly Ile Thr Cys Cys Pro Leu Cys Glu Gln Ile
245 250 255
Ile Phe Tyr Glu Gln Leu His Glu Met Val Ser Phe Glu Gly Ala Ser
260 265 270
Gly Leu Ala Asn Ser Gln Glu Gln Val Glu Gly Ala Thr Arg Ser Thr
275 280 285
Ser Val Asn Leu Phe His Met Val Pro Leu Val Tyr Glu Thr Leu Glu
290 295 300
His Lys Pro Asp Gln Ile Ala Trp Gly His Ala Ile Cys Asn Thr Arg
305 310 315 320
Leu Gly Gln Arg Glu Cys Leu Pro Leu Ser Arg Leu Lys Gln Glu Gly
325 330 335
Thr Pro Val Gly Leu Leu Asp Glu Asp Ser Asn Leu Glu Val Leu Gly
340 345 350
Trp Ile Ser Lys Asp Lys Gln Phe Ile Arg Thr Glu Asn Gly Glu Val
355 360 365
Trp Ile Lys Ile Thr Asp Ile Glu Phe Asn Asp Asp Phe Glu Glu
370 375 380
<210> 8
<211> 1536
<212> DNA
<213> 嗜热脂肪芽胞杆菌 X1
<220>
<221> misc_feature
<223> M.BstXI的DNA序列
<400> 8
atgatttttg ctgatattga atttgaaaaa gaactttttt cagctgctaa taaattaagg 60
ggaaaaattg ctccaagtga gtataagcat tatgttttgc ctttgatatt ccttagatat 120
ttatctctta aataccaaca aagaaggaat gaaattcaac aacagataaa tgattcaagg 180
gatcacaaga aaaatcaaga tgaagtgtta aagatattgg aagacaggac tgaatacacc 240
aaagtaaatg ttttctatat tcctgaaaaa gctagttggg aatacttatt gaaaaattcc 300
gaaaatgata aaattaaaga aatgatagat tcagctatgg aaatactgga aaatgaatat 360
gacgagttaa aaggtgtttt gccaaagata tataaaaact caaatatacc gaatgaagtt 420
attagtgatt tactaaaact attttctcaa gaagtatttt cagcacatga tggaagaaat 480
gttgatttat tggggagagt ttatgaatac tttataagta attttgctac tacagaaggt 540
actagaggtg gtgaatattt tacaccgtct tcaatcgtaa aattattggt agcaatgcta 600
gagcccatta aaggtacagt ttatgatccg gcctgtggga caggaggaat gtttattcag 660
tctaataaat atagagaaaa taatcataac ttgtgttttg taggccagga acaaaacgag 720
cttactatca aattggctaa aatgaatgga attctacatg gaataaatcc tgaaattaga 780
caaggtgatt cattattaaa tgaccgttat ccagaattga aagctgaaat tgtaatatct 840
aatccaccgt ttaatatgaa ggattgggga gctgaacgcc tgccacttaa tgataagcga 900
ttaataggac cggtaacaaa cagtaatgca aattacatgt ggatacagca ttttctatac 960
catttaaaag atggtggttt agcaggattt gttattgcta atggagcttt gactagtaat 1020
ctggctgctg aaaaaattgt aaggaaacac ttaatagaca atgattatgt agattgtgtt 1080
gttcaattac ctgaaaaaat gttctttggt actggcattc caagtgcttt agtgttttta 1140
agtaagaatc gaaatggaag taacggccat gccaaaagag aaaaagaggt tctatttatt 1200
gatgcaagcg ataagggaac attagtgggt aaaaagaata aaatattttt agatgatgaa 1260
ataaaagaaa ttgcagattt atatcattca tttaaatttt taaatgataa tgattataac 1320
catagtggtt tttacaaaaa ggttaacatt gaaaaaatcg tggaaaatga ttataaatta 1380
actccaactc tctatgtagg tgtaaaggaa gagactgaaa tggagaagcc atttagagaa 1440
atgataatag aatataaagc gatattagag caacaatttg aagaatcaaa caaactacag 1500
cagaaaatat taaagaattt agagggatta ttatga 1536
<210> 9
<211> 511
<212> PRT
<213> 嗜热脂肪芽胞杆菌 X1
<220>
<221> misc_feature
<223> M.BstXI的蛋白质序列
<400> 9
Met Ile Phe Ala Asp Ile Glu Phe Glu Lys Glu Leu Phe Ser Ala Ala
1 5 10 15
Asn Lys Leu Arg Gly Lys Ile Ala Pro Ser Glu Tyr Lys His Tyr Val
20 25 30
Leu Pro Leu Ile Phe Leu Arg Tyr Leu Ser Leu Lys Tyr Gln Gln Arg
35 40 45
Arg Asn Glu Ile Gln Gln Gln Ile Asn Asp Ser Arg Asp His Lys Lys
50 55 60
Asn Gln Asp Glu Val Leu Lys Ile Leu Glu Asp Arg Thr Glu Tyr Thr
65 70 75 80
Lys Val Asn Val Phe Tyr Ile Pro Glu Lys Ala Ser Trp Glu Tyr Leu
85 90 95
Leu Lys Asn Ser Glu Asn Asp Lys Ile Lys Glu Met Ile Asp Ser Ala
100 105 110
Met Glu Ile Leu Glu Asn Glu Tyr Asp Glu Leu Lys Gly Val Leu Pro
115 120 125
Lys Ile Tyr Lys Asn Ser Asn Ile Pro Asn Glu Val Ile Ser Asp Leu
130 135 140
Leu Lys Leu Phe Ser Gln Glu Val Phe Ser Ala His Asp Gly Arg Asn
145 150 155 160
Val Asp Leu Leu Gly Arg Val Tyr Glu Tyr Phe Ile Ser Asn Phe Ala
165 170 175
Thr Thr Glu Gly Thr Arg Gly Gly Glu Tyr Phe Thr Pro Ser Ser Ile
180 185 190
Val Lys Leu Leu Val Ala Met Leu Glu Pro Ile Lys Gly Thr Val Tyr
195 200 205
Asp Pro Ala Cys Gly Thr Gly Gly Met Phe Ile Gln Ser Asn Lys Tyr
210 215 220
Arg Glu Asn Asn His Asn Leu Cys Phe Val Gly Gln Glu Gln Asn Glu
225 230 235 240
Leu Thr Ile Lys Leu Ala Lys Met Asn Gly Ile Leu His Gly Ile Asn
245 250 255
Pro Glu Ile Arg Gln Gly Asp Ser Leu Leu Asn Asp Arg Tyr Pro Glu
260 265 270
Leu Lys Ala Glu Ile Val Ile Ser Asn Pro Pro Phe Asn Met Lys Asp
275 280 285
Trp Gly Ala Glu Arg Leu Pro Leu Asn Asp Lys Arg Leu Ile Gly Pro
290 295 300
Val Thr Asn Ser Asn Ala Asn Tyr Met Trp Ile Gln His Phe Leu Tyr
305 310 315 320
His Leu Lys Asp Gly Gly Leu Ala Gly Phe Val Ile Ala Asn Gly Ala
325 330 335
Leu Thr Ser Asn Leu Ala Ala Glu Lys Ile Val Arg Lys His Leu Ile
340 345 350
Asp Asn Asp Tyr Val Asp Cys Val Val Gln Leu Pro Glu Lys Met Phe
355 360 365
Phe Gly Thr Gly Ile Pro Ser Ala Leu Val Phe Leu Ser Lys Asn Arg
370 375 380
Asn Gly Ser Asn Gly His Ala Lys Arg Glu Lys Glu Val Leu Phe Ile
385 390 395 400
Asp Ala Ser Asp Lys Gly Thr Leu Val Gly Lys Lys Asn Lys Ile Phe
405 410 415
Leu Asp Asp Glu Ile Lys Glu Ile Ala Asp Leu Tyr His Ser Phe Lys
420 425 430
Phe Leu Asn Asp Asn Asp Tyr Asn His Ser Gly Phe Tyr Lys Lys Val
435 440 445
Asn Ile Glu Lys Ile Val Glu Asn Asp Tyr Lys Leu Thr Pro Thr Leu
450 455 460
Tyr Val Gly Val Lys Glu Glu Thr Glu Met Glu Lys Pro Phe Arg Glu
465 470 475 480
Met Ile Ile Glu Tyr Lys Ala Ile Leu Glu Gln Gln Phe Glu Glu Ser
485 490 495
Asn Lys Leu Gln Gln Lys Ile Leu Lys Asn Leu Glu Gly Leu Leu
500 505 510
<210> 10
<211> 1179
<212> DNA
<213> 嗜热脂肪芽胞杆菌 X1
<220>
<221> misc_feature
<223> S.BstXI的DNA序列
<400> 10
atgaaaagta ctttgaagga atataaattg ggtgatatta ccgaagtcgt taatggtgcc 60
actccttcaa ctaaaaagcc tgagtactat gaaaatggta caattccatg gattactcct 120
aaagatttat caggctatta ctttaaatat atatctcatg gtgaacgtaa tataacagag 180
cttggtctaa gaaatagttc agctaagttg ttaccaaaag gaactgtatt attttcctca 240
agagccccaa taggatacgt agcaatagct gataattggt taactacgaa ccagggattt 300
aaaagtttta tatgtaatga ggagattatt tacaatgaat acctttatta ttttcttatt 360
gctaaaaggg attttattga aacatttgcg aatgggagta cgtttaaaga gctttcatca 420
acttctgcaa agaatatacc aatcaatctt cctagtttag aagagcaaaa gaagattgtg 480
acaattttag gggatttgga tagaaagata gaattaaatt ataaaattat tgaaagctta 540
gaaaaaatag cagaaagaac atataaatat tggtttgtcg atgaattaaa tcaagatgaa 600
cagcacatcc gtaatggatg ggaaactgct aaaattggcg atgtggtgga acttttggga 660
gggggaaccc ctaaaacttc ggaaagtaag tattgggaag atggagatat taattggttt 720
actccttcag atttaacaaa aactagacag ctttttgtac gtgattctca aagaaaaata 780
acaattgatg gacttaataa cagtgcagcg aaattaattc ccccttattc cttgttaatg 840
tcaagtagag ctacaattgg cgagttggca attaatcaag aatctgctac tacaaatcaa 900
gggtttattg tattaatacc aaatgaaaaa atttctattt accaattata cttttgggct 960
aaacttaata agagcaaaat tatttcaatg gcaaatggta gtacttttaa agaaattagt 1020
aagcgggatt ttaaatcttt ggagataata ttaccaaaaa atatagacac ttttaattca 1080
attatgcaag attattttag gaaaattgag gagttaattg atgaaataaa aatcttaaaa 1140
accgcaagag ataatttaat tccaaaactt ataaaatga 1179
<210> 11
<211> 392
<212> PRT
<213> 嗜热脂肪芽胞杆菌 X1
<220>
<221> misc_feature
<223> S.BstXI的蛋白质序列
<400> 11
Met Lys Ser Thr Leu Lys Glu Tyr Lys Leu Gly Asp Ile Thr Glu Val
1 5 10 15
Val Asn Gly Ala Thr Pro Ser Thr Lys Lys Pro Glu Tyr Tyr Glu Asn
20 25 30
Gly Thr Ile Pro Trp Ile Thr Pro Lys Asp Leu Ser Gly Tyr Tyr Phe
35 40 45
Lys Tyr Ile Ser His Gly Glu Arg Asn Ile Thr Glu Leu Gly Leu Arg
50 55 60
Asn Ser Ser Ala Lys Leu Leu Pro Lys Gly Thr Val Leu Phe Ser Ser
65 70 75 80
Arg Ala Pro Ile Gly Tyr Val Ala Ile Ala Asp Asn Trp Leu Thr Thr
85 90 95
Asn Gln Gly Phe Lys Ser Phe Ile Cys Asn Glu Glu Ile Ile Tyr Asn
100 105 110
Glu Tyr Leu Tyr Tyr Phe Leu Ile Ala Lys Arg Asp Phe Ile Glu Thr
115 120 125
Phe Ala Asn Gly Ser Thr Phe Lys Glu Leu Ser Ser Thr Ser Ala Lys
130 135 140
Asn Ile Pro Ile Asn Leu Pro Ser Leu Glu Glu Gln Lys Lys Ile Val
145 150 155 160
Thr Ile Leu Gly Asp Leu Asp Arg Lys Ile Glu Leu Asn Tyr Lys Ile
165 170 175
Ile Glu Ser Leu Glu Lys Ile Ala Glu Arg Thr Tyr Lys Tyr Trp Phe
180 185 190
Val Asp Glu Leu Asn Gln Asp Glu Gln His Ile Arg Asn Gly Trp Glu
195 200 205
Thr Ala Lys Ile Gly Asp Val Val Glu Leu Leu Gly Gly Gly Thr Pro
210 215 220
Lys Thr Ser Glu Ser Lys Tyr Trp Glu Asp Gly Asp Ile Asn Trp Phe
225 230 235 240
Thr Pro Ser Asp Leu Thr Lys Thr Arg Gln Leu Phe Val Arg Asp Ser
245 250 255
Gln Arg Lys Ile Thr Ile Asp Gly Leu Asn Asn Ser Ala Ala Lys Leu
260 265 270
Ile Pro Pro Tyr Ser Leu Leu Met Ser Ser Arg Ala Thr Ile Gly Glu
275 280 285
Leu Ala Ile Asn Gln Glu Ser Ala Thr Thr Asn Gln Gly Phe Ile Val
290 295 300
Leu Ile Pro Asn Glu Lys Ile Ser Ile Tyr Gln Leu Tyr Phe Trp Ala
305 310 315 320
Lys Leu Asn Lys Ser Lys Ile Ile Ser Met Ala Asn Gly Ser Thr Phe
325 330 335
Lys Glu Ile Ser Lys Arg Asp Phe Lys Ser Leu Glu Ile Ile Leu Pro
340 345 350
Lys Asn Ile Asp Thr Phe Asn Ser Ile Met Gln Asp Tyr Phe Arg Lys
355 360 365
Ile Glu Glu Leu Ile Asp Glu Ile Lys Ile Leu Lys Thr Ala Arg Asp
370 375 380
Asn Leu Ile Pro Lys Leu Ile Lys
385 390
<210> 12
<211> 770
<212> DNA
<213> 柠檬色动性球菌(planococcus citreus) SE-F45
<400> 12
atgaaacagt ttgcagatcc ttttgaaaga agattccttg atgcaattga acatcatctt 60
gatggaattt ctgagaaaat aaaaaaagac tttacacaca aaaacttttt aaaagaattg 120
aatggcctta aaggtgataa agtctatcat gacttaggct ttgataccgc tgaatatact 180
ctggtacgtc ttataggaag aatgagcata agcgttggga gaaggctggg ggagatatac 240
gataaagtcc ctcgttatgt tgctgccgcg cgatttggtc ttcaaccaaa tcaaattgca 300
gaagtatttg atggtcttga gttagatata gctttgcgca atagcctttt gtcagatgat 360
gataaaattc acataaaaaa aataactgaa aagatgtcag gcgaaacata ctcgggaatc 420
ggaatcgaaa ttcgttataa ctttaatcca aatgacagtt cccgtttaag aaaagacgtc 480
gatgtagctt ctaaattgtc ggccgcgggg ttatttcctg tttatttaat atttagctct 540
ctcagtccta ggaatgatgc aatagcccgt cttaaaagag ggggatggag ctttaaacag 600
gggcaggaag ccttagactt ccttaccgaa cttttaggag tggatattgg gtctgtttta 660
tctgacccaa taatagccgc agaaactagg gagaaaacat caaaaattat gaagtctata 720
tttgaatcag aggcattcca atctgttata ccgggagagt ggagtaaact 770
<210> 13
<211> 257
<212> PRT
<213> 柠檬色动性球菌 SE-F45
<400> 13
Met Lys Gln Phe Ala Asp Pro Phe Glu Arg Arg Phe Leu Asp Ala Ile
1 5 10 15
Glu His His Leu Asp Gly Ile Ser Glu Lys Ile Lys Lys Asp Phe Thr
20 25 30
His Lys Asn Phe Leu Lys Glu Leu Asn Gly Leu Lys Gly Asp Lys Val
35 40 45
Tyr His Asp Leu Gly Phe Asp Thr Ala Glu Tyr Thr Leu Val Arg Leu
50 55 60
Ile Gly Arg Met Ser Ile Ser Val Gly Arg Arg Leu Gly Glu Ile Tyr
65 70 75 80
Asp Lys Val Pro Arg Tyr Val Ala Ala Ala Arg Phe Gly Leu Gln Pro
85 90 95
Asn Gln Ile Ala Glu Val Phe Asp Gly Leu Glu Leu Asp Ile Ala Leu
100 105 110
Arg Asn Ser Leu Leu Ser Asp Asp Asp Lys Ile His Ile Lys Lys Ile
115 120 125
Thr Glu Lys Met Ser Gly Glu Thr Tyr Ser Gly Ile Gly Ile Glu Ile
130 135 140
Arg Tyr Asn Phe Asn Pro Asn Asp Ser Ser Arg Leu Arg Lys Asp Val
145 150 155 160
Asp Val Ala Ser Lys Leu Ser Ala Ala Gly Leu Phe Pro Val Tyr Leu
165 170 175
Ile Phe Ser Ser Leu Ser Pro Arg Asn Asp Ala Ile Ala Arg Leu Lys
180 185 190
Arg Gly Gly Trp Ser Phe Lys Gln Gly Gln Glu Ala Leu Asp Phe Leu
195 200 205
Thr Glu Leu Leu Gly Val Asp Ile Gly Ser Val Leu Ser Asp Pro Ile
210 215 220
Ile Ala Ala Glu Thr Arg Glu Lys Thr Ser Lys Ile Met Lys Ser Ile
225 230 235 240
Phe Glu Ser Glu Ala Phe Gln Ser Val Ile Pro Gly Glu Trp Ser Lys
245 250 255
Leu
<210> 14
<211> 1347
<212> DNA
<213> 柠檬色动性球菌 SE-F45
<220>
<221> misc_feature
<223> M.PciI的DNA序列
<400> 14
atgacaaatt tttcgcactc agctctaacg agctacgatc ttctcgggca tgaaattgtc 60
caagattctg aagctgttag ctcgggtcca tatctggtca gctatgaccc gatccctgta 120
cgtcggtcta cattcctagc tggactgtca gagaacgttc actcgtggtt tcgtctcaca 180
ccaagtttcg gaccggatct agttcgaaca atcatcaaac agatgaatct tgcgccgcac 240
tcacacatcc atgacccttt ctcaggagcc gggactaccg cgattgaggc ttcgttagag 300
ggctatgaag caagctgcgt agaagttaat ccgtttctct acttcgtggg gaaaacatcc 360
atagattggt ctatcaatgc tgatgatgct gcagcgcagc tagaaagcat taaaaataaa 420
tattatagca tgtctgcaac cgctactttg gataacatag ccgacctagg aatagatata 480
ccaaaaatac acaatattca tcggtggtgg agaaacgatg ttcttaaaga tatattagtc 540
ctaaaatctt ctatcagatc ttgcacacaa gataagtatt gttccttttt tgagctagcc 600
ctagctgcag ttctcgttcc agatttgaca aatgtaacgc taggaaaact acaactgcac 660
tttgtaaaca aagacgataa agagataaac gtctggccta catatgaatc tcatgcaaaa 720
aaaatgattc acgacttgtc attaattaat aagcaaaatt tcgaattttt gcccaagatt 780
atttatggtg attcaactca aaaatcaaca tttagcgagg tggcagggat agatgctata 840
ataacatccc ctccgtaccc taataggtac agctatattt ggaatactcg ccctcacctg 900
tacattcttg atatgatttc cgaagcaaaa gaggcttcgc aaatagatcg tagaacgatt 960
ggtggaacat gggggacagc aacttccgaa ttaggaaagg gtatattttc tccaatcaat 1020
gctgtagtca aagacgcgct tgaaggggtt cacgaaagaa tcgccggttc cgatcaactc 1080
atggcaaact atgtaactca ttattttaat cggctctttt tacatataga agctataaaa 1140
ccatcactta atccaaaagc aaagcttgct tatgttgttg ggaactcttg gattaagggc 1200
gaatatgtag ccactgacgt aatcttagca aaaattatcg aaggggcttt gccaggctca 1260
tcaattgatg gtcttcatcg tttccgtcgc cggaacagtg gaaagaatct ctttgaaact 1320
atagtttact ccactctccc ggtataa 1347
<210> 15
<211> 448
<212> PRT
<213> 柠檬色动性球菌 SE-F45
<220>
<221> misc_feature
<223> M.PciI的蛋白质序列
<400> 15
Met Thr Asn Phe Ser His Ser Ala Leu Thr Ser Tyr Asp Leu Leu Gly
1 5 10 15
His Glu Ile Val Gln Asp Ser Glu Ala Val Ser Ser Gly Pro Tyr Leu
20 25 30
Val Ser Tyr Asp Pro Ile Pro Val Arg Arg Ser Thr Phe Leu Ala Gly
35 40 45
Leu Ser Glu Asn Val His Ser Trp Phe Arg Leu Thr Pro Ser Phe Gly
50 55 60
Pro Asp Leu Val Arg Thr Ile Ile Lys Gln Met Asn Leu Ala Pro His
65 70 75 80
Ser His Ile His Asp Pro Phe Ser Gly Ala Gly Thr Thr Ala Ile Glu
85 90 95
Ala Ser Leu Glu Gly Tyr Glu Ala Ser Cys Val Glu Val Asn Pro Phe
100 105 110
Leu Tyr Phe Val Gly Lys Thr Ser Ile Asp Trp Ser Ile Asn Ala Asp
115 120 125
Asp Ala Ala Ala Gln Leu Glu Ser Ile Lys Asn Lys Tyr Tyr Ser Met
130 135 140
Ser Ala Thr Ala Thr Leu Asp Asn Ile Ala Asp Leu Gly Ile Asp Ile
145 150 155 160
Pro Lys Ile His Asn Ile His Arg Trp Trp Arg Asn Asp Val Leu Lys
165 170 175
Asp Ile Leu Val Leu Lys Ser Ser Ile Arg Ser Cys Thr Gln Asp Lys
180 185 190
Tyr Cys Ser Phe Phe Glu Leu Ala Leu Ala Ala Val Leu Val Pro Asp
195 200 205
Leu Thr Asn Val Thr Leu Gly Lys Leu Gln Leu His Phe Val Asn Lys
210 215 220
Asp Asp Lys Glu Ile Asn Val Trp Pro Thr Tyr Glu Ser His Ala Lys
225 230 235 240
Lys Met Ile His Asp Leu Ser Leu Ile Asn Lys Gln Asn Phe Glu Phe
245 250 255
Leu Pro Lys Ile Ile Tyr Gly Asp Ser Thr Gln Lys Ser Thr Phe Ser
260 265 270
Glu Val Ala Gly Ile Asp Ala Ile Ile Thr Ser Pro Pro Tyr Pro Asn
275 280 285
Arg Tyr Ser Tyr Ile Trp Asn Thr Arg Pro His Leu Tyr Ile Leu Asp
290 295 300
Met Ile Ser Glu Ala Lys Glu Ala Ser Gln Ile Asp Arg Arg Thr Ile
305 310 315 320
Gly Gly Thr Trp Gly Thr Ala Thr Ser Glu Leu Gly Lys Gly Ile Phe
325 330 335
Ser Pro Ile Asn Ala Val Val Lys Asp Ala Leu Glu Gly Val His Glu
340 345 350
Arg Ile Ala Gly Ser Asp Gln Leu Met Ala Asn Tyr Val Thr His Tyr
355 360 365
Phe Asn Arg Leu Phe Leu His Ile Glu Ala Ile Lys Pro Ser Leu Asn
370 375 380
Pro Lys Ala Lys Leu Ala Tyr Val Val Gly Asn Ser Trp Ile Lys Gly
385 390 395 400
Glu Tyr Val Ala Thr Asp Val Ile Leu Ala Lys Ile Ile Glu Gly Ala
405 410 415
Leu Pro Gly Ser Ser Ile Asp Gly Leu His Arg Phe Arg Arg Arg Asn
420 425 430
Ser Gly Lys Asn Leu Phe Glu Thr Ile Val Tyr Ser Thr Leu Pro Val
435 440 445
<210> 16
<211> 430
<212> PRT
<213> 球形芽胞杆菌(Bacillus sphaericus)
<400> 16
Met Arg Arg Leu Ala Lys Asn Ser Arg Asn Asp Ser Tyr Leu Ser Asn
1 5 10 15
Arg Asp Tyr Gln Glu Ile Val Arg Glu Asn Thr Thr Thr Ile Ser Phe
20 25 30
Pro Leu Lys Glu Lys His Thr Leu Thr Leu Thr Lys Lys Ile Gly Leu
35 40 45
Asn Gln Thr Ala Gly Phe Gly Gly Trp Phe Phe Pro Asp Ser Pro Cys
50 55 60
Leu Leu Thr Val Thr Val Leu Ser Ser Phe Gly Thr Lys Val Thr Ser
65 70 75 80
Lys Thr Phe Ser Leu Ser Lys Asp Trp Asn Arg Val Gly Leu Ala Trp
85 90 95
Ile Asn Glu His Ser Ser Asp Thr Met Ser Ile Val Leu Glu Phe Ser
100 105 110
Asp Val Glu Ile Val His Thr Trp Gly Leu Thr Cys Asp Val Phe Asn
115 120 125
Val His Glu Leu Ile Ile Asp Ala Ile Glu Asp Gln Asn Lys Leu Ile
130 135 140
Asp Val Leu Asn Gln Glu His Leu Ser Pro Glu Thr Tyr Tyr Leu Asn
145 150 155 160
His Asp Ser Asp Thr Asp Leu Ile Glu Asn Leu Glu Ser Thr Glu Glu
165 170 175
Ile Lys Ile Val Asn Gln Ser Gln Lys Gln Ile Ser Leu Lys Lys Cys
180 185 190
Cys Tyr Cys Gln Arg Tyr Met Pro Val Asn Ile Leu Val Arg Ser Asn
195 200 205
Ser Ser Phe His Lys His Lys Ser Lys Lys Thr Gly Phe Gln Asn Glu
210 215 220
Cys Arg Ala Cys Lys Lys Trp Arg Ile Asn Asn Ser Phe Asn Pro Val
225 230 235 240
Arg Thr Lys Asp Gln Leu His Glu Ser Ala Val Ile Thr Arg Glu Lys
245 250 255
Lys Ile Leu Leu Lys Glu Pro Glu Ile Leu Gln Lys Ile Lys Asn Arg
260 265 270
Asn Asn Gly Glu Gly Leu Lys Ser Ile Ile Trp Lys Lys Phe Asp Lys
275 280 285
Lys Cys Phe Asn Cys Glu Lys Glu Leu Thr Ile Glu Glu Val Arg Leu
290 295 300
Asp His Thr Arg Pro Leu Ala Tyr Leu Trp Pro Ile Asp Glu His Ala
305 310 315 320
Thr Cys Leu Cys Glu Lys Cys Asn Asn Thr Lys His Asp Met Phe Pro
325 330 335
Ile Asp Phe Tyr Gln Gly Asp Glu Asp Lys Leu Arg Arg Leu Ala Arg
340 345 350
Ile Thr Gly Leu Asp Tyr Glu Ser Leu Val Lys Arg Asp Val Asn Glu
355 360 365
Val Glu Leu Ala Arg Ile Ile Asn Asn Ile Glu Asp Phe Ala Thr Asn
370 375 380
Val Glu Ala Arg Thr Phe Arg Ser Ile Arg Asn Lys Val Lys Glu Val
385 390 395 400
Arg Pro Asp Thr Asp Leu Phe Glu Ile Leu Lys Ser Lys Asn Ile Asn
405 410 415
Leu Tyr Asn Glu Leu Gln Tyr Glu Leu Leu Thr Arg Lys Asp
420 425 430
<210> 17
<211> 1245
<212> DNA
<213> 产气肠杆菌(Enterobacter aerogenes)
<400> 17
gtgaatcaga aaaatgaaaa atcatttatg cgtttgcaat caacctttag cggtggcaaa 60
ggtagtccaa tgcatgattg gtacccatat ttagagggtt attctcccga atttgtgaaa 120
tgcttgattt cacgatttgc tcctaaagcc aaaacaattt tagatccatt ttgtggctct 180
ggaacaacag ccattgtttc cgttttagag ggtttaaata attactattg cgaagtaaac 240
cctttatgcc aatatattat tgaaactaaa ctaatagctt taacattaag cgaagaagaa 300
aaaacaaaat tagtaaatga actttattct atttctaatg aaataactaa tgtactcaaa 360
ccttctgcaa ccgagacaga tctagagaaa tcatttaaat ccgtttttgg taatacgaaa 420
ttttttgagg atcacatatt taaagatata cttagttatc aatgttacat tagctctatc 480
gaagatgaaa atcttaagag acttctgaca atagcaggga ttagatcgtt aatcccttcc 540
tcgttattgg taagacgagg tgatttacga ttcaagacac aaaaagaatt agagaaaggc 600
aaccagggct ttcgctttca tgtacaaaaa agcttagaat taattgccag tgatttatta 660
gacattacgg aaggtagtgg tttagctacc ttcttatgtg atgatgccaa agaaatatct 720
gggaataacc tgattgatgc tgtaataaca agcccgccat atttaaatgg cacaaattat 780
tttagaaata ctaaaattga actttggttt atagggaaat taaagaccaa atcagatcta 840
agacattata gggatttagc tattaccagt ggtattaacg atgtaactaa aggtaaaagc 900
ttatcttcaa ataatactat tatctcagaa ataccattat tatctgaatg tattaaagaa 960
ctaagcataa aagagtatga tagtcgtatt tcaatgatgg ttgaaaacta cttttgggac 1020
atgttcaaat tcttatcaaa actcccaaaa ttactaacta atgatgcgac tatctgtata 1080
gatttaggtg attctgttta ttgtaacgtc tacatcccta cacaagatat tttgaaagaa 1140
atgatgtcaa agttaggttt tgaagagaac gaaagggtca ttcttcgtga acgaaaatcc 1200
cgcaatggaa caaagttagt ccagactgtt caggttttta aatga 1245
<210> 18
<211> 1140
<212> DNA
<213> 产气肠杆菌
<400> 18
atgaaaaata aatattttag taaaaaatgg gagcaattca agaaagaatt accccatcaa 60
tcaggtgaaa tggtaaagag aaattggggc cataactggc actctatgtg ttcataccaa 120
gggaaactta aaccatcaat agctagatct ttaattgata cattcatgcc atcaagtaag 180
ggacgtatat tagatgtctt ctcaggtgtt ggcaccattc ctttcgaagc aagattactt 240
ggtcatactg catatggatt tgatattagt ccagcagcag ttaatatttc acgcgcaaaa 300
ctagaagtta taagtaaaaa tgaaatccaa gaggtaatta ataaattatc tgattttatt 360
gagcaaaaca aaaattcaat agattataac gaacataatt taataaggtt taatggttca 420
attgaatcct attttcatcc tgaaactttt aaggaaatac tgtgtgctcg taaattcttt 480
ttaataaaag gtgaattaaa tgcatctgaa tcgttagtac agtcatgttt attacatatt 540
ttacatggta atcgtccgta tgcattgagt agaaagtccc atcctattac acctttcgcg 600
cctactggag attttatata cagtaattta gttataaagt taatcaaaaa agttgaaaga 660
gtcttgcaaa attctgatgg tatcccagat actggcagca aagtatttta tcaggactct 720
acaaaaagtt ggcctgaaga agtaaataat ttagatgcaa ttataacatc acctccattt 780
tatgatagta cccgtttcta ttcagcaaat tggatgcgat tatggttttc tggttgggaa 840
aaagatgact tccaaacgaa gccaaaagat tttgtggacg aaactcagaa aaaaagcttt 900
gaaatatatg ataatatatt caaacaatct caacaatgct taaaaaaaga tggcgttttt 960
ttaatgcacg ttggcaaaag taaaaaaagt gatatggcag gacaaattgc taaaattggt 1020
agtaattatc ttagccttat agatatattt gacgaaagtg ttgaacattg cgaaagtcac 1080
ggaattaaag acaaaggcac gacaacccat catcagtacc ttgtctttac gaaagattag 1140
<210> 19
<211> 213
<212> PRT
<213> 解淀粉芽胞杆菌(Bacillus amyloliquefaciens)H
<400> 19
Met Glu Val Glu Lys Glu Phe Ile Thr Asp Glu Ala Lys Glu Leu Leu
1 5 10 15
Ser Lys Asp Lys Leu Ile Gln Gln Ala Tyr Asn Glu Val Lys Thr Ser
20 25 30
Ile Cys Ser Pro Ile Trp Pro Ala Thr Ser Lys Thr Phe Thr Ile Asn
35 40 45
Asn Thr Glu Lys Asn Cys Asn Gly Val Val Pro Ile Lys Glu Leu Cys
50 55 60
Tyr Thr Leu Leu Glu Asp Thr Tyr Asn Trp Tyr Arg Glu Lys Pro Leu
65 70 75 80
Asp Ile Leu Lys Leu Glu Lys Lys Lys Gly Gly Pro Ile Asp Val Tyr
85 90 95
Lys Glu Phe Ile Glu Asn Ser Glu Leu Lys Arg Val Gly Met Glu Phe
100 105 110
Glu Thr Gly Asn Ile Ser Ser Ala His Arg Ser Met Asn Lys Leu Leu
115 120 125
Leu Gly Leu Lys His Gly Glu Ile Asp Leu Ala Ile Ile Leu Met Pro
130 135 140
Ile Lys Gln Leu Ala Tyr Tyr Leu Thr Asp Arg Val Thr Asn Phe Glu
145 150 155 160
Glu Leu Glu Pro Tyr Phe Glu Leu Thr Glu Gly Gln Pro Phe Ile Phe
165 170 175
Ile Gly Phe Asn Ala Glu Ala Tyr Asn Ser Asn Val Pro Leu Ile Pro
180 185 190
Lys Gly Ser Asp Gly Met Ser Lys Arg Ser Ile Lys Lys Trp Lys Asp
195 200 205
Lys Val Glu Asn Lys
210
<210> 20
<211> 194
<212> PRT
<213> 克氏海洋螺菌(Oceanospirillum kriegii)
<400> 20
Met Lys Ile Lys Arg Ile Glu Val Leu Ile Asn Asn Gly Ser Val Pro
1 5 10 15
Gly Ile Pro Met Ile Leu Asn Glu Ile Gln Asp Ala Ile Lys Thr Val
20 25 30
Ser Trp Pro Glu Gly Asn Asn Ser Phe Val Ile Asn Pro Val Arg Lys
35 40 45
Gly Asn Gly Val Lys Pro Ile Lys Asn Ser Cys Met Arg His Leu His
50 55 60
Gln Lys Gly Trp Ala Leu Glu His Pro Val Arg Ile Lys Ala Glu Met
65 70 75 80
Arg Pro Gly Pro Leu Asp Ala Val Lys Met Ile Gly Gly Lys Ala Phe
85 90 95
Ala Leu Glu Trp Glu Thr Gly Asn Ile Ser Ser Ser His Arg Ala Ile
100 105 110
Asn Lys Met Val Met Gly Met Leu Glu Arg Val Ile Ile Gly Gly Val
115 120 125
Leu Ile Leu Pro Ser Arg Asp Met Tyr Asn Tyr Leu Thr Asp Arg Val
130 135 140
Gly Asn Phe Arg Glu Leu Glu Pro Tyr Phe Ser Val Trp Arg Gln Phe
145 150 155 160
Asn Leu Lys Asp Ala Tyr Leu Ala Ile Val Glu Ile Glu His Asp Ser
165 170 175
Val Asp Ala Gln Val Ser Leu Ile Pro Lys Gly Thr Asp Gly Arg Ala
180 185 190
Ile Arg
<210> 21
<211> 180
<212> PRT
<213> 解淀粉芽胞杆菌H
<220>
<221> MISC_FEATURE
<222> (1)..(180)
<223> 残基1-180相应于BamHI (seq id no. 19)的蛋白质序列的残基22-201
<400> 21
Ile Gln Gln Ala Tyr Asn Glu Val Lys Thr Ser Ile Cys Ser Pro Ile
1 5 10 15
Trp Pro Ala Thr Ser Lys Thr Phe Thr Ile Asn Asn Thr Glu Lys Asn
20 25 30
Cys Asn Gly Val Val Pro Ile Lys Glu Leu Cys Tyr Thr Leu Leu Glu
35 40 45
Asp Thr Tyr Asn Trp Tyr Arg Glu Lys Pro Leu Asp Ile Leu Lys Leu
50 55 60
Glu Lys Lys Lys Gly Gly Pro Ile Asp Val Tyr Lys Glu Phe Ile Glu
65 70 75 80
Asn Ser Glu Leu Lys Arg Val Gly Met Glu Phe Glu Thr Gly Asn Ile
85 90 95
Ser Ser Ala His Arg Ser Met Asn Lys Leu Leu Leu Gly Leu Lys His
100 105 110
Gly Glu Ile Asp Leu Ala Ile Ile Leu Met Pro Ile Lys Gln Leu Ala
115 120 125
Tyr Tyr Leu Thr Asp Arg Val Thr Asn Phe Glu Glu Leu Glu Pro Tyr
130 135 140
Phe Glu Leu Thr Glu Gly Gln Pro Phe Ile Phe Ile Gly Phe Asn Ala
145 150 155 160
Glu Ala Tyr Asn Ser Asn Val Pro Leu Ile Pro Lys Gly Ser Asp Gly
165 170 175
Met Ser Lys Arg
180
<210> 22
<211> 177
<212> PRT
<213> 克氏海洋螺菌
<220>
<221> MISC_FEATURE
<222> (1)..(177)
<223> 残基1-177相应于OkrAI (seq id no. 20)的蛋白质序列的残基18-194
<400> 22
Ile Pro Met Ile Leu Asn Glu Ile Gln Asp Ala Ile Lys Thr Val Ser
1 5 10 15
Trp Pro Glu Gly Asn Asn Ser Phe Val Ile Asn Pro Val Arg Lys Gly
20 25 30
Asn Gly Val Lys Pro Ile Lys Asn Ser Cys Met Arg His Leu His Gln
35 40 45
Lys Gly Trp Ala Leu Glu His Pro Val Arg Ile Lys Ala Glu Met Arg
50 55 60
Pro Gly Pro Leu Asp Ala Val Lys Met Ile Gly Gly Lys Ala Phe Ala
65 70 75 80
Leu Glu Trp Glu Thr Gly Asn Ile Ser Ser Ser His Arg Ala Ile Asn
85 90 95
Lys Met Val Met Gly Met Leu Glu Arg Val Ile Ile Gly Gly Val Leu
100 105 110
Ile Leu Pro Ser Arg Asp Met Tyr Asn Tyr Leu Thr Asp Arg Val Gly
115 120 125
Asn Phe Arg Glu Leu Glu Pro Tyr Phe Ser Val Trp Arg Gln Phe Asn
130 135 140
Leu Lys Asp Ala Tyr Leu Ala Ile Val Glu Ile Glu His Asp Ser Val
145 150 155 160
Asp Ala Gln Val Ser Leu Ile Pro Lys Gly Thr Asp Gly Arg Ala Ile
165 170 175
Arg
<210> 23
<211> 38
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 23
attcaacaag catacaatgc agttaaaaca tctattgt 38
<210> 24
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 24
acaaatagat gttttaactg cattgtatgc ttgttgaat 39
<210> 25
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 25
caagcataca atgaagttgc aacatctatt tgttcacct 39
<210> 26
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 26
aggtgaacaa atagatgttg caacttcatt gtatgcttg 39
<210> 27
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 27
acgattaaca acaccgaagc aaattgtaac ggtgtagta 39
<210> 28
<211> 40
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 28
acgattaaca acaccgaagc aaattgtaac ggtgtagtat 40
<210> 29
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 29
aacggtgtag taccaattgc agaactatgt tacacctta 39
<210> 30
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 30
taaggtgtaa catagttctg caattggtac tacaccgtt 39
<210> 31
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 31
aacccccttg atatacttgc acttgaaaag aaaaaaggt 39
<210> 32
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 32
accttttttc ttttcaagtg caagtatatc aaggggttt 39
<210> 33
<211> 36
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 33
gatatactta aacttgcaaa gaaaaaaggt ggtccg 36
<210> 34
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 34
cggaccacct tttttctttg caagtttaag tatatcaag 39
<210> 35
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 35
atacttaaac ttgaaaaggc aaaaggtggt ccgattgat 39
<210> 36
<211> 40
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 36
atcaatcgga ccaccttttg cctttttcaa gtttaagtat 40
<210> 37
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 37
ggtccgattg atgtttatgc agagttcata gaaaacagt 39
<210> 38
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 38
actgttttct atgaactctg cataaacatc aatcggacc 39
<210> 39
<211> 37
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 39
atagaaaaac agtgaacttg cacgtgtagg tatggaa 37
<210> 40
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 40
aaattccata cctacacgtg caagttcact gttttctat 39
<210> 41
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 41
ggaaatatta gttctgccgc acgttcaatg aacaaactt 39
<210> 42
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 42
aagtttgttc attgaaacgt gcggcagaac taatattcc 39
<210> 43
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 43
aatattagtt ctgcccacgc atcaatgaac aaacttcta 39
<210> 44
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 44
tagaagtttg ttcattgatg cgtgggcaga actaatatt 39
<210> 45
<211> 42
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 45
gcccaccgtt caatgaacgc acttctatta ggattaaaac at 42
<210> 46
<211> 42
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 46
atgttttaat cctaatagaa gtgcggtcat tgaacggtgg gc 42
<210> 47
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 47
attatcctta tgcctattgc acaattggcc tattatctt 39
<210> 48
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 48
aagataatag gccaattgtg caataggcat aaggataat 39
<210> 49
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 49
ttggcctatt atcttacagc acgtgttacc aatttcgag 39
<210> 50
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 50
ctcgaaattg gtaacacgtg ctgtaagata ataggccaa 39
<210> 51
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 51
gcctattatc ttacagatgc agttaccaat ttcgaggaa 39
<210> 52
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 52
ttcctcgaaa ttggtaactg catctgtaag ataataggc 39
<210> 53
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 53
cgtgttacca atttcgaggc attagaacct tattttgaa 39
<210> 54
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 54
ttcaaaataa ggttctaatg cctcgaaatt ggtaacacg 39
<210> 55
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 55
accaatttcg aggaattagc accttatttt gaacttact 39
<210> 56
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 56
agtaagttca aaataaggtg ctaattcctc gaaattggt 39
<210> 57
<211> 42
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 57
ccttattttg aacttactgc aggacaacca tttattttta tt 42
<210> 58
<211> 42
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 58
aataaaaata aatggttgtg ctgcagtaag ttcaaaataa gg 42
<210> 59
<211> 45
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 59
tttattttta ttggatttaa tgctgcagct tataattcta atgtc 45
<210> 60
<211> 45
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 60
gacattagaa ttataagctg cagcattaaa tccaataaaa ataaa 45
<210> 61
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 61
aatgtccctt taattcccgc aggttctgac ggtatgtca 39
<210> 62
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 62
tgacataccg tcagaacctg cgggaattaa agggacatt 39
<210> 63
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 63
ttaattccca aaggttctgc aggtatgtca aaacgctca 39
<210> 64
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 64
tgagcgtttt gacatacctg cagaaccttt gggaattaa 39
<210> 65
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 65
tctgacggta tgtcaaaagc atcaattaag aaatggaaa 39
<210> 66
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 66
tttccatttc ttaattgatg cttttgacat accgtcaga 39
<210> 67
<211> 54
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 67
ggtggtgcat gcggaggtaa ataaatggaa gtagaaaaag agtttattac tgat 54
<210> 68
<211> 51
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 68
ggtggtggta ccctatttgt tttcaacttt atctttccat ttcttaattg a 51
<210> 69
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (19)..(21)
<223> n=a, c, g或t
<400> 69
caagcataca atgaagttnn nacatctatt tgttcacct 39
<210> 70
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (19)..(21)
<223> n=a. c. g或 t
<400> 70
aggtgaacaa atagatgtnn naacttcatt gtatgcttg 39
<210> 71
<211> 37
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (16)..(18)
<220>
<221> misc_feature
<222> (16)..(18)
<223> n=a, c, g或t
<400> 71
gatatactta aacttnnnaa gaaaaaaagg tggtccg 37
<210> 72
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<220>
<221> misc_feature
<222> (19)..(21)
<220>
<221> misc_feature
<222> (19)..(21)
<223> n=a, c, g或t
<400> 72
cggaccacct tttttcttnn naagtttaag tatatcaag 39
<210> 73
<211> 54
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 73
ggtggtgcat gcggaggtaa ataaatgtct aataaaaaac agtcaaatag gcta 54
<210> 74
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 74
ggtggtggta cctcacttag atctaagctg ttcaaacaa 39
<210> 75
<211> 267
<212> PRT
<213> 大肠杆菌(Escherichia coli) RY13
<220>
<221> MISC_FEATURE
<222> (1)..(267)
<223> 氨基酸残基1-267相应于EcoRI的蛋白质序列的残基4-270
<400> 75
Lys Lys Gln Ser Asn Arg Leu Thr Glu Gln His Lys Leu Ser Gln Gly
1 5 10 15
Val Ile Gly Ile Phe Gly Asp Tyr Ala Lys Ala His Asp Leu Ala Val
20 25 30
Gly Glu Val Ser Lys Leu Val Lys Lys Ala Leu Ser Asn Glu Tyr Pro
35 40 45
Gln Leu Ser Phe Arg Tyr Arg Asp Ser Ile Lys Lys Thr Glu Ile Asn
50 55 60
Glu Ala Leu Lys Lys Ile Asp Pro Asp Leu Gly Gly Thr Leu Phe Val
65 70 75 80
Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly Ile Val Glu Val Lys Asp
85 90 95
Asp Tyr Gly Glu Trp Arg Val Val Leu Val Ala Glu Ala Lys His Gln
100 105 110
Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Val Gly Lys Arg
115 120 125
Gly Asp Gln Asp Leu Met Ala Ala Gly Asn Ala Ile Glu Arg Ser His
130 135 140
Lys Asn Ile Ser Glu Ile Ala Asn Phe Met Leu Ser Glu Ser His Phe
145 150 155 160
Pro Tyr Val Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr Glu Asn Ile
165 170 175
Ser Ile Thr Arg Pro Asp Gly Arg Val Val Asn Leu Glu Tyr Asn Ser
180 185 190
Gly Ile Leu Asn Arg Leu Asp Arg Leu Thr Ala Ala Asn Tyr Gly Met
195 200 205
Pro Ile Asn Ser Asn Leu Cys Ile Asn Lys Phe Val Asn His Lys Asp
210 215 220
Lys Ser Ile Met Leu Gln Ala Ala Ser Ile Tyr Thr Gln Gly Asp Gly
225 230 235 240
Arg Glu Trp Asp Ser Lys Ile Met Phe Glu Ile Met Phe Asp Ile Ser
245 250 255
Thr Thr Ser Leu Arg Val Leu Gly Arg Asp Leu
260 265
<210> 76
<211> 265
<212> PRT
<213> 类球红细菌(Rhodopseudomonas sphaeroides)
<220>
<221> MISC_FEATURE
<222> (1)..(265)
<223> 氨基酸残基1-265相应于RsrI的蛋白质序列的残基10-274
<400> 76
Lys Gly Gln Ala Leu Arg Leu Gly Ile Gln Gln Glu Leu Gly Gly Gly
1 5 10 15
Pro Leu Ser Ile Phe Gly Ala Ala Ala Gln Lys His Asp Leu Ser Ile
20 25 30
Arg Glu Val Thr Ala Gly Val Leu Thr Lys Leu Ala Glu Asp Phe Pro
35 40 45
Asn Leu Glu Phe Gln Leu Arg Thr Ser Leu Thr Lys Lys Ala Ile Asn
50 55 60
Glu Lys Leu Arg Ser Phe Asp Pro Arg Leu Gly Gln Ala Leu Phe Val
65 70 75 80
Glu Ser Ala Ser Ile Arg Pro Asp Gly Gly Ile Thr Glu Val Lys Asp
85 90 95
Arg His Gly Asn Trp Arg Val Ile Leu Val Gly Glu Ser Lys His Gln
100 105 110
Gly Asn Asp Val Glu Lys Ile Leu Ala Gly Val Leu Gln Gly Lys Ala
115 120 125
Lys Asp Gln Asp Phe Met Ala Ala Gly Asn Ala Ile Glu Arg Met His
130 135 140
Lys Asn Val Leu Glu Leu Arg Asn Tyr Met Leu Asp Glu Lys His Phe
145 150 155 160
Pro Tyr Val Val Phe Leu Gln Gly Ser Asn Phe Ala Thr Glu Ser Phe
165 170 175
Glu Val Thr Arg Pro Asp Gly Arg Val Val Lys Ile Val His Asp Ser
180 185 190
Gly Met Leu Asn Arg Ile Asp Arg Val Thr Ala Ser Ser Leu Ser Arg
195 200 205
Glu Ile Asn Gln Asn Tyr Cys Glu Asn Ile Val Val Arg Ala Gly Ser
210 215 220
Phe Asp His Met Phe Gln Ile Ala Ser Leu Tyr Cys Lys Ala Ala Pro
225 230 235 240
Trp Thr Ala Gly Glu Met Ala Glu Ala Met Leu Ala Val Ala Lys Thr
245 250 255
Ser Leu Arg Ile Ile Ala Asp Asp Leu
260 265
<210> 77
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 77
gattgggtgg cgcagaaatt tcaaacgggc cagcagtcg 39
<210> 78
<211> 39
<212> DNA
<213> 人工
<220>
<223> 引物
<400> 78
cgactgctgg cccgtttgaa atttctgcgc cacccaatc 39
<210> 79
<211> 272
<212> PRT
<213> 食明胶土壤杆菌(Agrobacterium gelatinovorum)
<400> 79
Met Arg Leu Asp Leu Asp Phe Gly Arg Gly Leu Val Ala His Val Met
1 5 10 15
Leu Asp Asn Val Ser Glu Glu Gln Tyr Gln Gln Ile Ser Asp Tyr Phe
20 25 30
Val Pro Leu Val Asn Lys Pro Lys Leu Lys Ser Arg Asp Ala Ile Gly
35 40 45
Gln Ala Phe Val Met Ala Thr Glu Val Cys Pro Asp Ala Asn Pro Ser
50 55 60
Asp Leu Trp His His Val Leu Tyr Arg Ile Tyr Ile Arg Glu Lys Ile
65 70 75 80
Gly Thr Asp Pro Ser Gln Ser Trp Val Arg Thr Ser Gly Glu Ala Phe
85 90 95
Glu Val Ala Leu Val Glu Arg Tyr Asn Pro Val Leu Ala Arg His Gly
100 105 110
Ile Arg Leu Thr Ala Leu Phe Lys Gly Gln Lys Gly Leu Ala Leu Thr
115 120 125
Arg Met Gly Val Ala Asp Arg Val Gly Ser Arg Lys Val Asp Val Met
130 135 140
Ile Glu Lys Gln Gly Gly Gly Arg Ser Pro Asp Ala Glu Gly Phe Gly
145 150 155 160
Val Val Gly Gly Ile His Ala Lys Val Ser Leu Ala Glu Arg Val Ser
165 170 175
Asp Asp Ile Pro Ala Ser Arg Ile Met Met Gly Glu Gly Leu Leu Ser
180 185 190
Val Leu Ser Thr Leu Asp Val Lys Ser Phe Pro Pro Pro His Gly Asp
195 200 205
Leu Val Asn Arg Gly Glu Leu Gly Thr Pro Asp Arg Pro Ser Asp Lys
210 215 220
Arg Asn Tyr Ile Glu Gly His Gly Asp Phe Ser Ala Cys Phe Ser Tyr
225 230 235 240
Asn Leu Arg Thr Pro Pro Ser Asn Ala Thr Thr Pro Ser Gly Arg His
245 250 255
Ile Tyr Val Ser Ala Ser Leu Val Arg Thr Thr Ser Ser Pro Thr Thr
260 265 270
<210> 80
<211> 358
<212> PRT
<213> 鱼腥藻(Anabaena variabilis)
<400> 80
Met Glu Glu Asp Leu Asp Leu Ser Glu Asn Ile Glu Ala Ala Ser Ala
1 5 10 15
Glu Leu Thr Thr Leu Tyr Gln Val Ala Ala Asp Ala Met Lys Asp Tyr
20 25 30
Ile Glu Ile Tyr Leu Ala Leu Ser Lys Gln Ser Asp Gly Phe Ser Asn
35 40 45
Ile Asn Asn Leu Asp Leu Thr Ser Arg Asn Arg Arg Leu Val Val Ile
50 55 60
His Gly Leu Ser Leu Glu Leu Asp Pro Asp Thr Ser Thr Pro Glu Glu
65 70 75 80
Ile Lys Arg Glu Ala Glu Arg Met Leu Ala Ile Ala Leu Asp Thr Glu
85 90 95
Ser Ala Ile Thr Ala Gly Val Tyr Glu Lys Met Arg Leu Phe Ala Ser
100 105 110
Ser Leu Val Asp Gln Leu Phe Glu Gln Thr Asp Glu Leu Asn Ser Leu
115 120 125
Ser Ser Glu Tyr Leu Ser Ala Asn Pro Gly Phe Leu Pro Phe Phe Gln
130 135 140
Gln Leu Ala Gly Leu Arg Ser Lys Ser Glu Leu Lys Arg Glu Val Gly
145 150 155 160
Asn Ala Ser Asp Asn Ser Ile Ser Lys Ala Val Ala Glu Arg Ile Leu
165 170 175
Glu Arg Ile Ile Arg Asn Leu Arg Ile Arg Thr Phe Ser Lys Glu Lys
180 185 190
Leu Leu Gln Ala Val Glu Pro Thr Leu Glu Gly Ile Val Arg Asp Leu
195 200 205
Val Gly Lys Val Leu Leu Glu Asn Ile Val Ala Asp Ala Leu Ser Asp
210 215 220
Leu Gln Val Pro Phe Met Arg Glu Ser Glu Tyr Gln Ser Leu Lys Gly
225 230 235 240
Val Ile Tyr Asp Phe Arg Ala Asp Phe Val Ile Pro Asp Ala Gln Asn
245 250 255
Pro Ile Ala Phe Ile Glu Val Arg Lys Ser Ser Thr Arg His Ala Ser
260 265 270
Leu Tyr Ala Lys Asp Lys Met Phe Ser Ala Ile Asn Trp Lys Gly Lys
275 280 285
Asn Lys Arg Leu Leu Gly Ile Leu Val Val Glu Gly Pro Trp Thr Arg
290 295 300
Glu Thr Leu Arg Val Met Ala Asn Val Phe Asp Tyr Val Thr Pro Leu
305 310 315 320
Thr Arg Val Ser Gln Val Ala Glu Ala Ile Arg Ala Tyr Leu Asp Gly
325 330 335
Asp Lys Thr Arg Leu Lys Trp Leu Val Asn Phe Ser Ile Glu Glu Ala
340 345 350
Asp His Asp Asn Ile Thr
355
<210> 81
<211> 530
<212> PRT
<213> 嗜热脂肪芽胞杆菌(Bacillus stearothermophilus) B61
<400> 81
Met Ala Lys Tyr Gly Arg Gly Lys Phe Leu Pro His Gln Asn Tyr Ile
1 5 10 15
Asp Tyr Met His Phe Ile Val Asn His Lys Asn Tyr Ser Gly Met Pro
20 25 30
Asn Ala Ile Gly Glu Asp Gly Arg Ile Asn Trp Gln Val Ser Ser Gly
35 40 45
Lys Thr Thr Ser Phe Tyr Glu Tyr Tyr Gln Ala Arg Phe Glu Trp Trp
50 55 60
Glu Lys Lys Ala Asp Glu Leu Asn Leu Pro Gly Thr Gly Asn Ser Asn
65 70 75 80
Lys Arg Phe Ser Leu Ala Ala Arg Leu Ile His Pro Thr Gly Gln Arg
85 90 95
Pro Cys Arg Leu Cys Gly Lys Tyr Gln Tyr Val Gly Tyr Met Tyr Val
100 105 110
Ser His Asn Leu Tyr Lys Arg Trp Ser Lys Ile Thr Gly Arg Glu Asp
115 120 125
Leu Phe Phe Lys Lys Gln Asn Ile Ile Glu Ala Ala Asn Ile Phe Lys
130 135 140
Ser Ile Met Gly Glu Gln Ala Leu Ile Asn Glu Leu Thr Thr Ile Phe
145 150 155 160
Pro Glu Arg Lys Asp Tyr Phe Asn Arg Leu Pro Asn Ile Glu Asp Phe
165 170 175
Phe Val Ser Ser Ser His Ile Lys Asn Asn Gly Asn Tyr Ile Ser Pro
180 185 190
Gly Phe Met Ala Asn Pro Pro Asp Arg Leu Asp Gly Phe His Asp Tyr
195 200 205
Gly Ile Cys Cys Arg Lys Glu Lys Asp Pro Gly Arg His Asp Asp Asn
210 215 220
Met Arg Leu Tyr Asn His Asp Arg Arg Ala Phe Met Trp Trp Ser Glu
225 230 235 240
Gly Asp Trp Ala Leu Ala Asp Ala Leu Tyr Asn Lys Ala Gly Ala Gly
245 250 255
Lys Cys Ala Asp Pro Asp Cys Gln Lys Glu Val Glu Lys Ile Ser Pro
260 265 270
Asp His Val Gly Pro Ile Ser Cys Gly Phe Lys Gln Ile Pro Phe Phe
275 280 285
Lys Pro Leu Cys Ala Ser Cys Asn Ser Ala Lys Asn Arg Arg Phe Ser
290 295 300
Tyr Gln Asp Val Lys Glu Leu Leu Lys Tyr Glu Asn Tyr Thr Gly Asp
305 310 315 320
Ser Val Ala Ser Trp Gln Val Arg Ala Leu Trp Asp Asn Cys Lys His
325 330 335
Leu Val Lys Asn Asp Asp Asp Ser Lys Leu Leu Ser Asn Leu Met Arg
340 345 350
Ser Leu Gln Asp Tyr Tyr Leu Arg Ser Leu Tyr Lys Leu Phe Ser Asn
355 360 365
Gly Phe Ala His Leu Leu Ser Tyr Phe Leu Thr Pro Glu Tyr Ala His
370 375 380
Tyr Lys Ile Thr Phe Glu Gly Leu Asn Thr Ser Thr Leu Glu Tyr Glu
385 390 395 400
Arg Tyr Tyr Lys Thr Phe Lys Lys Thr Lys Ser Thr Ser Ser Leu Ala
405 410 415
Ala Arg Ile Val Arg Ile Ala Phe Glu Glu Leu Glu Ile Tyr Asn Ser
420 425 430
Lys Asp Ile Asn Glu Arg Lys Leu Ile Lys Phe Asp Thr Ser Ser Trp
435 440 445
Glu Lys Asp Phe Glu Asn Ile Ile Ser Tyr Ala Thr Lys Asn Leu Ser
450 455 460
Leu Asp Glu Glu Ala Ser Lys Trp Asn Lys Val Leu Thr Asp Lys Asn
465 470 475 480
Leu Ser Ser Thr Glu Lys Asp Lys Lys Ile Ser Ser Leu Leu Glu Asp
485 490 495
Lys Asn Tyr Glu Val Tyr Lys Lys Gln Phe Tyr Ile Leu Lys Asp Leu
500 505 510
Leu Val Glu His Phe Asn Lys Ile Gly Glu Gln Ile Ala Lys Asp Tyr
515 520 525
Met Lys
530
<210> 82
<211> 301
<212> PRT
<213> 聚团肠杆菌(Enterobacter agglomerans)
<400> 82
Met Lys Lys Arg Arg Asp Leu Val Glu Val Phe Gly Tyr Asn Pro Met
1 5 10 15
Asp Leu Ser Pro Glu Val Arg Ala Leu Trp Asn Leu Gly Ala Cys Pro
20 25 30
Phe Leu Asn Lys Glu Cys Ile Lys Ile Asn His Asp Gln Thr Ile Ile
35 40 45
Tyr Gly Thr Cys Ser Val Thr Ser Pro Tyr Gly Asp Val Ile Ile Cys
50 55 60
Pro Asn Arg Leu Tyr Ala Asn Asp Tyr Glu Thr Leu His Lys Val Ser
65 70 75 80
Arg Asp Ala Phe Gly Asp Asp Val Pro Phe Leu Thr Tyr Ser Asn Phe
85 90 95
Ile Lys Tyr Arg Ala Thr Tyr Lys Asp Cys Ile Val Ala Leu Gly Lys
100 105 110
Asn Ser Gly Lys Glu Val Gln Val Gly Arg Ala Leu Ser Met Asp Trp
115 120 125
Val Leu Val Arg Ile Thr Asp Gly Glu Leu Lys Glu Tyr Val Gly Val
130 135 140
Glu Ile Gln Ser Ile Asp Ile Thr Gly Asn Tyr Arg Asp Ala Trp His
145 150 155 160
Ala Tyr Lys Asn Leu Lys Pro Ile Asp Ile Ile Asp Asn Leu Pro Thr
165 170 175
Ser Gln His Gly Leu Asn Trp Ala Asn Val His Lys Arg Leu Ile Pro
180 185 190
Gln Ile Ile Arg Lys Gly Val Val Tyr Ser Arg Ser Asn Tyr Val Lys
195 200 205
Lys Gly Leu Tyr Phe Ile Leu Pro Glu Ile Val Tyr Asn Lys Phe Glu
210 215 220
Asp Val Ile Gly Ala Asp Ile Pro Leu Leu Lys Thr Gln Thr Asn Lys
225 230 235 240
Ser Ile Thr Val His Thr Tyr Ser Leu Gly Glu Pro Ala Ala Asn Gly
245 250 255
Glu Gln Arg Lys Leu Ile Ser Glu Arg Glu Ile Ile Phe Asp Leu Asp
260 265 270
Glu Phe Ser Lys Arg Phe Thr Thr Gly Pro Asn Leu Pro Lys Gly Asp
275 280 285
Asp Leu Asp Ala Val Ile Lys Lys Ala Leu Gly Met Met
290 295 300
<210> 83
<211> 277
<212> PRT
<213> 大肠杆菌 RY13
<400> 83
Met Ser Asn Lys Lys Gln Ser Asn Arg Leu Thr Glu Gln His Lys Leu
1 5 10 15
Ser Gln Gly Val Ile Gly Ile Phe Gly Asp Tyr Ala Lys Ala His Asp
20 25 30
Leu Ala Val Gly Glu Val Ser Lys Leu Val Lys Lys Ala Leu Ser Asn
35 40 45
Glu Tyr Pro Gln Leu Ser Phe Arg Tyr Arg Asp Ser Ile Lys Lys Thr
50 55 60
Glu Ile Asn Glu Ala Leu Lys Lys Ile Asp Pro Asp Leu Gly Gly Thr
65 70 75 80
Leu Phe Val Ser Asn Ser Ser Ile Lys Pro Asp Gly Gly Ile Val Glu
85 90 95
Val Lys Asp Asp Tyr Gly Glu Trp Arg Val Val Leu Val Ala Glu Ala
100 105 110
Lys His Gln Gly Lys Asp Ile Ile Asn Ile Arg Asn Gly Leu Leu Val
115 120 125
Gly Lys Arg Gly Asp Gln Asp Leu Met Ala Ala Gly Asn Ala Ile Glu
130 135 140
Arg Ser His Lys Asn Ile Ser Glu Ile Ala Asn Phe Met Leu Ser Glu
145 150 155 160
Ser His Phe Pro Tyr Val Leu Phe Leu Glu Gly Ser Asn Phe Leu Thr
165 170 175
Glu Asn Ile Ser Ile Thr Arg Pro Asp Gly Arg Val Val Asn Leu Glu
180 185 190
Tyr Asn Ser Gly Ile Leu Asn Arg Leu Asp Arg Leu Thr Ala Ala Asn
195 200 205
Tyr Gly Met Pro Ile Asn Ser Asn Leu Cys Ile Asn Lys Phe Val Asn
210 215 220
His Lys Asp Lys Ser Ile Met Leu Gln Ala Ala Ser Ile Tyr Thr Gln
225 230 235 240
Gly Asp Gly Arg Glu Trp Asp Ser Lys Ile Met Phe Glu Ile Met Phe
245 250 255
Asp Ile Ser Thr Thr Ser Leu Arg Val Leu Gly Arg Asp Leu Phe Glu
260 265 270
Gln Leu Thr Ser Lys
275
<210> 84
<211> 245
<212> PRT
<213> 大肠杆菌 J62 pLG74
<400> 84
Met Ser Leu Arg Ser Asp Leu Ile Asn Ala Leu Tyr Asp Glu Asn Gln
1 5 10 15
Lys Tyr Asp Val Cys Gly Ile Ile Ser Ala Glu Gly Lys Ile Tyr Pro
20 25 30
Leu Gly Ser Asp Thr Lys Val Leu Ser Thr Ile Phe Glu Leu Phe Ser
35 40 45
Arg Pro Ile Ile Asn Lys Ile Ala Glu Lys His Gly Tyr Ile Val Glu
50 55 60
Glu Pro Lys Gln Gln Asn His Tyr Pro Asp Phe Thr Leu Tyr Lys Pro
65 70 75 80
Ser Glu Pro Asn Lys Lys Ile Ala Ile Asp Ile Lys Thr Thr Tyr Thr
85 90 95
Asn Lys Glu Asn Glu Lys Ile Lys Phe Thr Leu Gly Gly Tyr Thr Ser
100 105 110
Phe Ile Arg Asn Asn Thr Lys Asn Ile Val Tyr Pro Phe Asp Gln Tyr
115 120 125
Ile Ala His Trp Ile Ile Gly Tyr Val Tyr Thr Arg Val Ala Thr Arg
130 135 140
Lys Ser Ser Leu Lys Thr Tyr Asn Ile Asn Glu Leu Asn Glu Ile Pro
145 150 155 160
Lys Pro Tyr Lys Gly Val Lys Val Phe Leu Gln Asp Lys Trp Val Ile
165 170 175
Ala Gly Asp Leu Ala Gly Ser Gly Asn Thr Thr Asn Ile Gly Ser Ile
180 185 190
His Ala His Tyr Lys Asp Phe Val Glu Gly Lys Gly Ile Phe Asp Ser
195 200 205
Glu Asp Glu Phe Leu Asp Tyr Trp Arg Asn Tyr Glu Arg Thr Ser Gln
210 215 220
Leu Arg Asn Asp Lys Tyr Asn Asn Ile Ser Glu Tyr Arg Asn Trp Ile
225 230 235 240
Tyr Arg Gly Arg Lys
245
<210> 85
<211> 300
<212> PRT
<213> 流感嗜血杆菌 Rd (外-突变体)(Haemophilus influenzae Rd (exo-mutant))
<400> 85
Met Lys Lys Ser Ala Leu Glu Lys Leu Leu Ser Leu Ile Glu Asn Leu
1 5 10 15
Thr Asn Gln Glu Phe Lys Gln Ala Thr Asn Ser Leu Ile Ser Phe Ile
20 25 30
Tyr Lys Leu Asn Arg Asn Glu Val Ile Glu Leu Val Arg Ser Ile Gly
35 40 45
Ile Leu Pro Glu Ala Ile Lys Pro Ser Ser Thr Gln Glu Lys Leu Phe
50 55 60
Ser Lys Ala Gly Asp Ile Val Leu Ala Lys Ala Phe Gln Leu Leu Asn
65 70 75 80
Leu Asn Ser Lys Pro Leu Glu Gln Arg Gly Asn Ala Gly Asp Val Ile
85 90 95
Ala Leu Ser Lys Glu Phe Asn Tyr Gly Leu Val Ala Asp Ala Lys Ser
100 105 110
Phe Arg Leu Ser Arg Thr Ala Lys Asn Gln Lys Asp Phe Lys Val Lys
115 120 125
Ala Leu Ser Glu Trp Arg Glu Asp Lys Asp Tyr Ala Val Leu Thr Ala
130 135 140
Pro Phe Phe Gln Tyr Pro Thr Thr Lys Ser Gln Ile Phe Lys Gln Ser
145 150 155 160
Leu Asp Glu Asn Val Leu Leu Phe Ser Trp Glu His Leu Ala Ile Leu
165 170 175
Leu Gln Leu Asp Leu Glu Glu Thr Asn Ile Phe Pro Phe Glu Gln Leu
180 185 190
Trp Asn Phe Pro Lys Lys Gln Ser Lys Lys Thr Ser Val Ser Asp Ala
195 200 205
Glu Asn Asn Phe Met Arg Asp Phe Asn Lys Tyr Phe Met Asp Leu Phe
210 215 220
Lys Ile Asp Lys Asp Thr Leu Asn Gln Leu Leu Gln Lys Glu Ile Asn
225 230 235 240
Phe Ile Glu Glu Arg Ser Leu Ile Glu Lys Glu Tyr Trp Lys Lys Gln
245 250 255
Ile Asn Ile Ile Lys Asn Phe Thr Arg Glu Glu Ala Ile Glu Ala Leu
260 265 270
Leu Lys Asp Ile Asn Met Ser Ser Lys Ile Glu Thr Ile Asp Ser Phe
275 280 285
Ile Lys Gly Ile Lys Ser Asn Asp Arg Leu Tyr Leu
290 295 300
<210> 86
<211> 254
<212> PRT
<213> 副流感嗜血杆菌(Haemophilus parainfluenzae)
<400> 86
Met Lys Tyr Glu Glu Ile Asn Phe Lys Val Pro Val Glu Ser Pro Tyr
1 5 10 15
Tyr Pro Asn Tyr Ser Gln Cys Val Ile Glu Arg Ile Tyr Ser Ile Leu
20 25 30
Arg Asn Gln Lys Asp Met Gly Asp Asp Arg Ile Ile Ile Asn Thr Asn
35 40 45
Leu Lys Lys Gly Leu Pro Leu Glu Asn Ile Asn Lys Ile Ala Gly Pro
50 55 60
Met Ile Glu Ala Trp Ala Glu Glu Val Phe Ser Gly Ile Arg Asp Asn
65 70 75 80
Arg Asp Asn Gln Tyr Asn Leu Ile Asn Val Glu Ala Gln Glu Arg Leu
85 90 95
Gly Ile Ser Asp Ile Ile Leu Gln Phe Gln Val Asn Asn Asn Val Ile
100 105 110
Thr Gly Asn Val Asp Val Lys Ala Thr Ser Asn Asp Ile Pro Asp Ser
115 120 125
Gly Lys Ser Pro Asn Ile Thr Ser Phe Ser Arg Ile Arg Thr Ala Tyr
130 135 140
Val Lys Asp Pro Asn Phe Ile Phe Ile Ile Leu Ser Ile Lys His Ser
145 150 155 160
Val Tyr Val Lys Arg Asn Glu Tyr Thr Asn Leu Met Asp Gly Ile Met
165 170 175
Gln Ile Ile Asp Phe Asn Val Tyr Asp Leu Lys Tyr Ile Ser Asp Ser
180 185 190
Asp Ile Ser Tyr Asn Pro Ala Leu Gly Thr Gly Gln Ile Gln Ile Lys
195 200 205
Asp Ile His Tyr Val Ser Ser Gln Lys Arg Thr Thr Trp Gln Met Cys
210 215 220
Gln Leu Leu Asp Leu Lys Tyr Leu Arg Ser Lys Lys Arg Thr Ile Glu
225 230 235 240
Gln Phe Tyr Asn Glu Ala Lys Arg Asn Lys Trp Ile Lys Asp
245 250
<210> 87
<211> 218
<212> PRT
<213> 克雷白氏肺炎菌(Klebsiella pnermoniae)OK8
<400> 87
Met Asp Val Phe Asp Lys Val Tyr Ser Asp Asp Asn Asn Ser Tyr Asp
1 5 10 15
Gln Lys Thr Val Ser Gln Arg Ile Glu Ala Leu Phe Leu Asn Asn Leu
20 25 30
Gly Lys Val Val Thr Arg Gln Gln Ile Ile Arg Ala Ala Thr Asp Pro
35 40 45
Lys Thr Gly Lys Gln Pro Glu Asn Trp His Gln Arg Leu Ser Glu Leu
50 55 60
Arg Thr Asp Lys Gly Tyr Thr Ile Leu Ser Trp Arg Asp Met Lys Val
65 70 75 80
Leu Ala Pro Gln Glu Tyr Ile Met Pro His Ala Thr Arg Arg Pro Lys
85 90 95
Ala Ala Lys Arg Val Leu Pro Thr Lys Glu Thr Trp Glu Gln Val Leu
100 105 110
Asp Arg Ala Asn Tyr Ser Cys Glu Trp Gln Glu Asp Gly Gln His Cys
115 120 125
Gly Leu Val Glu Gly Asp Ile Asp Pro Ile Gly Gly Gly Thr Val Lys
130 135 140
Leu Thr Pro Asp His Met Thr Pro His Ser Ile Asp Pro Ala Thr Asp
145 150 155 160
Val Asn Asp Pro Lys Met Trp Gln Ala Leu Cys Gly Arg His Gln Val
165 170 175
Met Lys Lys Asn Tyr Trp Asp Ser Asn Asn Gly Lys Ile Asn Val Ile
180 185 190
Gly Ile Leu Gln Ser Val Asn Glu Lys Gln Lys Asn Asp Ala Leu Glu
195 200 205
Phe Leu Leu Asn Tyr Tyr Gly Leu Lys Arg
210 215
<210> 88
<211> 288
<212> PRT
<213> 珊瑚红诺卡氏菌(Nocardia corallina)
<400> 88
Met Ala Thr Ala Pro Gly His Leu Leu Gly Gln Ile Ile Gly Asn Val
1 5 10 15
Met Glu Glu Ala Leu Lys Pro Val Leu Gln Glu Met Ala Asp Arg His
20 25 30
Asp Leu Tyr Leu Asp Ser Lys Gly Leu Arg Pro Gly Val Arg Ser Gly
35 40 45
Ala Leu Val Thr Trp Thr Asp Asp Leu Gly Asn Asn His Asp Leu Asp
50 55 60
Phe Val Leu Glu Arg Gly Gly Ser Ala Thr Lys Ala Gly Asn Pro Ala
65 70 75 80
Ala Phe Ile Glu Ala Ala Trp Arg Arg Tyr Thr Lys His Ser Lys Ala
85 90 95
Lys Ala Gln Glu Ile Gln Gly Ala Val Leu Pro Val Leu Ala Ala Trp
100 105 110
Asn Asn Val Lys Pro Thr Pro Ala Ala Val Val Ala Gly Gln Trp Thr
115 120 125
Ala Pro Ser Leu Gln Gln Met Arg Ser Asn Gly Phe Val Val Leu His
130 135 140
Leu His Phe Pro Thr Thr Ala Gln Val Phe Gly Gly Asn Gly Ile Asn
145 150 155 160
Ile Glu Gly Thr Gly Glu Gly Thr Pro Asp Ala Phe Trp Gln Gln Gln
165 170 175
Cys Asp Ala Tyr Thr Ser Lys Ser Glu Ala Asp Lys Asp Ser Leu Ala
180 185 190
Thr Ala Leu Arg Thr Ala His Ala Gln Glu Phe Arg Thr Phe Val Ala
195 200 205
Glu Leu Glu Arg Arg Val Val Arg Ala Ile Asp Tyr Val Val Val Thr
210 215 220
Pro Leu His Gly His Gly Ser Gln Tyr Thr Ser Ile Glu Asn Ala Ile
225 230 235 240
Glu Ala Val Arg Thr Tyr Ser Cys Gly Glu Glu Ser Ala Pro Phe Leu
245 250 255
Arg Phe Glu Ile Arg Ile Ser Tyr Thr Asn Gly Asp Val Ile Gln Ala
260 265 270
Thr Phe Gly Ser Ser Ser Asp Ala Ile Glu Phe Leu Asp Thr Phe Asn
275 280 285
<210> 89
<211> 328
<212> PRT
<213> 粘膜奈瑟氏菌( Neisseria mucosa)
<400> 89
Met Ser Ser Tyr His Asp Asp Leu Asn Ile Leu Asn Val Asp Phe Asn
1 5 10 15
His Leu Arg Leu Thr Glu Leu Ile Lys Leu Ala Asp Gln Ala Glu Pro
20 25 30
Phe Tyr Leu Trp Val Glu Lys Ile Phe Arg Gln Val Ser Gly Arg Ala
35 40 45
Asp Ser Leu Glu Thr Ile Ile Glu Val Glu Glu Arg Val Val Leu Lys
50 55 60
Met Ala Ile Leu Thr Cys Phe Thr Ser Asp Glu Lys Glu Leu Pro Lys
65 70 75 80
Leu Phe Asn Gly Val Gly Val Pro Tyr Pro His Ile Lys Ala Cys Tyr
85 90 95
Phe Phe Phe Ala Trp Leu Val Arg Asp Ala Ala Thr Gln Arg Leu Asp
100 105 110
Pro Leu Ile Arg Glu Ala Phe Thr Gln Leu Lys Ser Ile His Pro Gln
115 120 125
Met Lys Lys Thr Glu Leu Glu Ser Glu Ile Phe Ser Gln Leu Leu Val
130 135 140
Asn Tyr Arg Asn Glu Leu Ile His Phe Ser Trp Pro Val Ile Arg Glu
145 150 155 160
Val Leu Ile Ser Arg Leu Glu Gly Ser Arg Arg Ala Ala Arg Gly Ser
165 170 175
Tyr Leu Glu Leu Phe Val Arg Thr Ala Leu Ala Gln Ser Ile Thr Tyr
180 185 190
Phe Tyr Lys Ile Tyr Gly Asn Tyr Gly Lys Phe Leu Asp Val Lys Ile
195 200 205
His Asp Lys Pro Leu Lys Val Lys Asn Arg Thr Tyr Asp Val Val Ala
210 215 220
Glu Leu Ile Gly Asn Asn His Asn Thr Gln Tyr Leu Ile Leu Pro Val
225 230 235 240
Lys Thr Arg Glu Thr Gln Gly Gly Gly His Ala His Leu Phe Thr Arg
245 250 255
Asp Ile Glu Gln Ser Asn Asn Asp Ile Arg Glu Leu Tyr Pro Asn Ala
260 265 270
Val Ile Ala Pro Val Ile Ile Ala Glu Asn Trp Ser Asp Thr Glu Lys
275 280 285
Asp Leu Glu Asn Val Gly Tyr Asn Asp Ile Phe His Phe Ser Val Asn
290 295 300
Pro Asn Arg Phe Ala Gly Phe Ser Asp Val Glu Gln Ile Arg Leu Asn
305 310 315 320
Arg Leu Val Glu Arg Ile Leu Leu
325
<210> 90
<211> 383
<212> PRT
<213> 豚鼠诺卡氏菌(Nocardia otitidis-caviarum)
<400> 90
Met Arg Ser Asp Thr Ser Val Glu Pro Glu Gly Ala Asn Phe Ile Ala
1 5 10 15
Glu Phe Phe Gly His Arg Val Tyr Pro Glu Val Val Ser Thr Glu Ala
20 25 30
Ala Arg Asn Asp Gln Ala Thr Gly Thr Cys Pro Phe Leu Thr Ala Ala
35 40 45
Lys Leu Val Glu Thr Ser Cys Val Lys Ala Glu Thr Ser Arg Gly Val
50 55 60
Cys Val Val Asn Thr Ala Val Asp Asn Glu Arg Tyr Asp Trp Leu Val
65 70 75 80
Cys Pro Asn Arg Ala Leu Asp Pro Leu Phe Met Ser Ala Ala Ser Arg
85 90 95
Lys Leu Phe Gly Tyr Gly Pro Thr Glu Pro Leu Gln Phe Ile Ala Ala
100 105 110
Pro Thr Leu Ala Asp Gln Ala Val Arg Asp Gly Ile Arg Glu Trp Leu
115 120 125
Asp Arg Gly Val His Val Val Ala Tyr Phe Gln Glu Lys Leu Gly Gly
130 135 140
Glu Leu Ser Ile Ser Lys Thr Asp Ser Ser Pro Glu Phe Ser Phe Asp
145 150 155 160
Trp Thr Leu Ala Glu Val Glu Ser Ile Tyr Pro Val Pro Lys Ile Lys
165 170 175
Arg Tyr Gly Val Leu Glu Ile Gln Thr Met Asp Phe His Gly Ser Tyr
180 185 190
Lys His Ala Val Gly Ala Ile Asp Ile Ala Leu Val Glu Gly Ile Asp
195 200 205
Phe His Gly Trp Leu Pro Thr Pro Ala Gly Arg Ala Ala Leu Ser Lys
210 215 220
Lys Met Glu Gly Pro Asn Leu Ser Asn Val Phe Lys Arg Thr Phe Tyr
225 230 235 240
Gln Met Ala Tyr Lys Phe Ala Leu Ser Gly His Gln Arg Cys Ala Gly
245 250 255
Thr Gly Phe Ala Ile Pro Gln Ser Val Trp Lys Ser Trp Leu Arg His
260 265 270
Leu Ala Asn Pro Thr Leu Ile Asp Asn Gly Asp Gly Thr Phe Ser Leu
275 280 285
Gly Asp Thr Arg Asn Asp Ser Glu Asn Ala Trp Ile Phe Val Phe Glu
290 295 300
Leu Asp Pro Asp Thr Asp Ala Ser Pro Arg Pro Leu Ala Pro His Leu
305 310 315 320
Glu Ile Arg Val Asn Val Asp Thr Leu Ile Asp Leu Ala Leu Arg Glu
325 330 335
Ser Pro Arg Ala Ala Leu Gly Pro Ser Gly Pro Val Ala Thr Phe Thr
340 345 350
Asp Lys Val Glu Ala Arg Met Leu Arg Phe Trp Pro Lys Thr Arg Arg
355 360 365
Arg Arg Ser Thr Thr Pro Gly Gly Gln Arg Gly Leu Phe Asp Ala
370 375 380
<210> 91
<211> 326
<212> PRT
<213> 斯氏普罗威登斯菌(Providencia stuartii)164
<400> 91
Met Lys Glu Leu Lys Leu Lys Glu Ala Lys Glu Ile Leu Lys Ala Leu
1 5 10 15
Gly Leu Pro Pro Gln Gln Tyr Asn Asp Arg Ser Gly Trp Val Leu Leu
20 25 30
Ala Leu Ala Asn Ile Lys Pro Glu Asp Ser Trp Lys Glu Ala Lys Ala
35 40 45
Pro Leu Leu Pro Thr Val Ser Ile Met Glu Phe Ile Arg Thr Glu Tyr
50 55 60
Gly Lys Asp Tyr Lys Pro Asn Ser Arg Glu Thr Ile Arg Arg Gln Thr
65 70 75 80
Leu His Gln Phe Glu Gln Ala Arg Ile Val Asp Arg Asn Arg Asp Leu
85 90 95
Pro Ser Arg Ala Thr Asn Ser Lys Asp Asn Asn Tyr Ser Leu Asn Gln
100 105 110
Val Ile Ile Asp Ile Leu His Asn Tyr Pro Asn Gly Asn Trp Lys Glu
115 120 125
Leu Ile Gln Gln Phe Leu Thr His Val Pro Ser Leu Gln Glu Leu Tyr
130 135 140
Glu Arg Ala Leu Ala Arg Asp Arg Ile Pro Ile Lys Leu Leu Asp Gly
145 150 155 160
Thr Gln Ile Ser Leu Ser Pro Gly Glu His Asn Gln Leu His Ala Asp
165 170 175
Ile Val His Glu Phe Cys Pro Arg Phe Val Gly Asp Met Gly Lys Ile
180 185 190
Leu Tyr Ile Gly Asp Thr Ala Ser Ser Arg Asn Glu Gly Gly Lys Leu
195 200 205
Met Val Leu Asp Ser Glu Tyr Leu Lys Lys Leu Gly Val Pro Pro Met
210 215 220
Ser His Asp Lys Leu Pro Asp Val Val Val Tyr Asp Glu Lys Arg Lys
225 230 235 240
Trp Leu Phe Leu Ile Glu Ala Val Thr Ser His Gly Pro Ile Ser Pro
245 250 255
Lys Arg Trp Leu Glu Leu Glu Ala Ala Leu Ser Ser Cys Thr Val Gly
260 265 270
Lys Val Tyr Val Thr Ala Phe Pro Thr Arg Thr Glu Phe Arg Lys Asn
275 280 285
Ala Ala Asn Ile Ala Trp Glu Thr Glu Val Trp Ile Ala Asp Asn Pro
290 295 300
Asp His Met Val His Phe Asn Gly Asp Arg Phe Leu Gly Pro His Asp
305 310 315 320
Lys Lys Pro Glu Leu Ser
325
<210> 92
<211> 157
<212> PRT
<213> 普通变形杆菌(Proteus vulgaris)
<400> 92
Met Ser His Pro Asp Leu Asn Lys Leu Leu Glu Leu Trp Pro His Ile
1 5 10 15
Gln Glu Tyr Gln Asp Leu Ala Leu Lys His Gly Ile Asn Asp Ile Phe
20 25 30
Gln Asp Asn Gly Gly Lys Leu Leu Gln Val Leu Leu Ile Thr Gly Leu
35 40 45
Thr Val Leu Pro Gly Arg Glu Gly Asn Asp Ala Val Asp Asn Ala Gly
50 55 60
Gln Glu Tyr Glu Leu Lys Ser Ile Asn Ile Asp Leu Thr Lys Gly Phe
65 70 75 80
Ser Thr His His His Met Asn Pro Val Ile Ile Ala Lys Tyr Arg Gln
85 90 95
Val Pro Trp Ile Phe Ala Ile Tyr Arg Gly Ile Ala Ile Glu Ala Ile
100 105 110
Tyr Arg Leu Glu Pro Lys Asp Leu Glu Phe Tyr Tyr Asp Lys Trp Glu
115 120 125
Arg Lys Trp Tyr Ser Asp Gly His Lys Asp Ile Asn Asn Pro Lys Ile
130 135 140
Pro Val Lys Tyr Val Met Glu His Gly Thr Lys Ile Tyr
145 150 155
<210> 93
<211> 358
<212> PRT
<213> 不产色链霉菌(Streptomyces achromogenes)
<400> 93
Met Gly Ile Thr Ile Lys Lys Ser Thr Ala Glu Gln Val Leu Arg Lys
1 5 10 15
Ala Tyr Glu Ala Ala Ala Ser Asp Asp Val Phe Leu Glu Asp Trp Ile
20 25 30
Phe Leu Ala Thr Ser Leu Arg Glu Val Asp Ala Pro Arg Thr Tyr Thr
35 40 45
Ala Ala Leu Val Thr Ala Leu Leu Ala Arg Ala Cys Asp Asp Arg Val
50 55 60
Asp Pro Arg Ser Ile Lys Glu Lys Tyr Asp Asp Arg Ala Phe Ser Leu
65 70 75 80
Arg Thr Leu Cys His Gly Val Val Val Pro Met Ser Val Glu Leu Gly
85 90 95
Phe Asp Leu Gly Ala Thr Gly Arg Glu Pro Ile Asn Asn Gln Pro Phe
100 105 110
Phe Arg Tyr Asp Gln Tyr Ser Glu Ile Val Arg Val Gln Thr Lys Ala
115 120 125
Arg Pro Tyr Leu Asp Arg Val Ser Ser Ala Leu Ala Arg Val Asp Glu
130 135 140
Glu Asp Tyr Ser Thr Glu Glu Ser Phe Arg Ala Leu Val Ala Val Leu
145 150 155 160
Ala Val Cys Ile Ser Val Ala Asn Lys Lys Gln Arg Val Ala Val Gly
165 170 175
Ser Ala Ile Val Glu Ala Ser Leu Ile Ala Glu Thr Gln Ser Phe Val
180 185 190
Val Ser Gly His Asp Val Pro Arg Lys Leu Gln Ala Cys Val Ala Ala
195 200 205
Gly Leu Asp Met Val Tyr Ser Glu Val Val Ser Arg Arg Ile Asn Asp
210 215 220
Pro Ser Arg Asp Phe Pro Gly Asp Val Gln Val Ile Leu Asp Gly Asp
225 230 235 240
Pro Leu Leu Thr Val Glu Val Arg Gly Lys Ser Val Ser Trp Glu Gly
245 250 255
Leu Glu Gln Phe Val Ser Ser Ala Thr Tyr Ala Gly Phe Arg Arg Val
260 265 270
Ala Leu Met Val Asp Ala Ala Ser His Val Ser Leu Met Ser Ala Asp
275 280 285
Asp Leu Thr Ser Ala Leu Glu Arg Lys Tyr Glu Cys Ile Val Lys Val
290 295 300
Asn Glu Ser Val Ser Ser Phe Leu Arg Asp Val Phe Val Trp Ser Pro
305 310 315 320
Arg Asp Val His Ser Ile Leu Ser Ala Phe Pro Glu Ala Met Tyr Arg
325 330 335
Arg Met Ile Glu Ile Glu Val Arg Glu Pro Glu Leu Asp Arg Trp Ala
340 345 350
Glu Ile Phe Pro Glu Thr
355
<210> 94
<211> 315
<212> PRT
<213> 白色链霉菌(Streptomyces albus)G
<400> 94
Met Ile Asn Ala Asp Lys Pro His Arg Trp Asn Asp Asp Val Gln Ala
1 5 10 15
Ser Val Arg Leu Tyr Asn Gln Trp Phe Leu Asp Ala Ala Pro Lys Ala
20 25 30
Tyr Arg Asp Thr Arg Gln Leu Thr Ile Asp Glu Val Glu Gln Ala Phe
35 40 45
Gln Arg Thr Ala Asn Met Thr Ser Ile Thr Pro Glu Val Leu Lys Ala
50 55 60
His Pro Lys Thr Leu Ala Thr Leu Arg Met Ser Thr Ala Pro Pro Ile
65 70 75 80
Ala Arg Asp Arg Leu Val Gly Leu Ser His Gly Ser Lys Ser Leu Leu
85 90 95
Asp Thr Met Glu Lys Gly Lys Leu Pro Pro Arg Met Lys Gly Asp Val
100 105 110
Leu Asp Thr His Leu Ala Lys Met Cys Ala Val Leu Thr Asp Leu Leu
115 120 125
Asp Leu Asp Leu Phe His Trp Tyr Pro Thr Gly Glu Pro Ala Glu Pro
130 135 140
Arg Gln Arg Glu Leu Ala Ala Thr Val Val Ala Asp Arg Leu Cys Gly
145 150 155 160
Ala Ile Ala Asp Pro Ile Val Arg Asn Ala Gln Glu Arg Arg Gln Leu
165 170 175
Ala Leu Ile Glu Glu Trp Leu Leu Ala Arg Gly Tyr Thr Lys Lys Thr
180 185 190
His Ser Ala Ser Leu Pro Leu Asn Thr Met Gln Pro Gly Thr Phe Ser
195 200 205
Phe Arg Gln Asn Val Val Val Gly Ser Asp Leu Pro Val Asn Ile Pro
210 215 220
Val Asp Ala Val Ile Gln Pro His Thr Pro His Ser His Lys Leu Pro
225 230 235 240
Ile Leu Ile Glu Ala Lys Ser Ala Gly Asp Phe Thr Asn Thr Asn Lys
245 250 255
Arg Arg Lys Glu Glu Ala Thr Lys Ile His Gln Leu Gln Leu Lys Tyr
260 265 270
Gly Asn Glu Ile Ser Leu Thr Leu Phe Leu Cys Gly Tyr Phe Asn Thr
275 280 285
Gly Tyr Leu Gly Tyr Ser Ala Ala Glu Gly Leu Asp Trp Val Trp Glu
290 295 300
His Arg Ile Asp Asp Leu Glu Ala Ala Gly Ala
305 310 315
<210> 95
<211> 432
<212> PRT
<213> 糖多孢菌某种(Saccharopolyspora sp.)
<400> 95
Met Arg Arg Leu Ala Thr Gln Arg Arg Glu Asp Ala Tyr Lys Ser Asn
1 5 10 15
Arg Asp Tyr Gln Thr Val His Glu Ala Gln Ser Leu Arg Val Asn Ser
20 25 30
Thr Asp Asp Asp Asn Leu Ser Leu Phe Leu Leu Lys Asp Ile Ser Pro
35 40 45
Arg Glu Asp Ser Lys Asn Ile Val Gly Phe Gly Gly Phe Val Lys Pro
50 55 60
Glu Ile Ala Thr Thr Met Ala Leu Thr Leu Thr Thr Asp Ile Asp Lys
65 70 75 80
Gln Ile Lys Ser Val Pro Leu Ser Ser Asn Trp Asn Arg Ile Ser Ile
85 90 95
Val Ala Lys Phe Ala Ser Asn Pro Ser Val Ser Ile Thr Leu Gly Phe
100 105 110
Asp Gln Thr Pro Trp Val Asp Phe Trp Gly Ile Asn Ser Asp Asp Ile
115 120 125
Gly Leu Ser Phe Val Ser Asp Ala Val Pro Leu Glu Met Ser Met Ile
130 135 140
Asp Ser Ile His Ile Ala Pro Glu Thr Leu Tyr Leu Asp His Ser Ser
145 150 155 160
Ala Cys Leu Leu Asp Ile Asp Pro Val Glu Ser Thr Arg Phe Lys Thr
165 170 175
Gly His Gly Asp Pro Leu Ser Leu Lys Lys Cys Ser Tyr Cys Gly Arg
180 185 190
Leu Leu Pro Ile Asp Leu Glu Arg Pro Gly Lys Leu Ser Phe His Lys
195 200 205
His Arg Ala Lys Ile Thr Asn His Gln Asn Glu Cys Arg Ser Cys Lys
210 215 220
Lys Trp Arg Ile Asn Asn Ser Phe Asn Pro Met Arg Thr Ile Asp Gln
225 230 235 240
Leu Asn Glu Ser Ala Leu Ile Thr Arg Glu Arg Lys Ile Phe Leu Gln
245 250 255
Glu Pro Glu Ile Leu Gln Glu Ile Lys Asp Arg Thr Gly Ala Gly Leu
260 265 270
Lys Ser Gln Val Trp Glu Arg Phe His Arg Lys Cys Phe Asn Cys Arg
275 280 285
Lys Asp Leu Lys Leu Ser Glu Val Gln Leu Asp His Thr Arg Pro Leu
290 295 300
Ala Tyr Leu Trp Pro Ile Asp Glu His Ala Thr Cys Leu Cys Ala Gln
305 310 315 320
Cys Asn Asn Thr Lys Lys Asp Arg Phe Pro Val Asp Phe Tyr Ser Glu
325 330 335
Gln Gln Ile Arg Glu Leu Ser Asp Ile Cys Gly Leu Pro Tyr Gln Asp
340 345 350
Leu Cys Ala Arg Ser Leu Asn Leu Asp Gln Leu Asp Arg Ile Glu Arg
355 360 365
Asn Ile Ala Glu Phe Ser Lys Glu Trp Asp Val Arg Thr Phe Ala Ser
370 375 380
Thr Ala Arg Arg Ile Ser Glu Val Tyr Pro Ala Arg Asp Leu Phe Glu
385 390 395 400
Thr Leu Lys Lys Glu Ser Glu Ser Ala Tyr Asn Lys Ile Ile Glu Lys
405 410 415
Leu Lys Glu Arg Pro Asp Ala Leu Leu Asp Glu Ala Leu Pro Leu Asp
420 425 430
<210> 96
<211> 323
<212> PRT
<213> 链霉菌属菌种(Streptomyces species)Bf-61
<400> 96
Met Asn Ser Ser Asp Gly Ile Asp Gly Thr Val Ala Ser Ile Asp Thr
1 5 10 15
Ala Arg Ala Leu Leu Lys Arg Phe Gly Phe Asp Ala Gln Arg Tyr Asn
20 25 30
Val Arg Ser Ala Val Thr Leu Leu Ala Leu Ala Gly Leu Lys Pro Gly
35 40 45
Asp Arg Trp Val Asp Ser Thr Thr Pro Arg Leu Gly Val Gln Lys Ile
50 55 60
Met Asp Trp Ser Gly Glu His Trp Ala Lys Pro Tyr Ala Thr Gly Ser
65 70 75 80
Arg Glu Asp Phe Arg Lys Lys Thr Leu Arg Gln Trp Val Asp Asn Gly
85 90 95
Phe Ala Val Leu Asn Ala Asp Asn Leu Asn Ile Ala Thr Asn Ser Gln
100 105 110
Leu Asn Glu Tyr Cys Leu Ser Asp Glu Ala Leu Gln Ala Leu Arg Ala
115 120 125
Tyr Gly Thr Glu Gly Phe Glu Glu Ser Leu Val Val Phe Leu Asp Glu
130 135 140
Ala Ser Lys Ala Val Lys Ala Arg Ala Glu Ala Leu Gln Ala Ala Met
145 150 155 160
Ile Ser Val Asp Leu Pro Gly Gly Glu Glu Phe Leu Leu Ser Pro Ala
165 170 175
Gly Gln Asn Pro Leu Leu Lys Lys Met Val Glu Glu Phe Val Pro Arg
180 185 190
Phe Ala Pro Arg Ser Thr Val Leu Tyr Leu Gly Asp Thr Arg Gly Lys
195 200 205
His Ser Leu Phe Glu Arg Glu Ile Phe Glu Glu Val Leu Gly Leu Thr
210 215 220
Phe Asp Pro His Gly Arg Met Pro Asp Leu Ile Leu His Asp Glu Val
225 230 235 240
Arg Gly Trp Leu Phe Leu Met Glu Ala Val Lys Ser Lys Gly Pro Phe
245 250 255
Asp Glu Glu Arg His Arg Ser Leu Gln Glu Leu Phe Val Thr Pro Ser
260 265 270
Ala Gly Leu Ile Phe Val Asn Cys Phe Glu Asn Arg Glu Ser Met Arg
275 280 285
Gln Trp Leu Pro Glu Leu Ala Trp Glu Thr Glu Ala Trp Val Ala Glu
290 295 300
Asp Pro Asp His Leu Ile His Leu Asn Gly Ser Arg Phe Leu Gly Pro
305 310 315 320
Tyr Glu Arg
<210> 97
<211> 227
<212> PRT
<213> 头状链霉菌(Streptomyces caespitosus)
<400> 97
Met Ile Asn Asp Gln Leu Pro Arg Trp Val Arg Glu Ala Arg Val Gly
1 5 10 15
Thr Arg Thr Gly Gly Pro Ala Met Arg Pro Lys Thr Ser Asp Ser Pro
20 25 30
Tyr Phe Gly Trp Asp Ser Glu Asp Trp Pro Glu Val Thr Arg Gln Leu
35 40 45
Leu Ser Glu Gln Pro Leu Ser Gly Asp Thr Leu Val Asp Ala Val Leu
50 55 60
Ala Ser Trp Glu Ser Ile Phe Glu Ser Arg Leu Gly Ser Gly Phe His
65 70 75 80
Ile Gly Thr Gln Ile Arg Pro Thr Pro Gln Ile Met Gly Phe Leu Leu
85 90 95
His Ala Leu Ile Pro Leu Glu Leu Ala Asn Gly Asp Pro Ser Trp Arg
100 105 110
Ala Asp Leu Asn Ser Ser Glu Lys Asp Leu Val Tyr Gln Pro Asp His
115 120 125
Lys Tyr Ser Ile Glu Met Lys Thr Ser Ser His Lys Asp Gln Ile Phe
130 135 140
Gly Asn Arg Ser Phe Gly Val Glu Asn Pro Gly Lys Gly Lys Lys Ala
145 150 155 160
Lys Asp Gly Tyr Tyr Val Ala Val Asn Phe Glu Lys Trp Ser Asp Ala
165 170 175
Pro Gly Arg Leu Pro Arg Ile Arg Thr Ile Arg Tyr Gly Trp Leu Asp
180 185 190
His Thr Asp Trp Val Ala Gln Lys Ser Gln Thr Gly Gln Gln Ser Ser
195 200 205
Leu Pro Ala Val Val Ser Asn Thr Gln Leu Leu Ala Ile His Thr Gly
210 215 220
Gly Gln Arg
225
<210> 98
<211> 235
<212> PRT
<213> 产褐色链霉菌(Streptomyces phaeochromogenes)
<400> 98
Met Thr Ser Lys Asp Pro Ile Val Leu Ser Ala Asp Gln Ile Ala Trp
1 5 10 15
Leu Arg Gln Leu Lys Met Ser Lys Arg Ala Ala Leu Val Arg Asp Tyr
20 25 30
Ile Leu Glu Tyr Gly Ala Val Thr Thr Gly Lys Leu Ala Glu Leu Gly
35 40 45
Tyr Ser His Pro Pro Arg Ala Ala Arg Asp Leu Lys Asp Ala Gly Ala
50 55 60
Gly Val Val Thr Ile Met Val Lys Gly Pro Asp Gly Arg Arg Met Ala
65 70 75 80
Ser Tyr Ala Phe Asn Gly Lys Ala Asn Glu Asp Gly Ala Gly Arg Val
85 90 95
Val Ile Pro Lys Ala Phe Gly Glu Ala Leu Lys Arg Ala His Gly Gly
100 105 110
Lys Cys Ala Val Cys Tyr Gly Asp Phe Ser Glu Arg Glu Leu Gln Cys
115 120 125
Asp His Arg Val Pro Phe Ala Ile Ala Gly Asp Lys Pro Lys Leu Val
130 135 140
Gln Glu Asp Phe Met Pro Leu Cys Ala Ser Asp Asn Arg Ala Lys Ser
145 150 155 160
Trp Ser Cys Glu Asn Cys Pro Asn Trp Glu Leu Lys Asp Glu Asp Thr
165 170 175
Cys Arg Ser Cys Phe Trp Ala Ser Pro Glu Asn Tyr Thr His Val Ser
180 185 190
Thr Arg Pro Glu Arg Arg Ile Asn Leu Leu Phe Gln Gly Asp Glu Val
195 200 205
Glu Ile Phe Asp Ala Leu Lys Asn Ala Ala Ala Asn Glu Gly Val Ser
210 215 220
Leu Thr Glu Ala Thr Lys Arg Lys Leu Ala Asp
225 230 235
<210> 99
<211> 281
<212> PRT
<213> 球衣细菌属某种(Sphaerotilus species)
<400> 99
Met Ser Lys Ala Ala Tyr Gln Asp Phe Thr Lys Arg Phe Ser Leu Leu
1 5 10 15
Ile Lys Lys His Pro Asn Leu Ile Thr Met Thr Leu Ser Asn Ile Phe
20 25 30
Thr Met Arg Leu Ile Gly Asn Lys Thr His Gly Asp Leu Ala Glu Ile
35 40 45
Ala Ile Ser Glu Phe Ile Asn Gln Tyr Met Tyr Asp Phe Lys Ser Ile
50 55 60
His Val Gly Lys Asp Leu Tyr Arg Ala Lys Ser Lys Glu Glu Asp Ile
65 70 75 80
Thr Val Glu Asn Glu Ile Thr Lys Glu Lys Phe Pro Ile Ser Leu Lys
85 90 95
Ala Tyr Gly Asp Gly Pro Leu Gln Leu Ser Thr Asp Lys Asn Phe Leu
100 105 110
Met Tyr Pro Leu Leu Glu Glu Ile Gly Ala Phe Ile Asn Ala Lys Glu
115 120 125
Lys Ile Glu Glu Ile Phe Ala Asn Glu Ala Phe Ser Cys Phe Ser Glu
130 135 140
Ile Asn Val Leu Pro Leu Ile Tyr Asp Glu Lys Arg Gln Arg Cys Asn
145 150 155 160
Ile Leu Val Phe Asp Ala Ala Arg Ala Arg Ala Glu Thr Ala Tyr Ile
165 170 175
Arg Lys Glu Thr Glu Gly Ser Gly Arg Lys His Pro Ala Tyr Arg Phe
180 185 190
Phe Asp Lys Asn Lys Asn Tyr Ile Cys Glu Val Arg Tyr Gly Asn Ala
195 200 205
Ala Ala Asn Ala Leu Gln Arg Gly Leu Trp Thr Asn Thr Lys Asn Ala
210 215 220
Thr Ser Phe Phe Asp Ser Val Thr Asn Gly Trp Val Asp Tyr Ser His
225 230 235 240
Asn Leu Val Leu Val Lys Leu Leu Ser His Ala Leu Val Ser Ser Arg
245 250 255
Lys Gly His Glu Ala Ala Leu Glu Glu Ile Lys Lys Asp Ile Leu Gln
260 265 270
Leu Lys Gln Thr Asn Gly Ile Asn Val
275 280
<210> 100
<211> 1077
<212> DNA
<213> 鱼腥藻
<400> 100
atggaagaag accttgattt atctgaaaat atcgaagctg catctgcgga gcttacgact 60
ctttatcagg tagctgctga tgctatgaaa gattatattg aaatctatct tgcgctgagt 120
aaacagtctg atgggttttc aaatattaac aatcttgact taacttctcg taacaggcgt 180
ttggtagtta tacatggact ttcgttagag ttagatccag atacttcgac tccagaggaa 240
attaaacgtg aagctgaacg aatgctagcg atagctcttg atacagagtc agcaattacg 300
gcaggagtat atgaaaaaat gcgtctcttc gcaagctctt tagtagatca gctatttgaa 360
caaacggatg aacttaattc attatcatcg gaatatttgt cagcaaatcc aggatttttg 420
ccgtttttcc agcagttggc ggggcttaga agtaaatcag agttaaagag agaagtagga 480
aatgcctctg acaatagtat ttctaaagcg gttgcagaga gaatattaga gcgcattata 540
cgtaacttga gaattcgcac tttttccaaa gagaaactat tacaagctgt tgagcctact 600
ttagaaggaa tagtcaggga tctcgtagga aaagtgttat tggaaaatat agttgctgat 660
gctttatctg atttacaagt tcctttcatg cgtgaatcag agtatcaaag ccttaaagga 720
gtgatttatg atttccgcgc tgattttgtg ataccagacg cacaaaatcc aattgctttt 780
atcgaggtgc gaaaaagctc tacacgacat gcgtcactct atgccaagga taagatgttt 840
tcagcgatta attggaaagg aaaaaataaa aggcttttgg gtattttggt tgtggaagga 900
ccttggacaa gagaaactct tcgcgtcatg gcaaatgtgt ttgattacgt tacaccttta 960
actcgtgttt cccaagttgc agaagctatc agagcatatc tagatgggga taaaacgaga 1020
ctgaagtggt tagttaattt cagtattgaa gaagcagacc acgacaacat aacctaa 1077
<210> 101
<211> 1293
<212> DNA
<213> 球形芽孢杆菌
<400> 101
atgagacgat tagcaaaaaa ttcacggaac gacagttatt taagtaatag ggattaccag 60
gaaatcgtga gggaaaatac cactacaata tcgtttccct taaaagaaaa acatactctg 120
actttaacga aaaaaatagg gctaaatcag actgctggat tcggaggatg gtttttccct 180
gattcaccat gtttattaac agtaactgta ctatcctctt tcggtacaaa ggtaacttct 240
aaaaccttta gcctttctaa agattggaat cgtgttgggc ttgcttggat taacgagcat 300
tcgagtgaca ccataagcat tgtcctagag tttagtgatg tggaaatagt tcatacatgg 360
ggacttacat gtgatgtttt taatgtccat gaattaatta ttgatgctat agaagatcaa 420
aataaactaa tagacgtgct aaatcaagaa catttatctc ctgaaacata ttatttaaac 480
catgactctg atactgattt aattgagaat ttggaatcta cagaagagat aaagatagtt 540
aaccaaagcc aaaagcaaat ctctttaaaa aaatgctgtt attgtcaacg ttatatgcct 600
gtgaacatat tagttcgttc aaattcatca tttcataaac acaagagtaa gaaaactggt 660
tttcaaaatg aatgtcgggc ttgtaagaag tggagaataa ataattcatt caatccagtc 720
agaacaaaag accaactaca tgaatcagca gttattacac gtgaaaaaaa aatattactt 780
aaagaacctg aaatattaca gaaaatcaaa aatagaaata acggtgaggg cttaaaaagt 840
attatatgga aaaaatttga taaaaaatgc tttaattgtg aaaaagaatt aaccattgaa 900
gaggtacgcc tagaccatac aagaccactt gcttatctgt ggcctatcga tgaacacgca 960
acttgtttat gtgaaaaatg caacaataca aaacatgata tgtttcctat cgatttttat 1020
caaggggacg aagacaaatt aagacgttta gctagaatta cggggttaga ttatgaatct 1080
ctagttaaga gggacgtaaa tgaagttgaa cttgcaagaa taatcaataa cattgaagac 1140
tttgcaacta atgtagaggc acgtactttt cgctcaataa gaaataaagt aaaagaagta 1200
cgtcccgata ctgacctatt tgaaattctt aaatctaaaa atattaattt atataatgaa 1260
cttcaatatg aacttcttac ccgtaaggat taa 1293
<210> 102
<211> 2189
<212> DNA
<213> 人工
<220>
<223> 质粒placzz2
<400> 102
ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag 60
tcacgacgtt gtaaaacgac ggccagtgaa ttcgagctcg gtacccgggg gcgcgccgga 120
tccttaatta agtctagagt cgactgttta aacctgcagg catgcaagct tggcgtaatc 180
atggtcatat gttaacctcc ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 240
tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 300
gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 360
ggaaacctgt cgtgccagca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa 420
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 480
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 540
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 600
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 660
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 720
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 780
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 840
gttcttgaag tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc 900
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 960
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 1020
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 1080
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 1140
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 1200
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 1260
tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 1320
tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag caataaacca 1380
gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 1440
tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 1500
tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 1560
ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 1620
tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 1680
ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 1740
gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 1800
ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 1860
cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 1920
ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 1980
ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 2040
gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 2100
ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 2160
gcgcacattt ccccgaaaag tgccacctg 2189
<210> 103
<211> 10673
<212> DNA
<213> 人工
<220>
<223> 质粒pBC4
<400> 103
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat 420
cctctagagt cgaaccccgg atccggccgt ccgccgtgat ccatgcggtt accgcccgcg 480
tgtcgaaccc aggtgtgcga cgtcagacaa cgggggagcg ctccttttgg cttccttcca 540
ggcgcggcgg ctgctgcgct agcttttttg gccactggcc gcgcgcggcg taagcggtta 600
ggctggaaag cgaaagcatt aagtggctcg ctccctgtag ccggagggtt attttccaag 660
ggttgagtcg caggaccccc ggttcgagtc tcgggccggc cggactgcgg cgaacggggg 720
tttgcctccc cgtcatgcaa gaccccgctt gcaaattcct ccggaaacag ggacgagccc 780
cttttttgct tttcccagat gcatccggtg ctgcggcaga tgcgcccccc tcctcagcag 840
cggcaagagc aagagcagcg gcagacatgc agggcaccct ccccttctcc taccgcgtca 900
ggaggggcaa catccgcggc tgacgcggcg gcagatggtg attacgaacc cccgcggcgc 960
cgggcccggc actacctgga cttggaggag ggcgagggcc tggcgcggct aggagcgccc 1020
tctcctgagc gacacccaag ggtgcagctg aagcgtgaca cgcgcgaggc gtacgtgccg 1080
cggcagaacc tgtttcgcga ccgcgaggga gaggagcccg aggagatgcg ggatcgaaag 1140
ttccacgcag ggcgcgagtt gcggcatggc ctgaaccgcg agcggttgct gcgcgaggag 1200
gactttgagc ccgacgcgcg gaccgggatt agtcccgcgc gcgcacacgt ggcggccgcc 1260
gacctggtaa ccgcgtacga gcagacggtg aaccaggaga ttaactttca aaaaagcttt 1320
aacaaccacg tgcgcacgct tgtggcgcgc gaggaggtgg ctataggact gatgcatctg 1380
tgggactttg taagcgcgct ggagcaaaac ccaaatagca agccgctcat ggcgcagctg 1440
ttccttatag tgcagcacag cagggacaac gaggcattca gggatgcgct gctaaacata 1500
gtagagcccg agggccgctg gctgctcgat ttgataaaca ttctgcagag catagtggtg 1560
caggagcgca gcttgagcct ggctgacaag gtggccgcca ttaactattc catgctcagt 1620
ctgggcaagt tttacgcccg caagatatac catacccctt acgttcccat agacaaggag 1680
gtaaagatcg aggggttcta catgcgcatg gcgttgaagg tgcttacctt gagcgacgac 1740
ctgggcgttt atcgcaacga gcgcatccac aaggccgtga gcgtgagccg gcggcgcgag 1800
ctcagcgacc gcgagctgat gcacagcctg caaagggccc tggctggcac gggcagcggc 1860
gatagagagg ccgagtccta ctttgacgcg ggcgctgacc tgcgctgggc cccaagccga 1920
cgcgccctgg aggcagctgg ggccggacct gggctggcgg tggcacccgc gcgcgctggc 1980
aacgtcggcg gcgtggagga atatgacgag gacgatgagt acgagccaga ggacggcgag 2040
tactaagcgg tgatgtttct gatcagatga tgcaagacgc aacggacccg gcggtgcggg 2100
cggcgctgca gagccagccg tccggcctta actccacgga cgactggcgc caggtcatgg 2160
accgcatcat gtcgctgact gcgcgtaacc ctgacgcgtt ccggcagcag ccgcaggcca 2220
accggctctc cgcaattctg gaagcggtgg tcccggcgcg cgcaaacccc acgcacgaga 2280
aggtgctggc gatcgtaaac gcgctggccg aaaacagggc catccggccc gatgaggccg 2340
gcctggtcta cgacgcgctg cttcagcgcg tggctcgtta caacagcggc aacgtgcaga 2400
ccaacctgga ccggctggtg ggggatgtgc gcgaggccgt ggcgcagcgt gagcgcgcgc 2460
agcagcaggg caacctgggc tccatggttg cactaaacgc cttcctgagt acacagcccg 2520
ccaacgtgcc gcggggacag gaggactaca ccaactttgt gagcgcactg cggctaatgg 2580
tgactgagac accgcaaagt gaggtgtacc agtccgggcc agactatttt ttccagacca 2640
gtagacaagg cctgcagacc gtaaacctga gccaggcttt caagaacttg caggggctgt 2700
ggggggtgcg ggctcccaca ggcgaccgcg cgaccgtgtc tagcttgctg acgcccaact 2760
cgcgcctgtt gctgctgcta atagcgccct tcacggacag tggcagcgtg tcccgggaca 2820
catacctagg tcacttgctg acactgtacc gcgaggccat aggtcaggcg catgtggacg 2880
agcatacttt ccaggagatt acaagtgtca gccgcgcgct ggggcaggag gacacgggca 2940
gcctggaggc aaccctgaac tacctgctga ccaaccggcg gcagaagatc ccctcgttgc 3000
acagtttaaa cagcgaggag gagcgcatct tgcgctatgt gcagcagagc gtgagcctta 3060
acctgatgcg cgacggggta acgcccagcg tggcgctgga catgaccgcg cgcaacatgg 3120
aaccgggcat gtatgcctca aaccggccgt ttatcaatcg cctaatggac tacttgcatc 3180
gcgcggccgc cgtgaacccc gagtatttca ccaatgccat cttgaacccg cactggctac 3240
cgccccctgg tttctacacc gggggatttg aggtgcccga gggtaacgat ggattcctct 3300
gggacgacat agacgacagc gtgttttccc cgcaaccgca gaccctgcta gagttgcaac 3360
agcgcgagca ggcagaggcg gcgctgcgaa aggaaagctt ccgcaggcca agcagcttgt 3420
ccgatctagg cgctgcggcc ccgcggtcag atgcgagtag cccatttcca agcttgatag 3480
ggtcttttac cagcactcgc accacccgcc cgcgcctgct gggcgaggag gagtacctaa 3540
acaactcgct gctgcagccg cagcgcgaaa agaacctgcc tccggcattt cccaacaacg 3600
ggatagagag cctagtggac aagatgagta gatggaagac gtatgcgcag gagcacaggg 3660
atgtgcccgg cccgcgcccg cccacccgtc gtcaaaggca cgaccgtcag cggggtctgg 3720
tgtgggagga cgatgactcg gcagacgaca gcagcgtcct ggatttggga gggagtggca 3780
acccgtttgc gcaccttcgc cccaggctgg ggagaatgtt ttaaaaaaaa aaaaaaaaag 3840
catgatgcaa aataaaaaac tcaccaaggc catggcaccg agcgttggtt ttcttgtatt 3900
ccccttagta tgcagcgcgc ggcgatgtat gaggaaggtc ctcctccctc ctacgagagc 3960
gtggtgagcg cggcgccagt ggcggcggcg ctgggttccc ccttcgatgc tcccctggac 4020
ccgccgtttg tgcctccgcg gtacctgcgg cctaccgggg ggagaaacag catccgttac 4080
tctgagttgg cacccctatt cgacaccacc cgtgtgtacc ttgtggacaa caagtcaacg 4140
gatgtggcat ccctgaacta ccagaacgac cacagcaact ttctaaccac ggtcattcaa 4200
aacaatgact acagcccggg ggaggcaagc acacagacca tcaatcttga cgaccgttcg 4260
cactggggcg gcgacctgaa aaccatcctg cataccaaca tgccaaatgt gaacgagttc 4320
atgtttacca ataagtttaa ggcgcgggtg atggtgtcgc gctcgcttac taaggacaaa 4380
caggtggagc tgaaatatga gtgggtggag ttcacgctgc ccgagggcaa ctactccgag 4440
accatgacca tagaccttat gaacaacgcg atcgtggagc actacttgaa agtgggcagg 4500
cagaacgggg ttctggaaag cgacatcggg gtaaagtttg acacccgcaa cttcagactg 4560
gggtttgacc cagtcactgg tcttgtcatg cctggggtat atacaaacga agccttccat 4620
ccagacatca ttttgctgcc aggatgcggg gtggacttca cccacagccg cctgagcaac 4680
ttgttgggca tccgcaagcg gcaacccttc caggagggct ttaggatcac ctacgatgac 4740
ctggagggtg gtaacattcc cgcactgttg gatgtggacg cctaccaggc aagcttaaaa 4800
gatgacaccg aacagggcgg ggatggcgca ggcggcggca acaacagtgg cagcggcgcg 4860
gaagagaact ccaacgcggc agccgcggca atgcagccgg tggaggacat gaacgatcat 4920
gccattcgcg gcgacacctt tgccacacgg gcggaggaga agcgcgctga ggccgaggca 4980
gcggcagaag ctgccgcccc cgctgcgcaa cccgaggtcg agaagcctca gaagaaaccg 5040
gtgatcaaac ccctgacaga ggacagcaag aaacgcagtt acaacctaat aagcaatgac 5100
agcaccttca cccagtaccg cagctggtac cttgcataca actacggcga ccctcagacc 5160
gggatccgct catggaccct cctttgcact cctgacgtaa cctgcggctc ggagcaggtc 5220
tactggtcgt tgccagacat gatgcaagac cccgtgacct tccgctccac gagccagatc 5280
agcaactttc cggtggtggg cgccgagctg ttgcccgtgc actccaagag cttctacaac 5340
gaccaggccg tctactccca gctcatccgc cagtttacct ctctgaccca cgtgttcaat 5400
cgctttcccg agaaccagat tttggcgcgc ccgccagccc ccaccatcac caccgtcagt 5460
gaaaacgttc ctgctctcac agatcacggg acgctaccgc tgcgcaacag catcggagga 5520
gtccagcgag tgaccattac tgacgccaga cgccgcacct gcccctacgt ttacaaggcc 5580
ctgggcatag tctcgccgcg cgtcctatcg agccgcactt tttgagcaaa catgtccatc 5640
cttatatcgc ccagcaataa cacaggctgg ggcctgcgct tcccaagcaa gatgtttggc 5700
ggggcaaaga agcgctccga ccaacaccca gtgcgcgtgc gcgggcacta ccgcgcgccc 5760
tggggcgcgc acaaacgcgg ccgcactggg cgcaccaccg tcgatgacgc cattgacgcg 5820
gtggtggagg aggcgcgcaa ctacacgccc acgccgccac cagtgtccac agtggacgcg 5880
gccattcaga ccgtggtgcg cggagcccgg cgttatgcta aaatgaagag acggcggagg 5940
cgcgtagcac gtcgccaccg ccgccgaccc ggcactgccg cccaacgcgc ggcggcggcc 6000
ctgcttaacc gcgcacgtcg caccggccga cgggcggcca tgcgggccgc tcgaaggctg 6060
gccgcgggta ttgtcactgt gccccccagg tccaggcgac gagcggccgc cgcagcagcc 6120
gcggccatta gtgctatgac tcagggtcgc aggggcaacg tgtactgggt gcgcgactcg 6180
gttagcggcc tgcgcgtgcc cgtgcgcacc cgccccccgc gcaactagat tgcaagaaaa 6240
aactacttag actcgtactg ttgtatgtat ccagcggcgg cggcgcgcaa cgaagctatg 6300
tccaagcgca aaatcaaaga agagatgctc caggtcatcg cgccggagat ctatggcccc 6360
ccgaagaagg aagagcagga ttacaagccc cgaaagctaa agcgggtcaa aaagaaaaag 6420
aaagatgatg atgatgatga acttgacgac gaggtggaac tgctgcacgc aaccgcgccc 6480
aggcggcggg tacagtggaa aggtcgacgc gtaagacgtg ttttgcgacc cggcaccacc 6540
gtagttttta cgcccggtga gcgctccacc cgcacctaca agcgcgtgta tgatgaggtg 6600
tacggcgacg aggacctgct tgagcaggcc aacgagcgcc tcggggagtt tgcctacgga 6660
aagcggcata aggacatgtt ggcgttgccg ctggacgagg gcaacccaac acctagccta 6720
aagcccgtga cactgcagca ggtgctgccc acgcttgcac cgtccgaaga aaagcgcggc 6780
ctaaagcgcg agtctggtga cttggcaccc accgtgcagc tgatggtacc caagcgccag 6840
cgactggaag atgtcttgga aaaaatgacc gtggagcctg ggctggagcc cgaggtccgc 6900
gtgcggccaa tcaagcaggt ggcaccggga ctgggcgtgc agaccgtgga cgttcagata 6960
cccaccacca gtagcactag tattgccact gccacagagg gcatggagac acaaacgtcc 7020
ccggttgcct cggcggtggc agatgccgcg gtgcaggcgg ccgctgcggc cgcgtccaaa 7080
acctctacgg aggtgcaaac ggacccgtgg atgtttcgcg tttcagcccc ccggcgcccg 7140
cgccgttcca ggaagtacgg caccgccagc gcactactgc ccgaatatgc cctacatcct 7200
tccatcgcgc ctacccccgg ctatcgtggc tacacctacc gccccagaag acgagcgact 7260
acccgacgcc gaaccaccac tggaacccgc cgccgccgtc gccgtcgcca gcccgtgctg 7320
gccccgattt ccgtgcgcag ggtggctcgc gaaggaggca ggaccctggt gctgccaaca 7380
gcgcgctacc accccagcat cgtttaaaag ccggtctttg tggttcttgc agatatggcc 7440
ctcacctgcc gcctccgttt cccggtgccg ggattccgag gaagaatgca ccgtaggagg 7500
ggcatggccg gccacggcct gacgggcggc atgcgtcgtg cgcaccaccg gcggcggcgc 7560
gcgtcgcacc gtcgcatgcg cggcggtatc ctgcccctcc ttattccact gatcgccgcg 7620
gcgattggcg ccgtgcccgg aattgcatcc gtggccttgc aggcgcagag acactgatta 7680
aaaacaagtt gcatgtggaa aaatcaaaat aaaaagtctg gagtctcacg ctcgcttggt 7740
cctgtaacta ttttgtagaa tggaagacat caactttgcg tctctggccc cgcgacacgg 7800
ctcgcgcccg ttcatgggaa actggcaaga tatcggcacc agcaatatga gcggtggcgc 7860
cttcagctgg ggctcgctgt ggagcggcat taaaaatttc ggttccacca ttaagaacta 7920
tggcagcaag gcctggaaca gcagcacagg ccagatgctg agggacaagt tgaaagagca 7980
aaatttccaa caaaaggtgg tagatggcct ggcctctggc attagcgggg tggtggacct 8040
ggccaaccag gcagtgcaaa ataagattaa cagtaagctt gatccccgcc ctcccgtaga 8100
ggagcctcca ccggccgtgg agacagtgtc tccagagggg cgtggcgaaa agcgtccgcg 8160
gcccgacagg gaagaaactc tggtgacgca aatagatgag cctccctcgt acgaggaggc 8220
actaaagcaa ggcctgccca ccacccgtcc catcgcgccc atggctaccg gagtgctggg 8280
ccagcacaca cctgtaacgc tggacctgcc tccccccgct gacacccagc agaaacctgt 8340
gctgccaggg ccgtccgccg ttgttgtaac ccgccctagc cgcgcgtccc tgcgccgtgc 8400
cgccagcggt ccgcgatcga cctgcaggca tgcaagcttg gcgtaatcat ggtcatagct 8460
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 8520
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 8580
actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 8640
cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca ctgactcgct 8700
gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt 8760
atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc 8820
caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga 8880
gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata 8940
ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac 9000
cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg 9060
taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc 9120
cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag 9180
acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt 9240
aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt 9300
atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg 9360
atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac 9420
gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca 9480
gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac 9540
ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac 9600
ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt 9660
tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt 9720
accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt 9780
atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc 9840
cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa 9900
tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg 9960
tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat cccccatgtt 10020
gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta agttggccgc 10080
agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca tgccatccgt 10140
aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat agtgtatgcg 10200
gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac atagcagaac 10260
tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa ggatcttacc 10320
gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt cagcatcttt 10380
tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg 10440
aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat attattgaag 10500
catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt agaaaaataa 10560
acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct aagaaaccat 10620
tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc gtc 10673
<210> 104
<211> 22563
<212> DNA
<213> 人工
<220>
<223> 质粒pXba
<400> 104
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360
tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt cgagctcggt acccggggat 420
ccttctagac cgtgcaaaag gagagcctgt aagcgggcac tcttccgtgg tctggtggat 480
aaattcgcaa gggtatcatg gcggacgacc ggggttcgaa ccccggatcc ggccgtccgc 540
cgtgatccat gcggttaccg cccgcgtgtc gaacccaggt gtgcgacgtc agacaacggg 600
ggagcgctcc ttttggcttc cttccaggcg cggcggctgc tgcgctagct tttttggcca 660
ctggccgcgc gcggcgtaag cggttaggct ggaaagcgaa agcattaagt ggctcgctcc 720
ctgtagccgg agggttattt tccaagggtt gagtcgcagg acccccggtt cgagtctcgg 780
gccggccgga ctgcggcgaa cgggggtttg cctccccgtc atgcaagacc ccgcttgcaa 840
attcctccgg aaacagggac gagccccttt tttgcttttc ccagatgcat ccggtgctgc 900
ggcagatgcg cccccctcct cagcagcggc aagagcaaga gcagcggcag acatgcaggg 960
caccctcccc ttctcctacc gcgtcaggag gggcaacatc cgcggctgac gcggcggcag 1020
atggtgatta cgaacccccg cggcgccggg cccggcacta cctggacttg gaggagggcg 1080
agggcctggc gcggctagga gcgccctctc ctgagcgaca cccaagggtg cagctgaagc 1140
gtgacacgcg cgaggcgtac gtgccgcggc agaacctgtt tcgcgaccgc gagggagagg 1200
agcccgagga gatgcgggat cgaaagttcc acgcagggcg cgagttgcgg catggcctga 1260
accgcgagcg gttgctgcgc gaggaggact ttgagcccga cgcgcggacc gggattagtc 1320
ccgcgcgcgc acacgtggcg gccgccgacc tggtaaccgc gtacgagcag acggtgaacc 1380
aggagattaa ctttcaaaaa agctttaaca accacgtgcg cacgcttgtg gcgcgcgagg 1440
aggtggctat aggactgatg catctgtggg actttgtaag cgcgctggag caaaacccaa 1500
atagcaagcc gctcatggcg cagctgttcc ttatagtgca gcacagcagg gacaacgagg 1560
cattcaggga tgcgctgcta aacatagtag agcccgaggg ccgctggctg ctcgatttga 1620
taaacattct gcagagcata gtggtgcagg agcgcagctt gagcctggct gacaaggtgg 1680
ccgccattaa ctattccatg ctcagtctgg gcaagtttta cgcccgcaag atataccata 1740
ccccttacgt tcccatagac aaggaggtaa agatcgaggg gttctacatg cgcatggcgt 1800
tgaaggtgct taccttgagc gacgacctgg gcgtttatcg caacgagcgc atccacaagg 1860
ccgtgagcgt gagccggcgg cgcgagctca gcgaccgcga gctgatgcac agcctgcaaa 1920
gggccctggc tggcacgggc agcggcgata gagaggccga gtcctacttt gacgcgggcg 1980
ctgacctgcg ctgggcccca agccgacgcg ccctggaggc agctggggcc ggacctgggc 2040
tggcggtggc acccgcgcgc gctggcaacg tcggcggcgt ggaggaatat gacgaggacg 2100
atgagtacga gccagaggac ggcgagtact aagcggtgat gtttctgatc agatgatgca 2160
agacgcaacg gacccggcgg tgcgggcggc gctgcagagc cagccgtccg gccttaactc 2220
cacggacgac tggcgccagg tcatggaccg catcatgtcg ctgactgcgc gtaaccctga 2280
cgcgttccgg cagcagccgc aggccaaccg gctctccgca attctggaag cggtggtccc 2340
ggcgcgcgca aaccccacgc acgagaaggt gctggcgatc gtaaacgcgc tggccgaaaa 2400
cagggccatc cggcccgatg aggccggcct ggtctacgac gcgctgcttc agcgcgtggc 2460
tcgttacaac agcggcaacg tgcagaccaa cctggaccgg ctggtggggg atgtgcgcga 2520
ggccgtggcg cagcgtgagc gcgcgcagca gcagggcaac ctgggctcca tggttgcact 2580
aaacgccttc ctgagtacac agcccgccaa cgtgccgcgg ggacaggagg actacaccaa 2640
ctttgtgagc gcactgcggc taatggtgac tgagacaccg caaagtgagg tgtaccagtc 2700
cgggccagac tattttttcc agaccagtag acaaggcctg cagaccgtaa acctgagcca 2760
ggctttcaag aacttgcagg ggctgtgggg ggtgcgggct cccacaggcg accgcgcgac 2820
cgtgtctagc ttgctgacgc ccaactcgcg cctgttgctg ctgctaatag cgcccttcac 2880
ggacagtggc agcgtgtccc gggacacata cctaggtcac ttgctgacac tgtaccgcga 2940
ggccataggt caggcgcatg tggacgagca tactttccag gagattacaa gtgtcagccg 3000
cgcgctgggg caggaggaca cgggcagcct ggaggcaacc ctgaactacc tgctgaccaa 3060
ccggcggcag aagatcccct cgttgcacag tttaaacagc gaggaggagc gcatcttgcg 3120
ctatgtgcag cagagcgtga gccttaacct gatgcgcgac ggggtaacgc ccagcgtggc 3180
gctggacatg accgcgcgca acatggaacc gggcatgtat gcctcaaacc ggccgtttat 3240
caatcgccta atggactact tgcatcgcgc ggccgccgtg aaccccgagt atttcaccaa 3300
tgccatcttg aacccgcact ggctaccgcc ccctggtttc tacaccgggg gatttgaggt 3360
gcccgagggt aacgatggat tcctctggga cgacatagac gacagcgtgt tttccccgca 3420
accgcagacc ctgctagagt tgcaacagcg cgagcaggca gaggcggcgc tgcgaaagga 3480
aagcttccgc aggccaagca gcttgtccga tctaggcgct gcggccccgc ggtcagatgc 3540
gagtagccca tttccaagct tgatagggtc ttttaccagc actcgcacca cccgcccgcg 3600
cctgctgggc gaggaggagt acctaaacaa ctcgctgctg cagccgcagc gcgaaaagaa 3660
cctgcctccg gcatttccca acaacgggat agagagccta gtggacaaga tgagtagatg 3720
gaagacgtat gcgcaggagc acagggatgt gcccggcccg cgcccgccca cccgtcgtca 3780
aaggcacgac cgtcagcggg gtctggtgtg ggaggacgat gactcggcag acgacagcag 3840
cgtcctggat ttgggaggga gtggcaaccc gtttgcgcac cttcgcccca ggctggggag 3900
aatgttttaa aaaaaaaaaa aaaaagcatg atgcaaaata aaaaactcac caaggccatg 3960
gcaccgagcg ttggttttct tgtattcccc ttagtatgca gcgcgcggcg atgtatgagg 4020
aaggtcctcc tccctcctac gagagcgtgg tgagcgcggc gccagtggcg gcggcgctgg 4080
gttccccctt cgatgctccc ctggacccgc cgtttgtgcc tccgcggtac ctgcggccta 4140
ccggggggag aaacagcatc cgttactctg agttggcacc cctattcgac accacccgtg 4200
tgtaccttgt ggacaacaag tcaacggatg tggcatccct gaactaccag aacgaccaca 4260
gcaactttct aaccacggtc attcaaaaca atgactacag cccgggggag gcaagcacac 4320
agaccatcaa tcttgacgac cgttcgcact ggggcggcga cctgaaaacc atcctgcata 4380
ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa gtttaaggcg cgggtgatgg 4440
tgtcgcgctc gcttactaag gacaaacagg tggagctgaa atatgagtgg gtggagttca 4500
cgctgcccga gggcaactac tccgagacca tgaccataga ccttatgaac aacgcgatcg 4560
tggagcacta cttgaaagtg ggcaggcaga acggggttct ggaaagcgac atcggggtaa 4620
agtttgacac ccgcaacttc agactggggt ttgacccagt cactggtctt gtcatgcctg 4680
gggtatatac aaacgaagcc ttccatccag acatcatttt gctgccagga tgcggggtgg 4740
acttcaccca cagccgcctg agcaacttgt tgggcatccg caagcggcaa cccttccagg 4800
agggctttag gatcacctac gatgacctgg agggtggtaa cattcccgca ctgttggatg 4860
tggacgccta ccaggcaagc ttaaaagatg acaccgaaca gggcggggat ggcgcaggcg 4920
gcggcaacaa cagtggcagc ggcgcggaag agaactccaa cgcggcagcc gcggcaatgc 4980
agccggtgga ggacatgaac gatcatgcca ttcgcggcga cacctttgcc acacgggcgg 5040
aggagaagcg cgctgaggcc gaggcagcgg cagaagctgc cgcccccgct gcgcaacccg 5100
aggtcgagaa gcctcagaag aaaccggtga tcaaacccct gacagaggac agcaagaaac 5160
gcagttacaa cctaataagc aatgacagca ccttcaccca gtaccgcagc tggtaccttg 5220
catacaacta cggcgaccct cagaccggga tccgctcatg gaccctcctt tgcactcctg 5280
acgtaacctg cggctcggag caggtctact ggtcgttgcc agacatgatg caagaccccg 5340
tgaccttccg ctccacgagc cagatcagca actttccggt ggtgggcgcc gagctgttgc 5400
ccgtgcactc caagagcttc tacaacgacc aggccgtcta ctcccagctc atccgccagt 5460
ttacctctct gacccacgtg ttcaatcgct ttcccgagaa ccagattttg gcgcgcccgc 5520
cagcccccac catcaccacc gtcagtgaaa acgttcctgc tctcacagat cacgggacgc 5580
taccgctgcg caacagcatc ggaggagtcc agcgagtgac cattactgac gccagacgcc 5640
gcacctgccc ctacgtttac aaggccctgg gcatagtctc gccgcgcgtc ctatcgagcc 5700
gcactttttg agcaaacatg tccatcctta tatcgcccag caataacaca ggctggggcc 5760
tgcgcttccc aagcaagatg tttggcgggg caaagaagcg ctccgaccaa cacccagtgc 5820
gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa acgcggccgc actgggcgca 5880
ccaccgtcga tgacgccatt gacgcggtgg tggaggaggc gcgcaactac acgcccacgc 5940
cgccaccagt gtccacagtg gacgcggcca ttcagaccgt ggtgcgcgga gcccggcgtt 6000
atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg ccaccgccgc cgacccggca 6060
ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc acgtcgcacc ggccgacggg 6120
cggccatgcg ggccgctcga aggctggccg cgggtattgt cactgtgccc cccaggtcca 6180
ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc tatgactcag ggtcgcaggg 6240
gcaacgtgta ctgggtgcgc gactcggtta gcggcctgcg cgtgcccgtg cgcacccgcc 6300
ccccgcgcaa ctagattgca agaaaaaact acttagactc gtactgttgt atgtatccag 6360
cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat caaagaagag atgctccagg 6420
tcatcgcgcc ggagatctat ggccccccga agaaggaaga gcaggattac aagccccgaa 6480
agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga tgatgaactt gacgacgagg 6540
tggaactgct gcacgcaacc gcgcccaggc ggcgggtaca gtggaaaggt cgacgcgtaa 6600
gacgtgtttt gcgacccggc accaccgtag tttttacgcc cggtgagcgc tccacccgca 6660
cctacaagcg cgtgtatgat gaggtgtacg gcgacgagga cctgcttgag caggccaacg 6720
agcgcctcgg ggagtttgcc tacggaaagc ggcataagga catgttggcg ttgccgctgg 6780
acgagggcaa cccaacacct agcctaaagc ccgtgacact gcagcaggtg ctgcccacgc 6840
ttgcaccgtc cgaagaaaag cgcggcctaa agcgcgagtc tggtgacttg gcacccaccg 6900
tgcagctgat ggtacccaag cgccagcgac tggaagatgt cttggaaaaa atgaccgtgg 6960
agcctgggct ggagcccgag gtccgcgtgc ggccaatcaa gcaggtggca ccgggactgg 7020
gcgtgcagac cgtggacgtt cagataccca ccaccagtag cactagtatt gccactgcca 7080
cagagggcat ggagacacaa acgtccccgg ttgcctcggc ggtggcagat gccgcggtgc 7140
aggcggccgc tgcggccgcg tccaaaacct ctacggaggt gcaaacggac ccgtggatgt 7200
ttcgcgtttc agccccccgg cgcccgcgcc gttccaggaa gtacggcacc gccagcgcac 7260
tactgcccga atatgcccta catccttcca tcgcgcctac ccccggctat cgtggctaca 7320
cctaccgccc cagaagacga gcgactaccc gacgccgaac caccactgga acccgccgcc 7380
gccgtcgccg tcgccagccc gtgctggccc cgatttccgt gcgcagggtg gctcgcgaag 7440
gaggcaggac cctggtgctg ccaacagcgc gctaccaccc cagcatcgtt taaaagccgg 7500
tctttgtggt tcttgcagat atggccctca cctgccgcct ccgtttcccg gtgccgggat 7560
tccgaggaag aatgcaccgt aggaggggca tggccggcca cggcctgacg ggcggcatgc 7620
gtcgtgcgca ccaccggcgg cggcgcgcgt cgcaccgtcg catgcgcggc ggtatcctgc 7680
ccctccttat tccactgatc gccgcggcga ttggcgccgt gcccggaatt gcatccgtgg 7740
ccttgcaggc gcagagacac tgattaaaaa caagttgcat gtggaaaaat caaaataaaa 7800
agtctggagt ctcacgctcg cttggtcctg taactatttt gtagaatgga agacatcaac 7860
tttgcgtctc tggccccgcg acacggctcg cgcccgttca tgggaaactg gcaagatatc 7920
ggcaccagca atatgagcgg tggcgccttc agctggggct cgctgtggag cggcattaaa 7980
aatttcggtt ccaccattaa gaactatggc agcaaggcct ggaacagcag cacaggccag 8040
atgctgaggg acaagttgaa agagcaaaat ttccaacaaa aggtggtaga tggcctggcc 8100
tctggcatta gcggggtggt ggacctggcc aaccaggcag tgcaaaataa gattaacagt 8160
aagcttgatc cccgccctcc cgtagaggag cctccaccgg ccgtggagac agtgtctcca 8220
gaggggcgtg gcgaaaagcg tccgcggccc gacagggaag aaactctggt gacgcaaata 8280
gatgagcctc cctcgtacga ggaggcacta aagcaaggcc tgcccaccac ccgtcccatc 8340
gcgcccatgg ctaccggagt gctgggccag cacacacctg taacgctgga cctgcctccc 8400
cccgctgaca cccagcagaa acctgtgctg ccagggccgt ccgccgttgt tgtaacccgc 8460
cctagccgcg cgtccctgcg ccgtgccgcc agcggtccgc gatcgatgcg gcccgtagcc 8520
agtggcaact ggcaaagcac actgaacagc atcgtgggtc tgggggtgca atccctgaag 8580
cgccgacgat gcttctaaat agctaacgtg tcgtatgtgt catgtatgcg tccatgtcgc 8640
cgccagagga gctgctgagc cgccgtgcgc ccgctttcca agatggctac cccttcgatg 8700
atgccgcagt ggtcttacat gcacatctcg ggccaggacg cctcggagta cctgagcccc 8760
gggctggtgc agtttgcccg cgccaccgag acgtacttca gcctgaataa caagtttaga 8820
aaccccacgg tggcacctac gcacgacgta accacagacc ggtcccagcg tttgacgctg 8880
cggttcatcc ctgtggaccg cgaggatacc gcgtactcgt acaaagcgcg gttcaccctg 8940
gctgtgggtg acaaccgtgt gcttgatatg gcttccacgt actttgacat ccgcggcgtg 9000
ctggacaggg ggcctacttt taagccctac tccggcactg cctacaacgc tctagctccc 9060
aagggcgctc ctaactcctg tgagtgggaa caaaccgaag atagcggccg ggcagttgcc 9120
gaggatgaag aagaggaaga tgaagatgaa gaagaggaag aagaagagca aaacgctcga 9180
gatcaggcta ctaagaaaac acatgtctat gcccaggctc ctttgtctgg agaaacaatt 9240
acaaaaagcg ggctacaaat aggatcagac aatgcagaaa cacaagctaa acctgtatac 9300
gcagatcctt cctatcaacc agaacctcaa attggcgaat ctcagtggaa cgaagctgat 9360
gctaatgcgg caggagggag agtgcttaaa aaaacaactc ccatgaaacc atgctatgga 9420
tcttatgcca ggcctacaaa tccttttggt ggtcaatccg ttctggttcc ggatgaaaaa 9480
ggggtgcctc ttccaaaggt tgacttgcaa ttcttctcaa atactacctc tttgaacgac 9540
cggcaaggca atgctactaa accaaaagtg gttttgtaca gtgaagatgt aaatatggaa 9600
accccagaca cacatctgtc ttacaaacct ggaaaaggtg atgaaaattc taaagctatg 9660
ttgggtcaac aatctatgcc aaacagaccc aattacattg ctttcaggga caattttatt 9720
ggcctaatgt attataacag cactggcaac atgggtgttc ttgctggtca ggcatcgcag 9780
ctaaatgccg tggtagattt gcaagacaga aacacagagc tgtcctatca actcttgctt 9840
gattccatag gtgatagaac cagatatttt tctatgtgga atcaggctgt agacagctat 9900
gatccagatg ttagaatcat tgaaaaccat ggaactgagg atgaattgcc aaattattgt 9960
tttcctcttg ggggtattgg ggtaactgac acctatcaag ctattaaggc taatggcaat 10020
ggctcaggcg ataatggaga tactacatgg acaaaagatg aaacttttgc aacacgtaat 10080
gaaataggag tgggtaacaa ctttgccatg gaaattaacc taaatgccaa cctatggaga 10140
aatttccttt actccaatat tgcgctgtac ctgccagaca agctaaaata caaccccacc 10200
aatgtggaaa tatctgacaa ccccaacacc tacgactaca tgaacaagcg agtggtggct 10260
cccgggcttg tagactgcta cattaacctt ggggcgcgct ggtctctgga ctacatggac 10320
aacgttaatc cctttaacca ccaccgcaat gcgggcctcc gttatcgctc catgttgttg 10380
ggaaacggcc gctacgtgcc ctttcacatt caggtgcccc aaaagttttt tgccattaaa 10440
aacctcctcc tcctgccagg ctcatataca tatgaatgga acttcaggaa ggatgttaac 10500
atggttctgc agagctctct gggaaacgat cttagagttg acggggctag cattaagttt 10560
gacagcattt gtctttacgc caccttcttc cccatggccc acaacacggc ctccacgctg 10620
gaagccatgc tcagaaatga caccaacgac cagtccttta atgactacct ttccgccgcc 10680
aacatgctat accccatacc cgccaacgcc accaacgtgc ccatctccat cccatcgcgc 10740
aactgggcag catttcgcgg ttgggccttc acacgcttga agacaaagga aaccccttcc 10800
ctgggatcag gctacgaccc ttactacacc tactctggct ccataccata ccttgacgga 10860
accttctatc ttaatcacac ctttaagaag gtggccatta cctttgactc ttctgttagc 10920
tggccgggca acgaccgcct gcttactccc aatgagtttg agattaaacg ctcagttgac 10980
ggggagggct acaacgtagc tcagtgcaac atgaccaagg actggttcct ggtgcagatg 11040
ttggccaact acaatattgg ctaccagggc ttctacattc cagaaagcta caaggaccgc 11100
atgtactcgt tcttcagaaa cttccagccc atgagccggc aagtggttga cgatactaaa 11160
tacaaggagt atcagcaggt tggaattctt caccagcata acaactcagg attcgtaggc 11220
tacctcgctc ccaccatgcg cgagggacag gcttaccccg ccaacgtgcc ctacccacta 11280
ataggcaaaa ccgcggttga cagtattacc cagaaaaagt ttctttgcga tcgcaccctt 11340
tggcgcatcc cattctccag taactttatg tccatgggcg cactcacaga cctgggccaa 11400
aaccttctct acgccaactc cgcccacgcg ctagacatga cttttgaggt ggatcccatg 11460
gacgagccca cccttcttta tgttttgttt gaagtctttg acgtggtccg tgtgcaccag 11520
ccgcaccgcg gcgtcatcga gaccgtgtac ctgcgcacgc ccttctcggc cggcaacgcc 11580
acaacataaa agaagcaagc aacatcaaca acagctgccg ccatgggctc cagtgagcag 11640
gaactgaaag ccattgtcaa agatcttggt tgtgggccat attttttggg cacctatgac 11700
aagcgctttc caggctttgt ttctccacac aagctcgcct gcgccatagt caatacggcc 11760
ggtcgcgaga ctgggggcgt acactggatg gcctttgcct ggaacccgcg ctcaaaaaca 11820
tgctacctct ttgagccctt tggcttttct gaccaacgac tcaagcaggt ttaccagttt 11880
gagtacgagt cactcctgcg ccgtagcgcc attgcttctt cccccgaccg ctgtataacg 11940
ctggaaaagt ccacccaaag cgtgcagggg cccaactcgg ccgcctgtgg actattctgc 12000
tgcatgtttc tccacgcctt tgccaactgg ccccaaactc ccatggatca caaccccacc 12060
atgaacctta ttaccggggt acccaactcc atgcttaaca gtccccaggt acagcccacc 12120
ctgcgtcgca accaggaaca gctctacagc ttcctggagc gccactcgcc ctacttccgc 12180
agccacagtg cgcagattag gagcgccact tctttttgtc acttgaaaaa catgtaaaaa 12240
taatgtacta ggagacactt tcaataaagg caaatgtttt tatttgtaca ctctcgggtg 12300
attatttacc ccccaccctt gccgtctgcg ccgtttaaaa atcaaagggg ttctgccgcg 12360
catcgctatg cgccactggc agggacacgt tgcgatactg gtgtttagtg ctccacttaa 12420
actcaggcac aaccatccgc ggcagctcgg tgaagttttc actccacagg ctgcgcacca 12480
tcaccaacgc gtttagcagg tcgggcgccg atatcttgaa gtcgcagttg gggcctccgc 12540
cctgcgcgcg cgagttgcga tacacagggt tgcagcactg gaacactatc agcgccgggt 12600
ggtgcacgct ggccagcacg ctcttgtcgg agatcagatc cgcgtccagg tcctccgcgt 12660
tgctcagggc gaacggagtc aactttggta gctgccttcc caaaaagggt gcatgcccag 12720
gctttgagtt gcactcgcac cgtagtggca tcagaaggtg accgtgcccg gtctgggcgt 12780
taggatacag cgcctgcatg aaagccttga tctgcttaaa agccacctga gcctttgcgc 12840
cttcagagaa gaacatgccg caagacttgc cggaaaactg attggccgga caggccgcgt 12900
catgcacgca gcaccttgcg tcggtgttgg agatctgcac cacatttcgg ccccaccggt 12960
tcttcacgat cttggccttg ctagactgct ccttcagcgc gcgctgcccg ttttcgctcg 13020
tcacatccat ttcaatcacg tgctccttat ttatcataat gctcccgtgt agacacttaa 13080
gctcgccttc gatctcagcg cagcggtgca gccacaacgc gcagcccgtg ggctcgtggt 13140
gcttgtaggt tacctctgca aacgactgca ggtacgcctg caggaatcgc cccatcatcg 13200
tcacaaaggt cttgttgctg gtgaaggtca gctgcaaccc gcggtgctcc tcgtttagcc 13260
aggtcttgca tacggccgcc agagcttcca cttggtcagg cagtagcttg aagtttgcct 13320
ttagatcgtt atccacgtgg tacttgtcca tcaacgcgcg cgcagcctcc atgcccttct 13380
cccacgcaga cacgatcggc aggctcagcg ggtttatcac cgtgctttca ctttccgctt 13440
cactggactc ttccttttcc tcttgcgtcc gcataccccg cgccactggg tcgtcttcat 13500
tcagccgccg caccgtgcgc ttacctccct tgccgtgctt gattagcacc ggtgggttgc 13560
tgaaacccac catttgtagc gccacatctt ctctttcttc ctcgctgtcc acgatcacct 13620
ctggggatgg cgggcgctcg ggcttgggag aggggcgctt ctttttcttt ttggacgcaa 13680
tggccaaatc cgccgtcgag gtcgatggcc gcgggctggg tgtgcgcggc accagcgcat 13740
cttgtgacga gtcttcttcg tcctcggact cgagacgccg cctcagccgc ttttttgggg 13800
gcgcgcgggg aggcggcggc gacggcgacg gggacgacac gtcctccatg gttggtggac 13860
gtcgcgccgc accgcgtccg cgctcggggg tggtttcgcg ctgctcctct tcccgactgg 13920
ccatttcctt ctcctatagg cagaaaaaga tcatggagtc agtcgagaag gaggacagcc 13980
taaccgcccc ctttgagttc gccaccaccg cctccaccga tgccgccaac gcgcctacca 14040
ccttccccgt cgaggcaccc ccgcttgagg aggaggaagt gattatcgag caggacccag 14100
gttttgtaag cgaagacgac gaggatcgct cagtaccaac agaggataaa aagcaagacc 14160
aggacgacgc agaggcaaac gaggaacaag tcgggcgggg ggaccaaagg catggcgact 14220
acctagatgt gggagacgac gtgctgttga agcatctgca gcgccagtgc gccattatct 14280
gcgacgcgtt gcaagagcgc agcgatgtgc ccctcgccat agcggatgtc agccttgcct 14340
acgaacgcca cctgttctca ccgcgcgtac cccccaaacg ccaagaaaac ggcacatgcg 14400
agcccaaccc gcgcctcaac ttctaccccg tatttgccgt gccagaggtg cttgccacct 14460
atcacatctt tttccaaaac tgcaagatac ccctatcctg ccgtgccaac cgcagccgag 14520
cggacaagca gctggccttg cggcagggcg ctgtcatacc tgatatcgcc tcgctcgacg 14580
aagtgccaaa aatctttgag ggtcttggac gcgacgagaa acgcgcggca aacgctctgc 14640
aacaagaaaa cagcgaaaat gaaagtcact gtggagtgct ggtggaactt gagggtgaca 14700
acgcgcgcct agccgtgctg aaacgcagca tcgaggtcac ccactttgcc tacccggcac 14760
ttaacctacc ccccaaggtt atgagcacag tcatgagcga gctgatcgtg cgccgtgcac 14820
gacccctgga gagggatgca aacttgcaag aacaaaccga ggagggccta cccgcagttg 14880
gcgatgagca gctggcgcgc tggcttgaga cgcgcgagcc tgccgacttg gaggagcgac 14940
gcaagctaat gatggccgca gtgcttgtta ccgtggagct tgagtgcatg cagcggttct 15000
ttgctgaccc ggagatgcag cgcaagctag aggaaacgtt gcactacacc tttcgccagg 15060
gctacgtgcg ccaggcctgc aaaatttcca acgtggagct ctgcaacctg gtctcctacc 15120
ttggaatttt gcacgaaaac cgcctcgggc aaaacgtgct tcattccacg ctcaagggcg 15180
aggcgcgccg cgactacgtc cgcgactgcg tttacttatt tctgtgctac acctggcaaa 15240
cggccatggg cgtgtggcag caatgcctgg aggagcgcaa cctaaaggag ctgcagaagc 15300
tgctaaagca aaacttgaag gacctatgga cggccttcaa cgagcgctcc gtggccgcgc 15360
acctggcgga cattatcttc cccgaacgcc tgcttaaaac cctgcaacag ggtctgccag 15420
acttcaccag tcaaagcatg ttgcaaaact ttaggaactt tatcctagag cgttcaggaa 15480
ttctgcccgc cacctgctgt gcgcttccta gcgactttgt gcccattaag taccgtgaat 15540
gccctccgcc gctttggggt cactgctacc ttctgcagct agccaactac cttgcctacc 15600
actccgacat catggaagac gtgagcggtg acggcctact ggagtgtcac tgtcgctgca 15660
acctatgcac cccgcaccgc tccctggtct gcaattcgca actgcttagc gaaagtcaaa 15720
ttatcggtac ctttgagctg cagggtccct cgcctgacga aaagtccgcg gctccggggt 15780
tgaaactcac tccggggctg tggacgtcgg cttaccttcg caaatttgta cctgaggact 15840
accacgccca cgagattagg ttctacgaag accaatcccg cccgccaaat gcggagctta 15900
ccgcctgcgt cattacccag ggccacatcc ttggccaatt gcaagccatc aacaaagccc 15960
gccaagagtt tctgctacga aagggacggg gggtttacct ggacccccag tccggcgagg 16020
agctcaaccc aatccccccg ccgccgcagc cctatcagca gccgcgggcc cttgcttccc 16080
aggatggcac ccaaaaagaa gctgcagctg ccgccgccgc cacccacgga cgaggaggaa 16140
tactgggaca gtcaggcaga ggaggttttg gacgaggagg aggagatgat ggaagactgg 16200
gacagcctag acgaagcttc cgaggccgaa gaggtgtcag acgaaacacc gtcaccctcg 16260
gtcgcattcc cctcgccggc gccccagaaa ttggcaaccg ttcccagcat cgctacaacc 16320
tccgctcctc aggcgccgcc ggcactgcct gttcgccgac ccaaccgtag atgggacacc 16380
actggaacca gggccggtaa gtctaagcag ccgccgccgt tagcccaaga gcaacaacag 16440
cgccaaggct accgctcgtg gcgcgggcac aagaacgcca tagttgcttg cttgcaagac 16500
tgtgggggca acatctcctt cgcccgccgc tttcttctct accatcacgg cgtggccttc 16560
ccccgtaaca tcctgcatta ctaccgtcat ctctacagcc cctactgcac cggcggcagc 16620
ggcagcggca gcaacagcag cggtcacaca gaagcaaagg cgaccggata gcaagactct 16680
gacaaagccc aagaaatcca cagcggcggc agcagcagga ggaggagcgc tgcgtctggc 16740
gcccaacgaa cccgtatcga cccgcgagct tagaaatagg atttttccca ctctgtatgc 16800
tatatttcaa caaagcaggg gccaagaaca agagctgaaa ataaaaaaca ggtctctgcg 16860
ctccctcacc cgcagctgcc tgtatcacaa aagcgaagat cagcttcggc gcacgctgga 16920
agacgcggag gctctcttca gcaaatactg cgcgctgact cttaaggact agtttcgcgc 16980
cctttctcaa atttaagcgc gaaaactacg tcatctccag cggccacacc cggcgccagc 17040
acctgtcgtc agcgccatta tgagcaagga aattcccacg ccctacatgt ggagttacca 17100
gccacaaatg ggacttgcgg ctggagctgc ccaagactac tcaacccgaa taaactacat 17160
gagcgcggga ccccacatga tatcccgggt caacggaatc cgcgcccacc gaaaccgaat 17220
tctcctcgaa caggcggcta ttaccaccac acctcgtaat aaccttaatc cccgtagttg 17280
gcccgctgcc ctggtgtacc aggaaagtcc cgctcccacc actgtggtac ttcccagaga 17340
cgcccaggcc gaagttcaga tgactaactc aggggcgcag cttgcgggcg gctttcgtca 17400
cagggtgcgg tcgcccgggc agggtataac tcacctgaaa atcagagggc gaggtattca 17460
gctcaacgac gagtcggtga gctcctctct tggtctccgt ccggacggga catttcagat 17520
cggcggcgct ggccgctctt catttacgcc ccgtcaggcg atcctaactc tgcagacctc 17580
gtcctcggag ccgcgctccg gaggcattgg aactctacaa tttattgagg agttcgtgcc 17640
ttcggtttac ttcaacccct tttctggacc tcccggccac tacccggacc agtttattcc 17700
caactttgac gcggtgaaag actcggcgga cggctacgac tgaatgacca gtggagaggc 17760
agagcgactg cgcctgacac acctcgacca ctgccgccgc cacaagtgct ttgcccgcgg 17820
ctccggtgag ttttgttact ttgaattgcc cgaagagcat atcgagggcc cggcgcacgg 17880
cgtccggctc accacccagg tagagcttac acgtagcctg attcgggagt ttaccaagcg 17940
ccccctgcta gtggagcggg agcggggtcc ctgtgttctg accgtggttt gcaactgtcc 18000
taaccctgga ttacatcaag atctttgttg tcatctctgt gctgagtata ataaatacag 18060
aaattagaat ctactggggc tcctgtcgcc atcctgtgaa cgccaccgtt tttacccacc 18120
caaagcagac caaagcaaac ctcacctccg gtttgcacaa gcgggccaat aagtacctta 18180
cctggtactt taacggctct tcatttgtaa tttacaacag tttccagcga gacgaagtaa 18240
gtttgccaca caaccttctc ggcttcaact acaccgtcaa gaaaaacacc accaccacca 18300
ccctcctcac ctgccgggaa cgtacgagtg cgtcaccggt tgctgcgccc acacctacag 18360
cctgagcgta accagacatt actcccattt ttccaaaaca ggaggtgagc tcaactcccg 18420
gaactcaggt caaaaaagca ttttgcgggg tgctgggatt ttttaattaa gtatatgagc 18480
aattcaagta actctacaag cttgtctaat ttttctggaa ttggggtcgg ggttatcctt 18540
actcttgtaa ttctgtttat tcttatacta gcacttctgt gccttagggt tgccgcctgc 18600
tgcacgcacg tttgtaccta ttgtcagctt tttaaacgct gggggcaaca tccaagatga 18660
ggtacatgat tttaggcttg ctcgcccttg cggcagtctg cagcgctgcc aaaaaggttg 18720
agtttaagga accagcttgc aatgttacat ttaaatcaga agctaatgaa tgcactactc 18780
ttataaaatg caccacagaa catgaaaagc ttattattcg ccacaaagac aaaattggca 18840
agtatgctgt atatgctatt tggcagccag gtgacactaa cgactataat gtcacagtct 18900
tccaaggtga aaatcgtaaa acttttatgt ataaatttcc attttatgaa atgtgcgata 18960
ttaccatgta catgagcaaa cagtacaagt tgtggccccc acaaaagtgt ttagagaaca 19020
ctggcacctt ttgttccacc gctctgctta ttacagcgct tgctttggta tgtaccttac 19080
tttatctcaa atacaaaagc agacgcagtt ttattgatga aaagaaaatg ccttgatttt 19140
ccgcttgctt gtattcccct ggacaattta ctctatgtgg gatatgctcc aggcgggcaa 19200
gattataccc acaaccttca aatcaaactt tcctggacgt tagcgcctga tttctgccag 19260
cgcctgcact gcaaatttga tcaaacccag cttcagcttg cctgctccag agatgaccgg 19320
ctcaaccatc gcgcccacaa cggactatcg caacaccact gctaccggac taacatctgc 19380
cctaaattta ccccaagttc atgcctttgt caatgactgg gcgagcttgg acatgtggtg 19440
gttttccata gcgcttatgt ttgtttgcct tattattatg tggcttattt gttgcctaaa 19500
gcgcagacgc gccagacccc ccatctatag gcctatcatt gtgctcaacc cacacaatga 19560
aaaaattcat agattggacg gtctgaaacc atgttctctt cttttacagt atgattaaat 19620
gagacatgat tcctcgagtt cttatattat tgacccttgt tgcgcttttc tgtgcgtgct 19680
ctacattggc cgcggtcgct cacatcgaag tagattgcat cccacctttc acagtttacc 19740
tgctttacgg atttgtcacc cttatcctca tctgcagcct cgtcactgta gtcatcgcct 19800
tcattcagtt cattgactgg gtttgtgtgc gcattgcgta cctcaggcac catccgcaat 19860
acagagacag gactatagct gatcttctca gaattcttta attatgaaac ggagtgtcat 19920
ttttgttttg ctgatttttt gcgccctacc tgtgctttgc tcccaaacct cagcgcctcc 19980
caaaagacat atttcctgca gattcactca aatatggaac attcccagct gctacaacaa 20040
acagagcgat ttgtcagaag cctggttata cgccatcatc tctgtcatgg ttttttgcag 20100
taccattttt gccctagcca tatatccata ccttgacatt ggctggaatg ccatagatgc 20160
catgaaccac cctactttcc cagtgcccgc tgtcatacca ctgcaacagg ttattgcccc 20220
aatcaatcag cctcgccccc cttctcccac ccccactgag attagctact ttaatttgac 20280
aggtggagat gactgaatct ctagagtcga cctgcaggca tgcaagcttg gcgtaatcat 20340
ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 20400
ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 20460
cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 20520
tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 20580
ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 20640
taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 20700
agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 20760
cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 20820
tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 20880
tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat 20940
gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 21000
acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 21060
acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 21120
cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 21180
gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 21240
gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 21300
agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 21360
ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 21420
ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 21480
atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 21540
tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 21600
gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 21660
ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 21720
caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 21780
cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 21840
cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 21900
cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 21960
agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 22020
tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 22080
agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 22140
atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 22200
ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 22260
cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 22320
caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 22380
attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 22440
agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtct 22500
aagaaaccat tattatcatg acattaacct ataaaaatag gcgtatcacg aggccctttc 22560
gtc 22563
<210> 105
<211> 8350
<212> DNA
<213> 人工
<220>
<223> 质粒psyx20-lacIq
<400> 105
cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 60
gaatggcgaa tgggacgcgc cctgtagcgg cgcattaagc gcggcgggtg tggtggttac 120
gcgcagcgtg accgctacac ttgccagcgc cctagcgccc gctcctttcg ctttcttccc 180
ttcctttctc gccacgttcg ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt 240
agggttccga tttagtgctt tacggcacct cgaccccaaa aaacttgatt agggtgatgg 300
ttcacgtagt gggccatcgc cctgatagac ggtttttcgc cctttgacgt tggagtccac 360
gttctttaat agtggactct tgttccaaac tggaacaaca ctcaacccta tctcggtcta 420
ttcttttgat ttataaggga ttttgccgat ttcggcctat tggttaaaaa atgagctgat 480
ttaacaaaaa tttaacgcga attttaacaa aattcgaccg atgcccttga gagccttcaa 540
cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac ttatgactgt 600
cttctttatc atgcaactcg taggacaggt gccggcagcg ctctgggtca ttttcggcga 660
ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg cttgcggtat tcggaatctt 720
gcacgccctc gctcaagcct tcgtcactgg tcccgccacc aaacgtttcg gcgagaagca 780
ggccattatc gccggcatgg cggccgacgc gctgggctac gtcttgctgg cgttcgcgac 840
gcgaggctgg atggccttcc ccattatgat tcttctcgct tccggcggca tcgggatgcc 900
cgcgttgcag gccatgctgt ccaggcaggt agatgacgac catcagggac agcttcaagg 960
atcgctcgcg gctcttacca gcctaacttc gatcattgga ccgctgatcg tcacggcgat 1020
ttatgccgcc tcggcgagca catggaacgg gttggcatgg attgtaggcg ccgccctata 1080
ccttgtctgc ctccccgcgt tgcgtcgcgg tgcatggagc cgggccacct cgacctgaat 1140
ggaagccggc ggcacctcgc taacggattc accactccgc agacccgcca taaaacgccc 1200
tgagaagccc gtgacgggct tttcttgtat tatgggtagt ttccttgcat gaatccataa 1260
aaggcgcctg tagtgccatt tacccccatt cactgccaga gccgtgagcg cagcgaactg 1320
aatgtcacga aaaagacagc gactcaggtg cctgatggtc ggagacaaaa ggaatattca 1380
gcgatttgcc cgagcttgcg agggtgctac ttaagccttt agggttttaa ggtctgtttt 1440
gtagaggagc aaacagcgtt tgcgacatcc ttttgtaata ctgcggaact gactaaagta 1500
gtgagttata cacagggctg ggatctattc tttttatctt tttttattct ttctttattc 1560
tataaattat aaccacttga atataaacaa aaaaaacaca caaaggtcta gcggaattta 1620
cagagggtct agcagaattt acaagttttc cagcaaaggt ctagcagaat ttacagatac 1680
ccacaactca aaggaaaagg actagtaatt atcattgact agcccatctc aattggtata 1740
gtgattaaaa tcacctagac caattgagat gtatgtctga attagttgtt ttcaaagcaa 1800
atgaactagc gattagtcgc tatgacttaa cggagcatga aaccaagcta attttatgct 1860
gtgtggcact actcaacccc acgattgaaa accctacaag gaaagaacgg acggtatcgt 1920
tcacttataa ccaatacgct cagatgatga acatcagtag ggaaaatgct tatggtgtat 1980
tagctaaagc aaccagagag ctgatgacga gaactgtgga aatcaggaat cctttggtta 2040
aaggctttga gattttccag tggacaaact atgccaagtt ctcaagcgaa aaattagaat 2100
tagtttttag tgaagagata ttgccttatc ttttccagtt aaaaaaattc ataaaatata 2160
atctggaaca tgttaagtct tttgaaaaca aatactctat gaggatttat gagtggttat 2220
taaaagaact aacacaaaag aaaactcaca aggcaaatat agagattagc cttgatgaat 2280
ttaagttcat gttaatgctt gaaaataact accatgagtt taaaaggctt aaccaatggg 2340
ttttgaaacc aataagtaaa gatttaaaca cttacagcaa tatgaaattg gtggttgata 2400
agcgaggccg cccgactgat acgttgattt tccaagttga actagataga caaatggatc 2460
tcgtaaccga acttgagaac aaccagataa aaatgaatgg tgacaaaata ccaacaacca 2520
ttacatcaga ttcctaccta cataacggac taagaaaaac actacacgat gctttaactg 2580
caaaaattca gctcaccagt tttgaggcaa aatttttgag tgacatgcaa agtaagtatg 2640
atctcaatgg ttcgttctca tggctcacgc aaaaacaacg aaccacacta gagaacatac 2700
tggctaaata cggaaggatc tgaggttctt atggctcttg tatctatcag tgaagcatca 2760
agactaacaa acaaaagtag aacaactgtt caccgttaca tatcaaaggg aaaactgtcc 2820
atatgcacag atgaaaacgg tgtaaaaaag atagatacat cagagctttt acgagttttt 2880
ggtgcattca aagctgttca ccatgaacag atcgacaatg taacagatga acagcatgta 2940
acacctaata gaacaggtga aaccagtaaa acaaagcaac tagaacatga aattgaacac 3000
ctgagacaac ttgttacagc tcaacagtca cacatagaca gcctgaaaca ggcgatgctg 3060
cttatcgaat caaagctgcc gacaacacgg gagccagtga cgcctcccgt ggggaaaaaa 3120
tcatggcaat tctggaagaa atagcgcttt cagccggcaa accggctgaa gccggatctg 3180
cgattctgat aacaaactag caacaccaga acagcccgtt tgcgggcagc aaaacccgta 3240
cttttggacg ttccggcggt tttttgtggc gagtggtgtt cgggcggtgc gcgattattg 3300
aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa 3360
taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccacctgacg tctaagaaac 3420
cattattatc atgacattaa cctataaaaa taggcgtatc acgaggccct ttcgtcttca 3480
agaattcgcg cgcgaaggcc aagcggcatg catttacgtt gacaccatcg aatggcgcaa 3540
aacctttcgc ggtatggcat gatagcgccc ggaagagagt caattcaggg tggtgaatgt 3600
gaaaccagta acgttatacg atgtcgcaga gtatgccggt gtctcttatc agaccgtttc 3660
ccgcgtggtg aaccaggcca gccacgtttc tgcgaaaacg cgggaaaaag tggaagcggc 3720
gatggcggag ctgaattaca ttcccaaccg cgtggcacaa caactggcgg gcaaacagtc 3780
gttgctgatt ggcgttgcca cctccagtct ggccctgcac gcgccgtcgc aaattgtcgc 3840
ggcgattaaa tctcgcgccg atcaactggg tgccagcgtg gtggtgtcga tggtagaacg 3900
aagcggcgtc gaagcctgta aagcggcggt gcacaatctt ctcgcgcaac gcgtcagtgg 3960
gctgatcatt aactatccgc tggatgacca ggatgccatt gctgtggaag ctgcctgcac 4020
taatgttccg gcgttatttc ttgatgtctc tgaccagaca cccatcaaca gtattatttt 4080
ctcccatgaa gacggtacgc gactgggcgt ggagcatctg gtcgcattgg gtcaccagca 4140
aatcgcgctg ttagcgggcc cattaagttc tgtctcggcg cgtctgcgtc tggctggctg 4200
gcataaatat ctcactcgca atcaaattca gccgatagcg gaacgggaag gcgactggag 4260
tgccatgtcc ggttttcaac aaaccatgca aatgctgaat gagggcatcg ttcccactgc 4320
gatgctggtt gccaacgatc agatggcgct gggcgcaatg cgcgccatta ccgagtccgg 4380
gctgcgcgtt ggtgcggata tctcggtagt gggatacgac gataccgaag acagctcatg 4440
ttatatcccg ccgtcaacca ccatcaaaca ggattttcgc ctgctggggc aaaccagcgt 4500
ggaccgcttg ctgcaactct ctcagggcca ggcggtgaag ggcaatcagc tgttgcccgt 4560
ctcactggtg aaaagaaaaa ccaccctggc gcccaatacg caaaccgcct ctccccgcgc 4620
gttggccgat tcattaatgc agctggcacg acaggtttcc cgactggaaa gcgggcagtg 4680
agcgcaacgc aattaatgtg agttagctca ctcattaggc gaattctcat gtttgacagc 4740
ttatcatcga taagctttaa tgcggtagtt tatcacagtt aaattgctaa cgcagtcagg 4800
caccgtgtat gaaatctaac aatgcgctca tcgtcatcct cggcaccgtc accctggatg 4860
ctgtaggcat aggcttggtt atgccggtac tgccgggcct cttgcgggat atcgtccatt 4920
ccgacagcat cgccagtcac tatggcgtgc tgctagcgct atatgcgttg atgcaatttc 4980
tatgcgcacc cgttctcgga gcactgtccg accgctttgg ccgccgccca gtcctgctcg 5040
cttcgctact tggagccact atcgactacg cgatcatggc gaccacaccc gtcctgtgga 5100
tcctctacgc cggacgcatc gtggccggca tcaccggcgc cacaggtgcg gttgctggcg 5160
cctatatcgc cgacatcacc gatggggaag atcgggctcg ccacttcggg ctcatgagcg 5220
cttgtttcgg cgtgggtatg gtggcaggcc ccgtggccgg gggactgttg ggcgccatct 5280
ccttgcatgc accattcctt gcggcggcgg tgctcaacgg cctcaaccta ctactgggct 5340
gcttcctaat gcaggaatcg cataagggag agcgtcgacc gatgcccttg agagccttca 5400
acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg 5460
tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc attttcggcg 5520
aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta ttcggaatct 5580
tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc ggcgagaagc 5640
aggccattat cgccggcatg gcggccgacg cgctgggcta cgtcttgctg gcgttcgcga 5700
cgcgaggctg gatggccttc cccattatga ttcttctcgc ttccggcggc atcgggatgc 5760
ccgcgttgca ggccatgctg tccaggcagg tagatgacga ccatcaggga cagcttcaag 5820
gatcgctcgc ggctcttacc agcctaactt cgatcattgg accgctgatc gtcacggcga 5880
tttatgccgc ctcggcgagc acatggaacg ggttggcatg gattgtaggc gccgccctat 5940
accttgtctg cctccccgcg ttgcgtcgcg gtgcatggag ccgggccacc tcgacctgaa 6000
tggaagccgg cggcacctcg ctaacggatt caccactcca agaattggag ccaatcaatt 6060
cttgcggaga actgtgaatg cgcaaaccaa cccttggcag aacatatcca tcgcgtccgc 6120
catctccagc agccgcacgc ggcgcatctc gggcagcgtt gggtcctggc cacgggtgcg 6180
catgatcgtg ctcctgtcgt tgaggacccg gctaggctgg cggggttgcc ttactggtta 6240
gcagaatgaa tcaccgatac gcgagcgaac gtgaagcgac tgctgctgca aaacgtctgc 6300
gacctgagca acaacatgaa tggtcttcgg tttccgtgtt tcgtaaagtc tggaaacgcg 6360
gaagtcagcg ccctgcacca ttatgttccg gatctgcatc gcaggatgct gctggctacc 6420
ctgtggaaca cctacatctg tattaacgaa gcgctggcat tgaccctgag tgatttttct 6480
ctggtcccgc cgcatccata ccgccagttg tttaccctca caacgttcca gtaaccgggc 6540
atgttcatca tcagtaaccc gtatcgtgag catcctctct cgtttcatcg gtatcattac 6600
ccccatgaac agaaatcccc cttacacgga ggcatcagtg accaaacagg aaaaaaccgc 6660
ccttaacatg gcccgcttta tcagaagcca gacattaacg cttctggaga aactcaacga 6720
gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg ctgatgagct 6780
ttaccgcagc gcgcagggtc agcctgaata cgcgtttaat gaccagcaca gtcgtgatgg 6840
caaggtcaga atagcgctga ggtctgcctc gtgaagaagg tgttgctgac tcataccagg 6900
cctgaatcgc cccatcatcc agccagaaag tgagggagcc acggttgatg agagctttgt 6960
tgtaggtgga ccagttggtg attttgaact tttgctttgc cacggaacgg tctgcgttgt 7020
cgggaagatg cgtgatctga tccttcaact cagcaaaagt tcgatttatt caacaaagcc 7080
acgttgtgtc tcaaaatctc tgatgttaca ttgcacaaga taaaaatata tcatcatgaa 7140
caataaaact gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac 7200
gggaaacgtc ttgctcgagg ccgcgattaa attccaacat ggatgctgat ttatatgggt 7260
ataaatgggc tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga 7320
agcccgatgc gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta 7380
cagatgagat ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc 7440
attttatccg tactcctgat gatgcatggt tactcaccac tgcgatcccc gggaaaacag 7500
cattccaggt attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag 7560
tgttcctgcg ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg 7620
tatttcgtct cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt 7680
ttgatgacga gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataagcttt 7740
tgccattctc accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt 7800
ttgacgaggg gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat 7860
accaggatct tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac 7920
ggctttttca aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga 7980
tgctcgatga gtttttctaa tcagaattgg ttaattggtt gtaacactgg cagagcatta 8040
cgctgacttg acgggacggc ggctttgttg aataaatcga acttttgctg agttgaagga 8100
tcagatcacg catcttcccg acaacgcaga ccgttccgtg gcaaagcaaa agttcaaaat 8160
caccaactgg tccacctaca acaaagctct catcaaccgt ggctccctca ctttctggct 8220
ggatgatggg gcgattcagg cctggtatga gtcagcaaca ccttcttcac gaggcagacc 8280
tcagcgctat tctgaccttg ccatcacgac tgtgctggtc attaaacgcg tattcaggct 8340
gaccctgcgc 8350
<210> 106
<211> 3190
<212> DNA
<213> 人工
<220>
<223> pAGR3
<400> 106
aagtgaccaa acaggaaaaa accgccctta acatggcccg ctttatcaga agccagacat 60
taacgcttct ggagaaactc aacgagctgg acgcggatga acaggcagac atctgtgaat 120
cgcttcacga ccacgctgat gagctttacc gcagctgcct cgcgcgtttc ggtgatgacg 180
gtgaaaacct ctgacacatg cagctcccgg agacggtcac agcttgtctg taagcggatg 240
ccgggagcag acaagcccgt cagggcgcgt cagcgggtgt tggcgggtgt cggggcgcag 300
ccatgaccca gtcacgtagc gatagcggag tgtatactgg cttaactatg cggcatcaga 360
gcagattgta ctgagagtgc accatatgcg gtgtgaaata ccgcacagat gcgtaaggag 420
aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt 480
tcggctgcgg cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc 540
aggggataac gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa 600
aaaggccgcg ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa 660
tcgacgctca agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc 720
ccctggaagc tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc 780
cgcctttctc ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag 840
ttcggtgtag gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga 900
ccgctgcgcc ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc 960
gccactggca gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac 1020
agagttcttg aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg 1080
cgctctgctg aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca 1140
aaccaccgct ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa 1200
aggatctcaa gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa 1260
ctcacgttaa gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt 1320
aaattaaaaa tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag 1380
ttaccaatgc ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat 1440
agttgcctga ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc 1500
cagtgctgca atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa 1560
ccagccagcc ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca 1620
gtctattaat tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa 1680
cgttgttgcc attgctgcag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt 1740
cagctccggt tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc 1800
ggttagctcc ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact 1860
catggttatg gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc 1920
tgtgactggt gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg 1980
ctcttgcccg gcgtcaacac gggataatac cgcgccacat agcagaactt taaaagtgct 2040
catcattgga aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc 2100
cagttcgatg taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag 2160
cgtttctggg tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac 2220
acggaaatgt tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg 2280
ttattgtctc atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt 2340
tccgcgcaca tttccccgaa aagtgccacc tgacgtctaa gaaaccatta ttatcatgac 2400
attaacctat aaaaataggc gtatcacgag gccctttcgt cttcaagaat taattcccaa 2460
ttccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 2520
ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 2580
tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggaatta 2640
attccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct 2700
gttgtttgtc ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg 2760
ttgcgaagca acggcccgga gggtggcggg caggacgccc gccataaact gccaggaatt 2820
aattccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt tcgttttatc 2880
tgttgtttgt cggtgaacgc tctcctgagt aggacaaatc cgccgggagc ggatttgaac 2940
gttgcgaagc aacggcccgg agggtggcgg gcaggacgcc cgccataaac tgccaggaat 3000
taattccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct ttcgttttat 3060
ctgttgtttg tcggtgaacg ctctcctgag taggacaaat ccgccgggag cggatttgaa 3120
cgttgcgaag caacggcccg gagggtggcg ggcaggacgc ccgccataaa ctgccaggaa 3180
ttggggatcg 3190
- 高保真度限制性内切核酸酶
- 高保真度限制性内切核酸酶