一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质
文献发布时间:2023-06-19 19:00:17
技术领域
本发明涉及生物技术领域,具体涉及一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质。
背景技术
有害生物(包括昆虫、线虫、病原微生物、寄生性植物等等)侵染造成作物严重减产和品质的下降。在长期的与有害生物斗争过程中,植物成功的适应并进化出不同层次的免疫抗性机制来抵御不同的威胁,包括抗性(R,resistance gene)基因介导的抗性,RNA沉默策略,植物激素参与调控的抗性机制等等。随着全球气候变暖,国际贸易交流不断增加等原因,新的病原不断出现,已有的植物抗性机制被有害生物突破导致严重病虫害现象时有发生,另外杀虫剂、杀菌剂等抗药性问题不断涌现,这些都严重影响了粮食安全、食品安全和生态安全。发掘新的抗性基因、研究和利用植物免疫基因作用机制就显得尤为重要。与此同时,已有植物抗性基因的改良和应用也是一种获得持久抗性的高效策略。
在过去的几十年研究中,对于植物R基因介导的抗性机制已有了长足发展,基础理论框架体系已经较为明确,大多数的胞内免疫受体蛋白(Nucleotide-binding leucine-rich repeat receptor,NLR)由R基因编码,他们通过编码抗性蛋白参与识别病原效应因子,进而引发细胞坏死等超敏反应,将有害生物限制在侵染位点,从而获得有效抗性。已有研究发现通过对参与病原效应子识别的结构域的修饰可以扩大R蛋白识别的病原微生物种类,从而增加其抗病谱。目前尚无根据其结构特征设计提高抗病蛋白活性的研究。关于R蛋白,根据NLR的N端结构域,这类受体蛋白可以被分为两大类,即N末端含有Toll-白细胞介素1受体(Toll/IL-1receptor,TIR)结构域的TIR-NBS-LRR受体和N末端含有卷曲螺旋(Coiled-coil,CC)结构域的CC-NBS-LRR受体两大类型。研究表明部分R蛋白的N末端单独表达时可以引发细胞坏死反应,但是对这种现象的机制解析还很少。近期植物中第一个抗病小体,CC-NBS-LRR受体ZAR1蛋白的激活过程被解析,ZAR1的CC区段可以在激活之后形成孔状结构,被认为具有离子通道的活性。另外后续TIR-NBS-LRR类蛋白RPP1的结构解析也证明,激活后的RPP1蛋白可以通过形成一个四聚体来发挥NAD
番茄斑萎病毒(Tomato spotted wilt orthotospovirus,TSWV)是布尼亚病毒中的一类侵染植物的病毒,大部分都是由昆虫介体传播。番茄斑萎病毒的寄主极其广泛,可以侵染超过50个属的800多种植物,包括像茄科,菊科等,造成多种作物严重的病害损失。目前为止,抗番茄斑萎病毒的自然的遗传资源很少,至今只鉴定了两个番茄斑萎病毒相关的抗性蛋白,分别是番茄中的Sw-5b和辣椒中的Tsw。其中Sw-5b蛋白特异性识别番茄斑萎病毒的移动蛋白(NSm)来发挥作用;而Tsw识别非结构蛋白(NSs),Tsw是一个近些年在辣椒中克隆的抗性基因,它编码的Tsw蛋白特异性的识别番茄斑萎病毒中的NSs蛋白,并引发植物的超敏反应激发抗性。这两个R蛋白的缺点是抗性谱较窄,而且近年来,抗性突破毒株不断涌现,另外Tsw介导的抗性较易受温度等外界生物或非生物环境因子影响。比如常见的多种病毒共感染或者高温等,都会导致抗性全部丧失。
对已有抗性基因进行定向改良是提高作物抗性和产量行之有效的方法。由R基因编码的胞内免疫受体蛋白NLR参与了植物对于病原体分子的感知和防御激活等过程,这对于植物的免疫进而是生存都至关重要。尽管有很多工作对于NLR蛋白的结构特征作出了解析,但是尚未涉及基于结构的对于NLR介导的抗性进行优化改良等方面。
发明内容
本发明所要解决的技术问题是如何通过R蛋白结构设计提高植物抗病性。
为了解决上述技术问题,本发明首先提供了提高植物中R蛋白对病毒抗性的方法。所述R蛋白可包含CC结构域。所述CC结构域从N端开始的第135-137位氨基酸可形成疏水区域。所述方法可包括使用定点突变的方法将所述R蛋白的CC结构域疏水区域中的氨基酸的编码核苷酸进行突变得到R突变体蛋白的步骤。所述R突变体蛋白对病毒的抗性反应高于所述R蛋白对病毒的抗性反应。
上文所述定点突变可为将所述R蛋白的CC结构域疏水区域中的酪氨酸的编码核苷酸突变为色氨酸的编码核苷酸,导致所述CC结构域从N端开始的第135-137位氨基酸中的酪氨酸突变为色氨酸。
上文所述定点突变的方法具体可为使用带有突变核苷酸的引物扩增目的片段,得到特定核苷酸位点核苷酸发生改变的定点突变后的目的片段。
上文所述植物可为下述任一种:
A1)单子叶植物;
B1)双子叶植物,
B2)管状花目,
B3)茄科,
B4)烟草属,
B5)烟草;
B6)辣椒属,
B7)辣椒;
B8)番茄属,
B9)番茄。
上文所述方法中,所述R蛋白可为辣椒Tsw蛋白。所述定点突变可为将序列表中序列2的第409-411位的TAT(酪氨酸的密码子)替换为TGG(色氨酸的密码子),保持序列2的其它核苷酸不变,导致序列表中序列1的137位的酪氨酸残基替换为色氨酸残基。
上文所述方法中,所述R蛋白可为番茄SlCNL-1蛋白。所述定点突变可为将序列表中序列4所示的第403-405位的TAT(酪氨酸的密码子)替换为TGG(色氨酸的密码子),保持序列4其它核苷酸不变,导致序列表中序列3的135位的酪氨酸残基替换为色氨酸残基。
上文所述病毒可为番茄斑萎病毒。
为了解决上述技术问题,本发明还提供了突变体蛋白。所述突变体蛋白为突变体蛋白A或突变体蛋白B。
所述突变体蛋白A可为由野生型Tsw蛋白进行1个氨基酸残基的替代构成的突变体蛋白。所述突变体蛋白A与所述野生型Tsw蛋白相比,可为在所述野生型Tsw蛋白从N端开始的第137位氨基酸残基发生替代。所述突变体蛋白A具有对病毒蛋白的抗性反应,且所述突变体蛋白A对病毒蛋白的抗性反应高于所述野生型Tsw蛋白对所述病毒的抗性反应。所述野生型Tsw蛋白可来源于辣椒。
所述突变体蛋白B可为由野生型SlCNL-1蛋白的卷曲螺旋(CC)结构域进行1个氨基酸残基的替代构成的突变体蛋白。所述突变体蛋白B与所述野生型SlCNL-1蛋白的卷曲螺旋(CC)结构域相比,可为在所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的第135位氨基酸残基发生替代。所述突变体蛋白B具有对病毒蛋白的抗性反应,且所述突变体蛋白B对病毒蛋白的抗性反应高于所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域对所述病毒的抗性反应。所述野生型SlCNL-1蛋白可来源于番茄。
上文所述从N端开始的第137位氨基酸残基可为序列表中序列1的第137位氨基酸残基。上文所述从N端开始的第135位氨基酸残基可为序列表中序列3的第135位氨基酸残基。
上文所述病毒可为番茄斑萎病毒。
上文所述野生型Tsw蛋白可为氨基酸序列是序列表中序列1的蛋白质。序列表中序列1的第1-169位可为氨基端的卷曲螺旋(CC)结构域的氨基酸序列。序列表中序列1的第170-491位可为核苷酸结合区(NBS)结构域。序列表中序列1的第492-2116位可为羧基端的亮氨酸重复区(LRR)结构域。
上文所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域可为氨基酸序列是序列表中序列3的蛋白质。
上文所述病毒可为番茄斑萎病毒。
上文所述突变体蛋白A可为将所述野生型Tsw蛋白从N端开始的第137位的酪氨酸氨基酸残基替代为色氨酸氨基酸残基得到的蛋白质。所述突变体蛋白B可为将所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的的第135位的酪氨酸氨基酸残基替代为色氨酸氨基酸残基得到的蛋白质。
上文所述突变体蛋白A还可为将所述野生型Tsw蛋白从N端开始的第137位的酪氨酸氨基酸残基替代为其他氨基酸残基得到的蛋白质。上文所述突变体蛋白B还可为将所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的第135位的酪氨酸氨基酸残基替代为其他氨基酸残基得到的蛋白质。
所述其它氨基酸可从r1)至r4)中选择:
r1)下述19种氨基酸中的任一种:丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)、苯丙氨酸(Phe)、色氨酸(Trp)、蛋氨酸(Met)、甘氨酸(Gly)、苏氨酸(Thr)、半胱氨酸(Cys)、酪氨酸(Tyr)、丝氨酸(Ser)、谷氨酰胺(Gln)、赖氨酸(Lys)、精氨酸(Arg)、组氨酸(His)、天冬氨酸(Asp)和谷氨酸(Glu);所述氨基酸的构象为L型;
r2)下述19种氨基酸中的任一种:丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)、苯丙氨酸(Phe)、色氨酸(Trp)、蛋氨酸(Met)、甘氨酸(Gly)、苏氨酸(Thr)、半胱氨酸(Cys)、酪氨酸(Tyr)、丝氨酸(Ser)、谷氨酰胺(Gln)、赖氨酸(Lys)、精氨酸(Arg)、组氨酸(His)、天冬氨酸(Asp)和谷氨酸(Glu);所述氨基酸的构象为D型;D型氨基酸是指与组成蛋白质的L型氨基酸相对应的氨基酸;
r3)对所述r1)或r2)进行化学修饰得到的人工修饰的氨基酸;
r4)自然界存在的稀有氨基酸。
所述r3)中的化学修饰可为甲基化或磷酸化等修饰。
所述自然界存在的稀有氨基酸包括组成蛋白质的不常见氨基酸和不组成蛋白质的氨基酸,例如5-羟基赖氨酸、甲基组氨酸或γ氨基丁酸等。
上述突变体蛋白中,所述其它氨基酸可为C1或C2:
C1、非极性氨基酸或极性氨基酸;
C2、所述其它氨基酸为缬氨酸、甘氨酸、丙氨酸或亮氨酸。
上述突变体蛋白中,所述突变体蛋白A与所述野生型Tsw蛋白相比,在序列上只是所述野生型Tsw蛋白的全长序列的第137位氨基酸残基发生替代,其它氨基酸残基没有发生替代。具体地,上述突变体蛋白中,所述突变体蛋白与所述野生型Tsw蛋白相比,在序列上只有所述野生型Tsw蛋白的全长序列的第137位氨基酸残基不同,其它氨基酸残基均相同。
上述突变体蛋白中,所述突变体蛋白B与所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域相比,在序列上只是所述野生型SlCNL-1蛋白的全长序列的第135位氨基酸残基发生替代,其它氨基酸残基没有发生替代。具体地,上述突变体蛋白中,所述突变体蛋白与所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域相比,在序列上只有所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域的全长序列的第135位氨基酸残基不同,其它氨基酸残基均相同。
上文所述突变体蛋白可为D1或D2中的任一种:
D1、氨基酸序列是将序列表中序列1的第137位的酪氨酸残基突变为色氨酸残基,保持序列1的其它氨基酸残基均不变得到的蛋白质;
D2、氨基酸序列是将序列表中序列3的第135位的酪氨酸残基突变为色氨酸残基,保持序列3的其它氨基酸残基均不变得到的蛋白质。
为了解决上述技术问题,本发明还提供了上文所述的方法和/或上文所述的突变体蛋白的下述任一种应用:
P1、上文所述的方法和/或上文所述的突变体蛋白在制备植物抗病原菌产品中的应用;
P2、上文所述的方法和/或上文所述的突变体蛋白在提高植物抗病性中的应用;
P3、上文所述的方法和/或上文所述的突变体蛋白在植物抗病育种或品种改良中的应用。
上文所述抗病性可为植物对番茄斑萎病毒的抗性。
本发明通过分子遗传分析,证明了基于已知R蛋白的结构信息,结合分子手段,对R蛋白进行分子优化和改良,进一步丰富植物中的抗性资源。本发明发现辣椒Tsw蛋白的N端CC结构域的第135-137位的疏水槽区段,可以用于优化类似Tsw这样进化不完善的R蛋白。通过点突变来增强其疏水作用力,进而达到稳定加强R蛋白抗性功能的目的。因此开发出一种基于蛋白结构的,对于Tsw抗性蛋白的改良方式,可以通过增强植物本身的抗性反应强烈程度,从而达到增强抗病的效果。这一方法适用于Tsw蛋白及其在番茄中的同系物SlCNL-1蛋白,它们共属于同一进化分枝,这一方法有被应用于通过基因定点编辑实现抗性育种的潜力。
附图说明
图1为Tsw各个结构域的功能验证。(a)Tsw结构示意图;(b)Tsw各个结构域能否识别NSs的功能验证Tsw-GFP,CC-GFP,NBS-GFP,LRR-GFP分别与NSs共注射于烟草叶片中,3天后观察细胞坏死情况;(c)免疫印迹实验验证各个蛋白表达情况,α-GFP代表显影使用商业化单克隆抗体GFP;(d)Tsw-GFP,CC-GFP,NBS-GFP,LRR-GFP单独注射烟草,3天后观察细胞坏死情况。
图2为CC结构域不同截短肽段对病毒的抗性分析。(a-b)CC结构域1-137位氨基酸肽段是发挥抗病功能的最短区段;(c)Tsw与ZAR1的疏水区(135-137aa)的结构比对(左图),Tsw以及Tsw
图3为Tsw
图4为SlCNL-1蛋白CC结构域N端开始第135位氨基酸突变为不同氨基酸后后的抗性分析。(a)SlCNL-1蛋白的CC结构域及其点突变蛋白(CC
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例一、突变R蛋白Tsw
1.辣椒Tsw蛋白重要功能位点确定
1.1辣椒Tsw蛋白功能结构域分析
从辣椒(Capsicum chinense)中分离得到的野生型Tsw蛋白全长由2116个氨基酸残基组成(序列表中序列1),其编码链的核苷酸序列如序列表中序列2所示。Tsw蛋白通过特异性识别非结构蛋白NSs并引发植物的超敏反应激发抗性,进而引发细胞坏死来发挥作用。通过序列比对分析,Tsw蛋白被分为三个结构域,分别是氨基端的卷曲螺旋(CC)结构域(序列表中序列1的第1-169位),核苷酸结合区(NBS)结构域(序列表中序列1的第170-491位)和一个羧基端的亮氨酸重复区(LRR)结构域(序列表中序列1的第492-2116位)。
首先将Tsw的编码密码子进行了优化,之后将Tsw蛋白及Tsw蛋白的三个结构域的编码基因分别通过常规分子克隆的方法构建到pGDGm载体上,分别获得了重组表达载体Tsw-GFP、CC-GFP、NBS-GFP和LRR-GFP。随后将测序阳性的四个重组表达载体质粒分别转入农杆菌EHA105,利用得到的重组农杆菌与番茄斑萎病毒的NSs蛋白共注射本生烟叶片,进行EHA105介导的烟草瞬时表达,3天后观察细胞坏死情况,从而验证Tsw蛋白及Tsw蛋白的三个结构域的功能。
图1中(b)的瞬时表达结果显示,编码密码子优化后翻译得到的Tsw蛋白依然可以很好的识别NSs蛋白,导致烟草叶片细胞的抗性反应强烈而引发细胞坏死;并且CC结构域具有和完整Tsw蛋白同样的功能,可以引发细胞坏死。进一步的研究发现,单独注射CC结构域进行瞬时表达就可以引发细胞坏死反应(图1中(d)),因此本发明接下来将进一步的改良设计区域放在了CC区段。
Tsw蛋白及Tsw蛋白的三个结构域的正确表达通过免疫印迹实验得到验证(图1中(c))。
1.2辣椒Tsw蛋白功能结构域关键位点分析
为了更好地改良辣椒Tsw蛋白的抗性,本发明首先研究了CC结构域基本的分子机制。首先验证了发挥主要作用的CC区段,将CC结构域的N端和C端分别构建截短突变体,验证了CC的N末端对于其功能发挥至关重要,并且找到了CC发挥功能的最短区段,即长度为1-137氨基酸的肽段(序列表中序列1的第1-137位)是功能必须的(图2中(a-b))。确定了最短功能域以后,将CC结构域1-137位氨基酸肽段和已知的CC-NBS-LRR受体ZAR1结构比对后发现,CC结构域从N端开始的第135-137位氨基酸(即序列表中序列135-137位氨基酸)形成的疏水区域有可以改造的空间,特别是137位的疏水氨基酸尤为重要。后续本发明构建了一系列定点突变,发现当把Tsw蛋白从N端(氨基端)开始的(即CC结构域从N端开始)的第137位(序列表中序列1的第137位)的酪氨酸突变为结构上相近但是疏水功能更强的色氨酸时(图2中(d-e)中的“ⅤCC
2.突变蛋白Tsw
2.1定点突变野生型Tsw蛋白获得突变体蛋白Tsw
通过步骤1对Tsw蛋白CC结构域的分析找到功能增强的突变位点后,本发明在Tsw蛋白中对这个位点进行了突变,得到了Tsw
人工合成了Tsw蛋白的编码核苷酸序列(序列表中序列4),之后以此为模板,通过使用引物(m-cc-1R(Y137W):
重组农杆菌EHA105/Tsw
2.2突变蛋白Tsw
利用农杆菌介导的瞬时表达体系,验证Tsw
首先将步骤2.1中得到的重组农杆菌EHA105/Tsw
使用1mL注射器在不同本生烟(Nicotiana benthamiana)叶片背面注射上述三种农杆菌侵染液,实验重复三次,每种农杆菌侵染液注射10个烟草叶片。两天后注射三种农杆菌侵染液后分别瞬时表达带GFP标签的Tsw
其中,摩擦接种实验过程为:将感染番茄斑萎病毒的烟草叶片在液氮中研磨成粉末,加入适量接种缓冲液(0.05M磷酸缓冲液中加入0.01%巯基乙醇,0.05%亚硫酸钠),混匀之后,在预先撒上金刚砂的烟草叶片上,用食指轻轻涂抹含有病毒的缓冲液,之后放在黑暗下12h,放入温室正常生长。
结果如图3所示,6天后,Tsw
3、番茄中的SlCNL-1蛋白的定点突变蛋白功能分析
针对这一位点的改造,同样在番茄中的SlCNL-1蛋白中得到了验证。SlCNL-1与Tsw同属一个进化分枝,通过比对分析,在野生型SlCNL-1蛋白的N末端存在一个同Tsw一样的疏水结构簇。野生型SlCNL-1蛋白氨基端的卷曲螺旋(CC)结构域的氨基酸序列如序列表中序列3所示,SlCNL-1蛋白CC结构域的编码链的核苷酸序列如序列表中序列4所示。
通过使用步骤2.1相同的定点突变方法将SlCNL-1蛋白CC结构域从N端开始的第135位的酪氨酸(序列表中序列3的第135位)突变为色氨酸以后得到SlCNL-1蛋白CC结构域定点突变蛋白CC
同时,使用步骤2.1相同的定点突变方法将SlCNL-1蛋白CC结构域(下面简称SlCNL-1-CC)从N端(氨基端)开始(即从CC结构域N端开始)的第135位(序列表中序列3的第135位)的酪氨酸突变为谷氨酸得到突变体蛋白CC
疏水结构域由酪氨酸到色氨酸的突变明显增强了SlCNL-1蛋白的SlCNL-1-CC区段引发细胞坏死的能力(图4中CC
综上,本发明发现了一种基于结构分析的,对于抗病蛋白定点突变获得增强抗性的方案,已证明这种策略可以提高辣椒Tsw以及其同系物番茄SlCNL-1蛋白SlCNL-1-CC区段的抗性反应。这一策略中所针对的关键疏水氨基酸位点在多个类型植物的抗性蛋白中保守存在,因此这一方案有望在辣椒或番茄等茄科及其它作物中应用,以达到抗病增产的目的。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 中国科学院微生物研究所
<120> 一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质
<130> GNCSQ211557
<160> 4
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2116
<212> PRT
<213> 辣椒(Capsicum chinense)
<400> 1
Met Glu Met Val Thr Asn Ile Leu Ser Pro Val Ala Glu His Leu Ile
1 5 10 15
Ile Pro Pro Val Val Arg Gln Ile Gly Tyr Leu Phe Tyr Tyr Arg Arg
20 25 30
Asn Ile Arg Ser Leu Asp Glu Glu Ser Asn Lys Leu Glu Asn Ile Arg
35 40 45
Ser Gly Val Asn Gln Arg Val Glu Ala Ala Arg Arg Asn Leu Gln Val
50 55 60
Ile Ser Pro Asn Val Glu Ala Trp Leu Thr Ser Val Asp Thr Thr Thr
65 70 75 80
Ala Asp Val Ala Val Val Met Gly Gly Arg Thr Glu Val Glu Arg Gly
85 90 95
Cys Ile Tyr Gly Trp Cys Pro Thr Leu Lys Ser Arg Tyr Leu Leu Ser
100 105 110
Arg Arg Ala Lys Lys Ile Thr Leu Glu Val Thr Lys Leu Gln Lys Glu
115 120 125
Gly Asn Glu Tyr Ala Val Phe Cys Tyr Pro Val Pro Ala Asp Glu Ile
130 135 140
Glu Ala Ile Pro Ser Asn Thr Asn Glu Glu Phe Val Ser Arg Lys Gln
145 150 155 160
Lys Glu Glu Glu Val Met Thr Ala Leu Lys Asp Glu Glu Ile Thr Ile
165 170 175
Val Gly Ile Cys Gly Met Gly Gly Val Gly Lys Thr Ser Leu Ala Glu
180 185 190
Lys Val Arg Ala Arg Ala Lys Gln Glu Arg Leu Phe Asn Asp Val Val
195 200 205
Met Val Thr Val Ser Gln Gln Gln Asp Leu Lys Arg Ile Gln Gly Glu
210 215 220
Ile Ala Gly Glu Val Gly Leu Thr Ser Leu Gln Gly Asp Asn Leu Leu
225 230 235 240
Ser Arg Gly Asp Gln Leu Arg Ala Arg Leu Met Gln Glu Gly Ser Arg
245 250 255
Val Leu Val Ile Leu Asp Asp Val Trp Glu Ala Leu Asp Asp Leu Glu
260 265 270
Lys Leu Gly Ile Pro Thr Gly Ser Asn His Asn Tyr Gln Cys Lys Val
275 280 285
Ala Leu Thr Thr Arg Arg Gln Asp Val Cys Asp Ala Met Lys Ala Gln
290 295 300
Lys Thr Val Asp Val Val Ile Leu Ser Asp Glu Glu Ala Trp Val Leu
305 310 315 320
Phe Arg Gln Lys Ala Gly Tyr Ser Ala Asp Asp Pro Ser Leu Ser Glu
325 330 335
Val Ala Lys Glu Val Ala Lys Glu Cys Lys Gly Leu Pro Leu Ala Ile
340 345 350
Val Ile Val Ala Gly Ala Leu Lys Thr Lys Thr Lys Pro Ser Trp Asp
355 360 365
Asp Ala Leu Val Glu Leu Arg Lys Ala Ser Pro Lys Asn Ile Pro Arg
370 375 380
Val Leu Thr Lys Val Tyr Gln Pro Leu Lys Thr Ser Tyr Asp His Leu
385 390 395 400
Glu Ser Asp Glu Ala Arg Tyr Val Phe Leu Leu Cys Ser Leu Phe Glu
405 410 415
Glu Asp Ser Asp Ile Trp Thr Glu Glu Leu Leu Lys Tyr Gly Val Gly
420 425 430
Leu Gly Ile Phe Ser Glu Leu Glu Asn Leu Glu Cys Ala Arg Asn Arg
435 440 445
Val Cys Asn Leu Leu Glu Thr Leu Lys Asn Cys Phe Leu Leu Ser Gln
450 455 460
Gly Lys Asp Lys Asn Tyr Val Lys Met His Asp Val Val Arg Asp Val
465 470 475 480
Ala Ile Tyr Ile Ala Ser Glu Gly Glu His Lys Phe Leu Val Asn His
485 490 495
Asn Val Asn Ser Asn Val Phe Leu Arg Lys Val Ser Tyr Glu Gln Tyr
500 505 510
Ser His Met Ser Ile Val Ala Asn Lys Phe Asp Glu Arg Pro Thr Pro
515 520 525
Ile Phe Cys Pro Arg Leu Lys Leu Leu Met Leu Lys Leu Arg Phe Glu
530 535 540
Glu Gly Phe Lys Leu Gln Asp Asp Phe Phe Asp Gly Met Ser Glu Leu
545 550 555 560
Ser Val Ile Lys Leu Ser Gly Tyr Asp Arg Asn Ser Ile Leu Pro Phe
565 570 575
Pro Ser Ser Ile Gln Arg Leu Ser Asn Leu Ser Thr Leu Trp Leu Ser
580 585 590
Asn Leu Arg Leu Asp Asp Val Ser Ile Ile Gly Lys Leu Val Thr Leu
595 600 605
Glu Ile Leu Ser Ile Arg Gly Ser Asp Leu Gln Glu Leu Pro Val Glu
610 615 620
Ile Gly Asn Leu Ala Asn Leu Thr Met Leu Glu Tyr Trp Asn Thr Gly
625 630 635 640
Tyr Arg Lys Arg Met Arg Ile Ser Pro Gly Val Leu Ser Arg Leu Val
645 650 655
Arg Leu Glu Glu Leu His Met Val Gly Val Glu Asp Cys Ser Tyr Ser
660 665 670
Thr Leu Arg Glu Leu Glu Ser Leu Ser Arg Leu Thr Ala Leu Ala Phe
675 680 685
Asp Glu Cys Ser Val Asp Val Ile Tyr Ser Asn Leu Gly Leu Ser Ser
690 695 700
Lys Leu Thr Arg Tyr Ala Leu Lys Met Gly Arg His Tyr Thr Phe Thr
705 710 715 720
Ser Phe Met Glu Thr Tyr Asn Lys Ala Ile Asp Leu Asp Val Thr Lys
725 730 735
Gly Thr Pro Leu Gly Asp Trp Ile Cys Leu Leu Leu Arg Asn Ser Glu
740 745 750
Val Val His Ser Arg Gly Lys Gly Ser Lys Asn Val Met Val Glu Leu
755 760 765
Gln Asn Val Lys Asp Leu Met Leu Ser Asp Cys Asp Ser Leu Asn Ile
770 775 780
His Tyr Gln Asn Asn Ile Ser Phe Pro Glu Leu Glu Arg Leu Glu Val
785 790 795 800
Arg Tyr Cys Asp Tyr Leu Arg His Leu Phe Cys Val Ser Leu Ala Cys
805 810 815
Pro Asp Glu Gly Thr Ser Arg Arg Thr His Ile Arg Pro Asp Val Ile
820 825 830
Lys Phe Pro Asn Leu His Ser Leu Thr Leu Arg Asn Leu Glu Phe Phe
835 840 845
Thr His Phe Tyr Ser Asp Thr Val Glu Gly Ile Glu Phe Pro Leu Leu
850 855 860
Arg Val Ile Tyr Leu Arg Gly Leu Pro Glu Phe Gln Asn Phe Trp Pro
865 870 875 880
Thr Ala Asn Asn Ala Ile Thr Asp Ser Asn Pro Leu Phe Asn Glu Lys
885 890 895
Val Ser Cys Pro Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Ser
900 905 910
Ile Thr Ala Leu Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys
915 920 925
Leu Glu Thr Leu Lys Val Glu Asn Cys Gly Lys Leu Arg His Leu Met
930 935 940
Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu
945 950 955 960
Glu Tyr Cys Glu Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu
965 970 975
Gly Asp Glu Ile Met Cys Asn Glu Pro Leu Phe Pro Gln Leu Glu Glu
980 985 990
Leu Glu Leu Gln Asn Leu Pro Lys Leu Arg His Phe Ile Leu Thr Lys
995 1000 1005
Gln Ala Leu Glu Phe Pro Phe Leu Ile Glu Val Lys Ile Arg Asn Cys
1010 1015 1020
Pro Glu Met Lys Met Leu Val Gln Arg Arg Phe Val Ser Thr Ser Ser
1025 1030 1035 1040
Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn
1045 1050 1055
Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu Lys Val Leu
1060 1065 1070
Lys Leu His Glu Ala Asn Asn Ile Thr Ala Leu Cys Ser His Gln Leu
1075 1080 1085
Pro Thr Thr Tyr Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys
1090 1095 1100
Gly Lys Leu Arg His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu
1105 1110 1115 1120
Asn Leu Arg Ile Leu Leu Leu Gly Tyr Cys Glu Ser Met Glu Glu Val
1125 1130 1135
Ile Ile Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr Asn Glu Pro
1140 1145 1150
Leu Phe Pro Leu Leu Glu Glu Leu Ile Leu Asp Lys Leu Pro Lys Leu
1155 1160 1165
Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro Phe Leu Arg
1170 1175 1180
Glu Val Lys Ile Arg Lys Cys Pro Glu Met Lys Met Leu Val Gln Gln
1185 1190 1195 1200
Arg Ser Val Ser Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu
1205 1210 1215
Leu Lys Val Val Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser
1220 1225 1230
Cys Pro Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Ser Ile Thr
1235 1240 1245
Ala Leu Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Glu
1250 1255 1260
Thr Leu Glu Val Glu Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro
1265 1270 1275 1280
Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu Gly Tyr
1285 1290 1295
Cys Glu Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu Gly Glu
1300 1305 1310
Glu Asn Met Thr Asn Glu Pro Leu Phe Pro Leu Leu Glu Glu Leu Ile
1315 1320 1325
Leu Asp Lys Leu Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala
1330 1335 1340
Leu Glu Phe Pro Phe Leu Arg Glu Val Lys Ile Arg Lys Cys Pro Glu
1345 1350 1355 1360
Met Lys Met Leu Val Gln Gln Arg Ser Val Ser Thr Ser Ser Leu Lys
1365 1370 1375
Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn Lys Ala
1380 1385 1390
Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu Lys Val Leu Lys Leu
1395 1400 1405
His Glu Ala Asn Asn Ile Thr Ala Leu Cys Ser His Gln Leu Pro Thr
1410 1415 1420
Thr Tyr Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys Gly Lys
1425 1430 1435 1440
Leu Arg His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu
1445 1450 1455
Arg Ile Leu Leu Leu Gly Tyr Cys Glu Ser Met Glu Glu Val Ile Ile
1460 1465 1470
Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr Asn Glu Pro Leu Phe
1475 1480 1485
Pro Leu Leu Glu Glu Leu Ile Leu Asp Lys Leu Pro Lys Leu Gly His
1490 1495 1500
Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro Phe Leu Arg Glu Val
1505 1510 1515 1520
Lys Ile Arg Lys Cys Pro Glu Met Lys Met Leu Val Gln Gln Arg Ser
1525 1530 1535
Val Ser Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys
1540 1545 1550
Val Val Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro
1555 1560 1565
Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Asn Ile Thr Ala Leu
1570 1575 1580
Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Glu Thr Leu
1585 1590 1595 1600
Glu Val Glu Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro Ser Val
1605 1610 1615
Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu Gly Tyr Cys Glu
1620 1625 1630
Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu Gly Glu Glu Asn
1635 1640 1645
Met Thr Asn Glu Pro Leu Phe Pro Leu Leu Glu Glu Leu Ile Leu Asp
1650 1655 1660
Lys Leu Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu
1665 1670 1675 1680
Phe Pro Phe Leu Arg Glu Val Lys Ile Arg Lys Cys Pro Glu Met Lys
1685 1690 1695
Met Leu Val Gln Gln Arg Ser Val Ser Thr Ser Ser Leu Lys Ser Val
1700 1705 1710
Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn Lys Ala Met Phe
1715 1720 1725
Asn Ser Lys Val Ser Cys Pro Asn Leu Glu Leu Leu Arg Leu Tyr Lys
1730 1735 1740
Ala Asn Ser Val Gly Ser Leu Phe Ser His Gln Leu Pro Thr Thr Tyr
1745 1750 1755 1760
Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys Gly Lys Leu Arg
1765 1770 1775
His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile
1780 1785 1790
Leu Ile Leu Arg Asp Cys Glu Ser Met Glu Glu Val Ile Thr Glu Glu
1795 1800 1805
Glu Gln Glu Gly Asp Glu Ile Met Cys Asn Glu Pro Leu Phe Pro Gln
1810 1815 1820
Leu Glu Glu Leu Lys Leu Glu Asn Leu Pro Lys Leu Arg His Phe Ile
1825 1830 1835 1840
Leu Thr Lys Gln Ala Leu Glu Ile Pro Phe Leu Ile Glu Val Gln Ile
1845 1850 1855
Arg Asn Cys Pro Glu Met Lys Met Leu Val Gln Gln Arg Ser Val Ser
1860 1865 1870
Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val
1875 1880 1885
Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu
1890 1895 1900
Glu Leu Leu Arg Leu Tyr Lys Ala Asn Ser Val Gly Ser Leu Phe Ser
1905 1910 1915 1920
His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Met Gln Leu Gly Ile
1925 1930 1935
Arg Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro Ser Val Ala Arg
1940 1945 1950
Gly Leu Leu Asn Leu Arg Ile Leu Ile Leu Gly Asp Cys Glu Ser Met
1955 1960 1965
Glu Glu Val Ile Thr Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr
1970 1975 1980
Asn Glu Ser Leu Phe Pro Cys Leu Glu Met Leu Lys Leu Glu Asn Leu
1985 1990 1995 2000
Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro
2005 2010 2015
Phe Leu Arg Glu Val Lys Ile Arg Thr Cys Pro Glu Met Lys Ile Phe
2020 2025 2030
Val Gln His Gly Ser Val Ser Thr Pro Ser Leu Glu Ile Val Asn Asn
2035 2040 2045
Asp Asp Glu Val Lys Val Asp Asp Leu Asn Glu Trp Ile His Gln Arg
2050 2055 2060
Phe Asn Ser Lys Glu Glu Asp Gly Ser Glu Ser Glu Ser Ser Gln Glu
2065 2070 2075 2080
Glu Asp Gly Ser Glu Ser Glu Ala Ser His Glu Asp Gly Ser Lys Cys
2085 2090 2095
Glu Ala Ser Gln Glu Glu Asp Arg Ser Glu Ser Glu Asp Ser Met Ser
2100 2105 2110
Asp Gly Arg Ser
2115
<210> 2
<211> 6351
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
atggaaatgg taactaatat tttgagccca gtcgcagaac acttgatcat accgccagtt 60
gtgcgacaga ttgggtattt gttttactat aggcgcaaca tcaggtctct ggatgaagaa 120
tctaataagc tcgagaatat cagaagtggg gtgaatcaaa gagtggaggc tgcccggaga 180
aacttacaag tcatttcacc caatgttgag gcttggttaa ctagtgttga tactactact 240
gctgatgtgg cagttgtaat gggaggtcga actgaggttg aaaggggttg catctacggt 300
tggtgtccaa cattgaagtc acgttacttg ctgagcagga gagccaagaa aattacactg 360
gaagttacta aacttcaaaa ggaaggtaac gagtatgctg ttttctgcta tccggttcca 420
gctgatgaaa ttgaagctat acctagtaac actaatgagg agtttgtctc tagaaaacag 480
aaggaggaag aggtcatgac agctttgaaa gatgaggaga tcactattgt tgggatatgt 540
ggtatgggtg gtgttggtaa aacatcactg gctgagaaag taagagcaag ggcaaaacaa 600
gaaaggttat ttaatgatgt tgtcatggta actgtcagtc aacaacaaga cctgaaaaga 660
attcagggcg agatcgccgg agaggtcggg ctgacgtcat tgcaaggaga caatttgtta 720
agtcgtggag atcagctgcg tgcaaggtta atgcaagaag gaagtcgcgt ccttgtaatt 780
ttggatgatg tttgggaggc tcttgatgat ctagagaaac ttggaattcc cactggcagc 840
aaccacaact atcagtgcaa agtggcattg acgacgcgcc gccaagatgt ttgtgacgct 900
atgaaggctc aaaagactgt agatgttgta atcttatctg atgaagaagc atgggtcctt 960
tttaggcaga aagccggtta ttcagctgat gatccctctc tttctgaagt agcaaaagaa 1020
gttgccaaag aatgcaaggg gctgccactt gcaattgtta ttgttgcagg agcactaaag 1080
actaaaacca agccttcatg ggatgatgcc cttgtagaat taagaaaagc atcaccaaaa 1140
aatatcccaa gagtgcttac aaaggtgtat caacctctga agacaagcta tgatcactta 1200
gagagtgatg aagccaggta tgtctttttg ctttgttcct tgtttgagga agatagtgat 1260
atttggaccg aagaattact taaatatgga gtgggacttg gcatcttttc ggaactcgaa 1320
aatttagaat gtgcaagaaa tagggtgtgt aatctgttag aaacattgaa aaattgtttc 1380
ttgttatccc aaggtaaaga caaaaattat gtcaaaatgc atgatgtggt ccgtgacgtg 1440
gctatatata ttgcgtctga gggtgagcat aaatttttgg tgaaccacaa cgtgaactct 1500
aacgtttttt tgaggaaggt ttcttatgaa cagtattctc atatgtctat cgtggcaaac 1560
aaattcgacg agaggccaac accaatcttc tgccctaggc ttaagctttt gatgttgaaa 1620
cttagattcg aggaaggttt taaacttcaa gatgatttct ttgacggaat gtctgagctt 1680
tcagttatta aactttctgg ttacgatagg aactctatct tgccatttcc ttcttctatt 1740
caaagattgt ctaatttgtc tacactttgg ctttcaaatc ttagattgga tgatgtgtct 1800
attattggta aacttgtgac tcttgaaatc ctttctatta ggggttctga tcttcaagag 1860
cttccagttg agatcggtaa cttggctaat cttactatgc ttgagtactg gaatactgga 1920
tacagaaaga ggatgagaat ttcaccgggt gtgttgtcaa ggttggtgag acttgaggag 1980
ttgcacatgg ttggtgttga agactgctct tactctactt tgagagagct tgaatctttg 2040
tctaggttga cagctttggc attcgacgag tgttctgttg acgtgatcta ctctaacctt 2100
ggactttctt caaagcttac taggtacgca ttgaagatgg gtagacacta tactttcaca 2160
tcttttatgg aaacatacaa caaagcaatt gaccttgacg tgactaaggg aactccactt 2220
ggagactgga tttgcttgtt gttgaggaac tctgaggtgg tgcactcaag gggtaaggga 2280
tctaagaacg ttatggtgga gcttcaaaac gttaaagact tgatgttgtc agactgtgat 2340
tctcttaaca tccattacca gaacaacatt tcattcccag aattggagag gttggaggtg 2400
aggtactgtg actatcttag acatcttttc tgcgtgtctc ttgcttgccc agatgagggt 2460
acttctagga ggacacacat tagaccagat gttattaaat tcccaaattt gcactcactt 2520
acattgagga accttgagtt ctttacacac ttctactcag acacagtgga gggtatcgaa 2580
ttccctcttt tgagggtgat ctaccttagg ggattgccag agttccagaa cttctggcca 2640
actgctaaca atgcaattac tgattcaaat ccacttttca atgagaaggt ttcttgtcca 2700
aacttgaagg ttcttaaatt gcatgaagca aactctatca ctgcattgtg ttcacaccag 2760
cttcctacta cttatttttc aaaattggag actttgaagg tggaaaactg cggtaagttg 2820
aggcatctta tgtcaccttc agtggctagg ggtttgctta atcttaggat tcttttgttg 2880
gagtactgcg agtctatgga agaggtgatc atcgaagagg aacaagaagg tgatgagatc 2940
atgtgcaatg aaccattgtt tccacagttg gaggagttgg aacttcagaa cttgccaaag 3000
ttgaggcatt ttattcttac aaaacaagct ttggagtttc cattccttat cgaagttaag 3060
atcagaaact gcccagaaat gaaaatgctt gtgcagagga gattcgtttc tacatcttca 3120
ttgaaatctg ttaataacga cgacgagttg aaggttgttg atcttaacaa ggcaatgttt 3180
aattcaaaag tttcatgtcc taatttgaag gttttgaaac ttcatgaggc taataatatt 3240
acagcattgt gctctcatca gcttccaact acatacttct ctaaattgga gacacttgaa 3300
gttgagaatt gtggaaagct tagacatctt atgtctccat ctgttgcaag gggtttgttg 3360
aaccttagga tccttcttct tggttactgt gaatctatgg aggaagtgat tatcgaagaa 3420
gagcaagagg gagaagagaa catgactaat gaacctcttt ttcctctttt ggaagaactt 3480
attttggata agttgcctaa gttgggtcac ttctttctta caaaaagggc acttgaattt 3540
ccattcttga gagaagttaa aattaggaaa tgcccagaaa tgaagatgct tgtgcagcaa 3600
aggtcagttt ctacatcatc tcttaagtca gttaacaacg atgacgagtt gaaagttgtg 3660
gatttgaata aagcaatgtt taactcaaaa gtttcttgtc caaaccttaa agttttgaag 3720
cttcacgagg ctaattctat tacagctttg tgttcacatc aacttcctac tacatatttt 3780
tctaaattgg agactttgga ggtggagaat tgcggtaaat tgaggcacct tatgtcacct 3840
tcagttgcaa ggggacttct taatttgaga attcttttgc ttggatattg tgagtcaatg 3900
gaggaagtga ttattgagga agaacaagaa ggagaggaaa acatgacaaa tgagcctttg 3960
ttcccattgc ttgaggaact tatccttgat aagcttccta aacttggaca ctttttcctt 4020
acaaagagag cattggaatt tccttttttg agggaggtga aaattagaaa gtgtccagaa 4080
atgaagatgc ttgtgcagca aaggtcagtg tcaacatcat ctttgaagtc agtgaacaat 4140
gacgacgaac ttaaggtggt ggacttgaat aaagcaatgt tcaattctaa ggtgtcatgc 4200
cctaacctta aagtgttgaa attgcacgag gcaaataata tcactgctct ttgttcacac 4260
caattgccta caacttattt ctctaagttg gaaactcttg aagtggagaa ttgtggaaaa 4320
cttaggcatt tgatgtcacc ttctgttgct agaggacttc ttaaccttag aattttgctt 4380
ttgggttact gcgaatcaat ggaagaagtg atcatcgaag aggaacaaga aggtgaggag 4440
aatatgacta acgagccttt gtttccattg ttggaggagc ttattcttga taaacttcca 4500
aagttgggtc atttcttctt gacaaagagg gcacttgagt tcccattttt gagagaggtt 4560
aagattagaa aatgcccaga aatgaagatg cttgtgcaac aaagatctgt gtctacttct 4620
tcattgaagt ctgttaacaa tgacgatgag ttgaaagtgg ttgacttgaa caaggcaatg 4680
tttaactcta aagtttcttg cccaaatctt aaggtgctta agcttcatga ggcaaacaat 4740
atcactgcac tttgctcaca tcagttgcca actacttact tttctaagct tgaaactttg 4800
gaggtggaaa attgcggaaa acttaggcac ttgatgtcac catcagttgc aaggggtctt 4860
cttaacttga ggattttgtt gttgggttat tgcgaatcta tggaagaagt tattatcgag 4920
gaggagcaag aaggtgaaga aaatatgact aacgaacctc tttttccact tcttgaagag 4980
ttgatcttgg acaaacttcc aaaattggga catttttttc ttactaagag ggctttggag 5040
tttcctttcc ttagagaggt gaagattaga aagtgcccag aaatgaagat gcttgttcag 5100
cagagatcag tgtcaacttc ttctttgaaa tcagttaata atgacgatga attgaaagtg 5160
gtggatctta acaaagctat gtttaactct aaagtgtctt gcccaaatct tgagttgttg 5220
agattgtaca aggcaaactc tgttggttct cttttctcac accagcttcc aacaacttat 5280
ttctctaaac ttgagacact tgaggtggag aactgtggaa aattgaggca tcttatgtct 5340
ccatctgttg ctaggggatt gttgaacttg aggatcctta ttttgagaga ttgtgagtca 5400
atggaagaag ttattactga ggaggagcaa gaaggagacg agatcatgtg taacgaacct 5460
ttgtttcctc aacttgaaga attgaaactt gaaaatttgc caaagcttag acactttatc 5520
ttgacaaagc aagctcttga aatccctttt cttattgagg ttcaaattag gaactgccca 5580
gaaatgaaga tgttggttca gcagaggtct gtttcaactt catcacttaa gtctgtgaac 5640
aatgatgatg aacttaaggt ggtggacctt aataaggcta tgttcaactc taaggtgtct 5700
tgtcctaatt tggagcttct tagactttat aaagcaaatt ctgtgggatc tcttttttct 5760
caccaacttc ctacaacata tttctctaaa cttatgcagc ttggaattag aaattgcggt 5820
aagttgagac atttgatgtc accttcagtg gcaagaggtc ttttgaatct tagaatcctt 5880
atccttggtg actgcgaatc tatggaggaa gttatcactg aggaggaaca agaaggtgag 5940
gaaaacatga caaacgaatc tcttttccca tgtcttgaga tgttgaaatt ggaaaacctt 6000
ccaaagcttg gacatttttt cttgactaaa agagctcttg agttcccttt ccttagggaa 6060
gtgaaaatta gaacttgccc agagatgaaa atctttgttc agcatggatc tgtttcaaca 6120
ccttcattgg agattgttaa caacgacgac gaggtgaagg tggacgactt gaatgagtgg 6180
attcaccaaa gatttaattc aaaagaggag gacggttctg agtcagagtc ttcacaagaa 6240
gaggatggat ctgagtctga ggcttcacat gaggacggat ctaagtgcga agcttctcaa 6300
gaggaggata ggtcagagtc tgaggattct atgtcagacg gtaggtctta a 6351
<210> 3
<211> 158
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 3
Met Glu Phe Phe Ser Tyr Gly Leu Val Asp Lys Val Thr Gly Cys Leu
1 5 10 15
Ile Lys Pro Val Ala Arg Trp Ile Gly Tyr Phe Val Tyr Tyr Lys Arg
20 25 30
Asn Ile Thr Cys Met Glu Asn Glu Ser Glu Lys Leu Glu Asn Ile Arg
35 40 45
Ile Gly Val Asp Gln Arg Ala Glu Ala Asn Arg Arg Asn Leu Gln Val
50 55 60
Ile Ser Pro Asn Val Glu Ala Trp Phe Thr Ser Val Ala Thr Ile Thr
65 70 75 80
Ala Glu Val Ala Asp Val Thr Arg Arg Gly Arg Asn Glu Val Asp Arg
85 90 95
Tyr Asp Trp Cys Pro Asn Leu Lys Ser Arg Tyr Ser Leu Ser Arg Arg
100 105 110
Ala Lys Arg Ile Ala Leu Glu Leu Ile Glu Leu Arg Asn Glu Gly Asn
115 120 125
Asn Tyr Ala Val Phe Cys Tyr Pro Ala Val Glu Asn Glu Pro Leu Pro
130 135 140
Ile Asn Ser Ala Glu Glu Phe Asp Ser Arg Lys Leu Gln Glu
145 150 155
<210> 4
<211> 474
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
atggaattct tctcatatgg tttggtggac aaggtaacag gttgcttgat aaagccagtt 60
gcgcgatgga tcgggtattt tgtttactac aagagaaaca tcacatgtat ggaaaatgaa 120
tctgagaagc tggagaatat cagaattggg gtggatcaaa gagccgaggc taaccggaga 180
aacttacaag tcatttcacc caatgttgag gcttggttta ctagtgttgc taccattact 240
gctgaggtgg cagatgtaac acgacgaggt agaaatgagg ttgatagata tgattggtgt 300
ccaaacttga agtcacgtta ctccctgagc aggagagcta agagaattgc attggagttg 360
attgaacttc gaaatgaagg caacaattat gctgttttct gctatcctgc tgttgaaaat 420
gaacctctac ctatcaacag cgctgaggag tttgattcta gaaaattgca agag 474
- 一种基于二级结构动态选择策略的蛋白质结构预测方法
- 一种基于有偏采样的蛋白质结构预测方法
- 一种基于特定距离约束的蛋白质结构预测方法
- 一种随机突变获得的谷氨酸脱羧酶突变体基因及其编码蛋白质和应用
- 一种随机突变获得的谷氨酸脱羧酶突变体基因及其编码蛋白质和应用