掌桥专利:专业的专利平台
掌桥专利
首页

一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质

文献发布时间:2023-06-19 19:00:17



技术领域

本发明涉及生物技术领域,具体涉及一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质。

背景技术

有害生物(包括昆虫、线虫、病原微生物、寄生性植物等等)侵染造成作物严重减产和品质的下降。在长期的与有害生物斗争过程中,植物成功的适应并进化出不同层次的免疫抗性机制来抵御不同的威胁,包括抗性(R,resistance gene)基因介导的抗性,RNA沉默策略,植物激素参与调控的抗性机制等等。随着全球气候变暖,国际贸易交流不断增加等原因,新的病原不断出现,已有的植物抗性机制被有害生物突破导致严重病虫害现象时有发生,另外杀虫剂、杀菌剂等抗药性问题不断涌现,这些都严重影响了粮食安全、食品安全和生态安全。发掘新的抗性基因、研究和利用植物免疫基因作用机制就显得尤为重要。与此同时,已有植物抗性基因的改良和应用也是一种获得持久抗性的高效策略。

在过去的几十年研究中,对于植物R基因介导的抗性机制已有了长足发展,基础理论框架体系已经较为明确,大多数的胞内免疫受体蛋白(Nucleotide-binding leucine-rich repeat receptor,NLR)由R基因编码,他们通过编码抗性蛋白参与识别病原效应因子,进而引发细胞坏死等超敏反应,将有害生物限制在侵染位点,从而获得有效抗性。已有研究发现通过对参与病原效应子识别的结构域的修饰可以扩大R蛋白识别的病原微生物种类,从而增加其抗病谱。目前尚无根据其结构特征设计提高抗病蛋白活性的研究。关于R蛋白,根据NLR的N端结构域,这类受体蛋白可以被分为两大类,即N末端含有Toll-白细胞介素1受体(Toll/IL-1receptor,TIR)结构域的TIR-NBS-LRR受体和N末端含有卷曲螺旋(Coiled-coil,CC)结构域的CC-NBS-LRR受体两大类型。研究表明部分R蛋白的N末端单独表达时可以引发细胞坏死反应,但是对这种现象的机制解析还很少。近期植物中第一个抗病小体,CC-NBS-LRR受体ZAR1蛋白的激活过程被解析,ZAR1的CC区段可以在激活之后形成孔状结构,被认为具有离子通道的活性。另外后续TIR-NBS-LRR类蛋白RPP1的结构解析也证明,激活后的RPP1蛋白可以通过形成一个四聚体来发挥NAD

番茄斑萎病毒(Tomato spotted wilt orthotospovirus,TSWV)是布尼亚病毒中的一类侵染植物的病毒,大部分都是由昆虫介体传播。番茄斑萎病毒的寄主极其广泛,可以侵染超过50个属的800多种植物,包括像茄科,菊科等,造成多种作物严重的病害损失。目前为止,抗番茄斑萎病毒的自然的遗传资源很少,至今只鉴定了两个番茄斑萎病毒相关的抗性蛋白,分别是番茄中的Sw-5b和辣椒中的Tsw。其中Sw-5b蛋白特异性识别番茄斑萎病毒的移动蛋白(NSm)来发挥作用;而Tsw识别非结构蛋白(NSs),Tsw是一个近些年在辣椒中克隆的抗性基因,它编码的Tsw蛋白特异性的识别番茄斑萎病毒中的NSs蛋白,并引发植物的超敏反应激发抗性。这两个R蛋白的缺点是抗性谱较窄,而且近年来,抗性突破毒株不断涌现,另外Tsw介导的抗性较易受温度等外界生物或非生物环境因子影响。比如常见的多种病毒共感染或者高温等,都会导致抗性全部丧失。

对已有抗性基因进行定向改良是提高作物抗性和产量行之有效的方法。由R基因编码的胞内免疫受体蛋白NLR参与了植物对于病原体分子的感知和防御激活等过程,这对于植物的免疫进而是生存都至关重要。尽管有很多工作对于NLR蛋白的结构特征作出了解析,但是尚未涉及基于结构的对于NLR介导的抗性进行优化改良等方面。

发明内容

本发明所要解决的技术问题是如何通过R蛋白结构设计提高植物抗病性。

为了解决上述技术问题,本发明首先提供了提高植物中R蛋白对病毒抗性的方法。所述R蛋白可包含CC结构域。所述CC结构域从N端开始的第135-137位氨基酸可形成疏水区域。所述方法可包括使用定点突变的方法将所述R蛋白的CC结构域疏水区域中的氨基酸的编码核苷酸进行突变得到R突变体蛋白的步骤。所述R突变体蛋白对病毒的抗性反应高于所述R蛋白对病毒的抗性反应。

上文所述定点突变可为将所述R蛋白的CC结构域疏水区域中的酪氨酸的编码核苷酸突变为色氨酸的编码核苷酸,导致所述CC结构域从N端开始的第135-137位氨基酸中的酪氨酸突变为色氨酸。

上文所述定点突变的方法具体可为使用带有突变核苷酸的引物扩增目的片段,得到特定核苷酸位点核苷酸发生改变的定点突变后的目的片段。

上文所述植物可为下述任一种:

A1)单子叶植物;

B1)双子叶植物,

B2)管状花目,

B3)茄科,

B4)烟草属,

B5)烟草;

B6)辣椒属,

B7)辣椒;

B8)番茄属,

B9)番茄。

上文所述方法中,所述R蛋白可为辣椒Tsw蛋白。所述定点突变可为将序列表中序列2的第409-411位的TAT(酪氨酸的密码子)替换为TGG(色氨酸的密码子),保持序列2的其它核苷酸不变,导致序列表中序列1的137位的酪氨酸残基替换为色氨酸残基。

上文所述方法中,所述R蛋白可为番茄SlCNL-1蛋白。所述定点突变可为将序列表中序列4所示的第403-405位的TAT(酪氨酸的密码子)替换为TGG(色氨酸的密码子),保持序列4其它核苷酸不变,导致序列表中序列3的135位的酪氨酸残基替换为色氨酸残基。

上文所述病毒可为番茄斑萎病毒。

为了解决上述技术问题,本发明还提供了突变体蛋白。所述突变体蛋白为突变体蛋白A或突变体蛋白B。

所述突变体蛋白A可为由野生型Tsw蛋白进行1个氨基酸残基的替代构成的突变体蛋白。所述突变体蛋白A与所述野生型Tsw蛋白相比,可为在所述野生型Tsw蛋白从N端开始的第137位氨基酸残基发生替代。所述突变体蛋白A具有对病毒蛋白的抗性反应,且所述突变体蛋白A对病毒蛋白的抗性反应高于所述野生型Tsw蛋白对所述病毒的抗性反应。所述野生型Tsw蛋白可来源于辣椒。

所述突变体蛋白B可为由野生型SlCNL-1蛋白的卷曲螺旋(CC)结构域进行1个氨基酸残基的替代构成的突变体蛋白。所述突变体蛋白B与所述野生型SlCNL-1蛋白的卷曲螺旋(CC)结构域相比,可为在所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的第135位氨基酸残基发生替代。所述突变体蛋白B具有对病毒蛋白的抗性反应,且所述突变体蛋白B对病毒蛋白的抗性反应高于所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域对所述病毒的抗性反应。所述野生型SlCNL-1蛋白可来源于番茄。

上文所述从N端开始的第137位氨基酸残基可为序列表中序列1的第137位氨基酸残基。上文所述从N端开始的第135位氨基酸残基可为序列表中序列3的第135位氨基酸残基。

上文所述病毒可为番茄斑萎病毒。

上文所述野生型Tsw蛋白可为氨基酸序列是序列表中序列1的蛋白质。序列表中序列1的第1-169位可为氨基端的卷曲螺旋(CC)结构域的氨基酸序列。序列表中序列1的第170-491位可为核苷酸结合区(NBS)结构域。序列表中序列1的第492-2116位可为羧基端的亮氨酸重复区(LRR)结构域。

上文所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域可为氨基酸序列是序列表中序列3的蛋白质。

上文所述病毒可为番茄斑萎病毒。

上文所述突变体蛋白A可为将所述野生型Tsw蛋白从N端开始的第137位的酪氨酸氨基酸残基替代为色氨酸氨基酸残基得到的蛋白质。所述突变体蛋白B可为将所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的的第135位的酪氨酸氨基酸残基替代为色氨酸氨基酸残基得到的蛋白质。

上文所述突变体蛋白A还可为将所述野生型Tsw蛋白从N端开始的第137位的酪氨酸氨基酸残基替代为其他氨基酸残基得到的蛋白质。上文所述突变体蛋白B还可为将所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域从N端开始的第135位的酪氨酸氨基酸残基替代为其他氨基酸残基得到的蛋白质。

所述其它氨基酸可从r1)至r4)中选择:

r1)下述19种氨基酸中的任一种:丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)、苯丙氨酸(Phe)、色氨酸(Trp)、蛋氨酸(Met)、甘氨酸(Gly)、苏氨酸(Thr)、半胱氨酸(Cys)、酪氨酸(Tyr)、丝氨酸(Ser)、谷氨酰胺(Gln)、赖氨酸(Lys)、精氨酸(Arg)、组氨酸(His)、天冬氨酸(Asp)和谷氨酸(Glu);所述氨基酸的构象为L型;

r2)下述19种氨基酸中的任一种:丙氨酸(Ala)、缬氨酸(Val)、亮氨酸(Leu)、异亮氨酸(Ile)、脯氨酸(Pro)、苯丙氨酸(Phe)、色氨酸(Trp)、蛋氨酸(Met)、甘氨酸(Gly)、苏氨酸(Thr)、半胱氨酸(Cys)、酪氨酸(Tyr)、丝氨酸(Ser)、谷氨酰胺(Gln)、赖氨酸(Lys)、精氨酸(Arg)、组氨酸(His)、天冬氨酸(Asp)和谷氨酸(Glu);所述氨基酸的构象为D型;D型氨基酸是指与组成蛋白质的L型氨基酸相对应的氨基酸;

r3)对所述r1)或r2)进行化学修饰得到的人工修饰的氨基酸;

r4)自然界存在的稀有氨基酸。

所述r3)中的化学修饰可为甲基化或磷酸化等修饰。

所述自然界存在的稀有氨基酸包括组成蛋白质的不常见氨基酸和不组成蛋白质的氨基酸,例如5-羟基赖氨酸、甲基组氨酸或γ氨基丁酸等。

上述突变体蛋白中,所述其它氨基酸可为C1或C2:

C1、非极性氨基酸或极性氨基酸;

C2、所述其它氨基酸为缬氨酸、甘氨酸、丙氨酸或亮氨酸。

上述突变体蛋白中,所述突变体蛋白A与所述野生型Tsw蛋白相比,在序列上只是所述野生型Tsw蛋白的全长序列的第137位氨基酸残基发生替代,其它氨基酸残基没有发生替代。具体地,上述突变体蛋白中,所述突变体蛋白与所述野生型Tsw蛋白相比,在序列上只有所述野生型Tsw蛋白的全长序列的第137位氨基酸残基不同,其它氨基酸残基均相同。

上述突变体蛋白中,所述突变体蛋白B与所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域相比,在序列上只是所述野生型SlCNL-1蛋白的全长序列的第135位氨基酸残基发生替代,其它氨基酸残基没有发生替代。具体地,上述突变体蛋白中,所述突变体蛋白与所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域相比,在序列上只有所述野生型SlCNL-1蛋白卷曲螺旋(CC)结构域的全长序列的第135位氨基酸残基不同,其它氨基酸残基均相同。

上文所述突变体蛋白可为D1或D2中的任一种:

D1、氨基酸序列是将序列表中序列1的第137位的酪氨酸残基突变为色氨酸残基,保持序列1的其它氨基酸残基均不变得到的蛋白质;

D2、氨基酸序列是将序列表中序列3的第135位的酪氨酸残基突变为色氨酸残基,保持序列3的其它氨基酸残基均不变得到的蛋白质。

为了解决上述技术问题,本发明还提供了上文所述的方法和/或上文所述的突变体蛋白的下述任一种应用:

P1、上文所述的方法和/或上文所述的突变体蛋白在制备植物抗病原菌产品中的应用;

P2、上文所述的方法和/或上文所述的突变体蛋白在提高植物抗病性中的应用;

P3、上文所述的方法和/或上文所述的突变体蛋白在植物抗病育种或品种改良中的应用。

上文所述抗病性可为植物对番茄斑萎病毒的抗性。

本发明通过分子遗传分析,证明了基于已知R蛋白的结构信息,结合分子手段,对R蛋白进行分子优化和改良,进一步丰富植物中的抗性资源。本发明发现辣椒Tsw蛋白的N端CC结构域的第135-137位的疏水槽区段,可以用于优化类似Tsw这样进化不完善的R蛋白。通过点突变来增强其疏水作用力,进而达到稳定加强R蛋白抗性功能的目的。因此开发出一种基于蛋白结构的,对于Tsw抗性蛋白的改良方式,可以通过增强植物本身的抗性反应强烈程度,从而达到增强抗病的效果。这一方法适用于Tsw蛋白及其在番茄中的同系物SlCNL-1蛋白,它们共属于同一进化分枝,这一方法有被应用于通过基因定点编辑实现抗性育种的潜力。

附图说明

图1为Tsw各个结构域的功能验证。(a)Tsw结构示意图;(b)Tsw各个结构域能否识别NSs的功能验证Tsw-GFP,CC-GFP,NBS-GFP,LRR-GFP分别与NSs共注射于烟草叶片中,3天后观察细胞坏死情况;(c)免疫印迹实验验证各个蛋白表达情况,α-GFP代表显影使用商业化单克隆抗体GFP;(d)Tsw-GFP,CC-GFP,NBS-GFP,LRR-GFP单独注射烟草,3天后观察细胞坏死情况。

图2为CC结构域不同截短肽段对病毒的抗性分析。(a-b)CC结构域1-137位氨基酸肽段是发挥抗病功能的最短区段;(c)Tsw与ZAR1的疏水区(135-137aa)的结构比对(左图),Tsw以及Tsw

图3为Tsw

图4为SlCNL-1蛋白CC结构域N端开始第135位氨基酸突变为不同氨基酸后后的抗性分析。(a)SlCNL-1蛋白的CC结构域及其点突变蛋白(CC

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。

下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例一、突变R蛋白Tsw

1.辣椒Tsw蛋白重要功能位点确定

1.1辣椒Tsw蛋白功能结构域分析

从辣椒(Capsicum chinense)中分离得到的野生型Tsw蛋白全长由2116个氨基酸残基组成(序列表中序列1),其编码链的核苷酸序列如序列表中序列2所示。Tsw蛋白通过特异性识别非结构蛋白NSs并引发植物的超敏反应激发抗性,进而引发细胞坏死来发挥作用。通过序列比对分析,Tsw蛋白被分为三个结构域,分别是氨基端的卷曲螺旋(CC)结构域(序列表中序列1的第1-169位),核苷酸结合区(NBS)结构域(序列表中序列1的第170-491位)和一个羧基端的亮氨酸重复区(LRR)结构域(序列表中序列1的第492-2116位)。

首先将Tsw的编码密码子进行了优化,之后将Tsw蛋白及Tsw蛋白的三个结构域的编码基因分别通过常规分子克隆的方法构建到pGDGm载体上,分别获得了重组表达载体Tsw-GFP、CC-GFP、NBS-GFP和LRR-GFP。随后将测序阳性的四个重组表达载体质粒分别转入农杆菌EHA105,利用得到的重组农杆菌与番茄斑萎病毒的NSs蛋白共注射本生烟叶片,进行EHA105介导的烟草瞬时表达,3天后观察细胞坏死情况,从而验证Tsw蛋白及Tsw蛋白的三个结构域的功能。

图1中(b)的瞬时表达结果显示,编码密码子优化后翻译得到的Tsw蛋白依然可以很好的识别NSs蛋白,导致烟草叶片细胞的抗性反应强烈而引发细胞坏死;并且CC结构域具有和完整Tsw蛋白同样的功能,可以引发细胞坏死。进一步的研究发现,单独注射CC结构域进行瞬时表达就可以引发细胞坏死反应(图1中(d)),因此本发明接下来将进一步的改良设计区域放在了CC区段。

Tsw蛋白及Tsw蛋白的三个结构域的正确表达通过免疫印迹实验得到验证(图1中(c))。

1.2辣椒Tsw蛋白功能结构域关键位点分析

为了更好地改良辣椒Tsw蛋白的抗性,本发明首先研究了CC结构域基本的分子机制。首先验证了发挥主要作用的CC区段,将CC结构域的N端和C端分别构建截短突变体,验证了CC的N末端对于其功能发挥至关重要,并且找到了CC发挥功能的最短区段,即长度为1-137氨基酸的肽段(序列表中序列1的第1-137位)是功能必须的(图2中(a-b))。确定了最短功能域以后,将CC结构域1-137位氨基酸肽段和已知的CC-NBS-LRR受体ZAR1结构比对后发现,CC结构域从N端开始的第135-137位氨基酸(即序列表中序列135-137位氨基酸)形成的疏水区域有可以改造的空间,特别是137位的疏水氨基酸尤为重要。后续本发明构建了一系列定点突变,发现当把Tsw蛋白从N端(氨基端)开始的(即CC结构域从N端开始)的第137位(序列表中序列1的第137位)的酪氨酸突变为结构上相近但是疏水功能更强的色氨酸时(图2中(d-e)中的“ⅤCC

2.突变蛋白Tsw

2.1定点突变野生型Tsw蛋白获得突变体蛋白Tsw

通过步骤1对Tsw蛋白CC结构域的分析找到功能增强的突变位点后,本发明在Tsw蛋白中对这个位点进行了突变,得到了Tsw

人工合成了Tsw蛋白的编码核苷酸序列(序列表中序列4),之后以此为模板,通过使用引物(m-cc-1R(Y137W):

重组农杆菌EHA105/Tsw

2.2突变蛋白Tsw

利用农杆菌介导的瞬时表达体系,验证Tsw

首先将步骤2.1中得到的重组农杆菌EHA105/Tsw

使用1mL注射器在不同本生烟(Nicotiana benthamiana)叶片背面注射上述三种农杆菌侵染液,实验重复三次,每种农杆菌侵染液注射10个烟草叶片。两天后注射三种农杆菌侵染液后分别瞬时表达带GFP标签的Tsw

其中,摩擦接种实验过程为:将感染番茄斑萎病毒的烟草叶片在液氮中研磨成粉末,加入适量接种缓冲液(0.05M磷酸缓冲液中加入0.01%巯基乙醇,0.05%亚硫酸钠),混匀之后,在预先撒上金刚砂的烟草叶片上,用食指轻轻涂抹含有病毒的缓冲液,之后放在黑暗下12h,放入温室正常生长。

结果如图3所示,6天后,Tsw

3、番茄中的SlCNL-1蛋白的定点突变蛋白功能分析

针对这一位点的改造,同样在番茄中的SlCNL-1蛋白中得到了验证。SlCNL-1与Tsw同属一个进化分枝,通过比对分析,在野生型SlCNL-1蛋白的N末端存在一个同Tsw一样的疏水结构簇。野生型SlCNL-1蛋白氨基端的卷曲螺旋(CC)结构域的氨基酸序列如序列表中序列3所示,SlCNL-1蛋白CC结构域的编码链的核苷酸序列如序列表中序列4所示。

通过使用步骤2.1相同的定点突变方法将SlCNL-1蛋白CC结构域从N端开始的第135位的酪氨酸(序列表中序列3的第135位)突变为色氨酸以后得到SlCNL-1蛋白CC结构域定点突变蛋白CC

同时,使用步骤2.1相同的定点突变方法将SlCNL-1蛋白CC结构域(下面简称SlCNL-1-CC)从N端(氨基端)开始(即从CC结构域N端开始)的第135位(序列表中序列3的第135位)的酪氨酸突变为谷氨酸得到突变体蛋白CC

疏水结构域由酪氨酸到色氨酸的突变明显增强了SlCNL-1蛋白的SlCNL-1-CC区段引发细胞坏死的能力(图4中CC

综上,本发明发现了一种基于结构分析的,对于抗病蛋白定点突变获得增强抗性的方案,已证明这种策略可以提高辣椒Tsw以及其同系物番茄SlCNL-1蛋白SlCNL-1-CC区段的抗性反应。这一策略中所针对的关键疏水氨基酸位点在多个类型植物的抗性蛋白中保守存在,因此这一方案有望在辣椒或番茄等茄科及其它作物中应用,以达到抗病增产的目的。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

序列表

<110> 中国科学院微生物研究所

<120> 一种基于结构的抗病蛋白改良的方法及获得的突变蛋白质

<130> GNCSQ211557

<160> 4

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2116

<212> PRT

<213> 辣椒(Capsicum chinense)

<400> 1

Met Glu Met Val Thr Asn Ile Leu Ser Pro Val Ala Glu His Leu Ile

1 5 10 15

Ile Pro Pro Val Val Arg Gln Ile Gly Tyr Leu Phe Tyr Tyr Arg Arg

20 25 30

Asn Ile Arg Ser Leu Asp Glu Glu Ser Asn Lys Leu Glu Asn Ile Arg

35 40 45

Ser Gly Val Asn Gln Arg Val Glu Ala Ala Arg Arg Asn Leu Gln Val

50 55 60

Ile Ser Pro Asn Val Glu Ala Trp Leu Thr Ser Val Asp Thr Thr Thr

65 70 75 80

Ala Asp Val Ala Val Val Met Gly Gly Arg Thr Glu Val Glu Arg Gly

85 90 95

Cys Ile Tyr Gly Trp Cys Pro Thr Leu Lys Ser Arg Tyr Leu Leu Ser

100 105 110

Arg Arg Ala Lys Lys Ile Thr Leu Glu Val Thr Lys Leu Gln Lys Glu

115 120 125

Gly Asn Glu Tyr Ala Val Phe Cys Tyr Pro Val Pro Ala Asp Glu Ile

130 135 140

Glu Ala Ile Pro Ser Asn Thr Asn Glu Glu Phe Val Ser Arg Lys Gln

145 150 155 160

Lys Glu Glu Glu Val Met Thr Ala Leu Lys Asp Glu Glu Ile Thr Ile

165 170 175

Val Gly Ile Cys Gly Met Gly Gly Val Gly Lys Thr Ser Leu Ala Glu

180 185 190

Lys Val Arg Ala Arg Ala Lys Gln Glu Arg Leu Phe Asn Asp Val Val

195 200 205

Met Val Thr Val Ser Gln Gln Gln Asp Leu Lys Arg Ile Gln Gly Glu

210 215 220

Ile Ala Gly Glu Val Gly Leu Thr Ser Leu Gln Gly Asp Asn Leu Leu

225 230 235 240

Ser Arg Gly Asp Gln Leu Arg Ala Arg Leu Met Gln Glu Gly Ser Arg

245 250 255

Val Leu Val Ile Leu Asp Asp Val Trp Glu Ala Leu Asp Asp Leu Glu

260 265 270

Lys Leu Gly Ile Pro Thr Gly Ser Asn His Asn Tyr Gln Cys Lys Val

275 280 285

Ala Leu Thr Thr Arg Arg Gln Asp Val Cys Asp Ala Met Lys Ala Gln

290 295 300

Lys Thr Val Asp Val Val Ile Leu Ser Asp Glu Glu Ala Trp Val Leu

305 310 315 320

Phe Arg Gln Lys Ala Gly Tyr Ser Ala Asp Asp Pro Ser Leu Ser Glu

325 330 335

Val Ala Lys Glu Val Ala Lys Glu Cys Lys Gly Leu Pro Leu Ala Ile

340 345 350

Val Ile Val Ala Gly Ala Leu Lys Thr Lys Thr Lys Pro Ser Trp Asp

355 360 365

Asp Ala Leu Val Glu Leu Arg Lys Ala Ser Pro Lys Asn Ile Pro Arg

370 375 380

Val Leu Thr Lys Val Tyr Gln Pro Leu Lys Thr Ser Tyr Asp His Leu

385 390 395 400

Glu Ser Asp Glu Ala Arg Tyr Val Phe Leu Leu Cys Ser Leu Phe Glu

405 410 415

Glu Asp Ser Asp Ile Trp Thr Glu Glu Leu Leu Lys Tyr Gly Val Gly

420 425 430

Leu Gly Ile Phe Ser Glu Leu Glu Asn Leu Glu Cys Ala Arg Asn Arg

435 440 445

Val Cys Asn Leu Leu Glu Thr Leu Lys Asn Cys Phe Leu Leu Ser Gln

450 455 460

Gly Lys Asp Lys Asn Tyr Val Lys Met His Asp Val Val Arg Asp Val

465 470 475 480

Ala Ile Tyr Ile Ala Ser Glu Gly Glu His Lys Phe Leu Val Asn His

485 490 495

Asn Val Asn Ser Asn Val Phe Leu Arg Lys Val Ser Tyr Glu Gln Tyr

500 505 510

Ser His Met Ser Ile Val Ala Asn Lys Phe Asp Glu Arg Pro Thr Pro

515 520 525

Ile Phe Cys Pro Arg Leu Lys Leu Leu Met Leu Lys Leu Arg Phe Glu

530 535 540

Glu Gly Phe Lys Leu Gln Asp Asp Phe Phe Asp Gly Met Ser Glu Leu

545 550 555 560

Ser Val Ile Lys Leu Ser Gly Tyr Asp Arg Asn Ser Ile Leu Pro Phe

565 570 575

Pro Ser Ser Ile Gln Arg Leu Ser Asn Leu Ser Thr Leu Trp Leu Ser

580 585 590

Asn Leu Arg Leu Asp Asp Val Ser Ile Ile Gly Lys Leu Val Thr Leu

595 600 605

Glu Ile Leu Ser Ile Arg Gly Ser Asp Leu Gln Glu Leu Pro Val Glu

610 615 620

Ile Gly Asn Leu Ala Asn Leu Thr Met Leu Glu Tyr Trp Asn Thr Gly

625 630 635 640

Tyr Arg Lys Arg Met Arg Ile Ser Pro Gly Val Leu Ser Arg Leu Val

645 650 655

Arg Leu Glu Glu Leu His Met Val Gly Val Glu Asp Cys Ser Tyr Ser

660 665 670

Thr Leu Arg Glu Leu Glu Ser Leu Ser Arg Leu Thr Ala Leu Ala Phe

675 680 685

Asp Glu Cys Ser Val Asp Val Ile Tyr Ser Asn Leu Gly Leu Ser Ser

690 695 700

Lys Leu Thr Arg Tyr Ala Leu Lys Met Gly Arg His Tyr Thr Phe Thr

705 710 715 720

Ser Phe Met Glu Thr Tyr Asn Lys Ala Ile Asp Leu Asp Val Thr Lys

725 730 735

Gly Thr Pro Leu Gly Asp Trp Ile Cys Leu Leu Leu Arg Asn Ser Glu

740 745 750

Val Val His Ser Arg Gly Lys Gly Ser Lys Asn Val Met Val Glu Leu

755 760 765

Gln Asn Val Lys Asp Leu Met Leu Ser Asp Cys Asp Ser Leu Asn Ile

770 775 780

His Tyr Gln Asn Asn Ile Ser Phe Pro Glu Leu Glu Arg Leu Glu Val

785 790 795 800

Arg Tyr Cys Asp Tyr Leu Arg His Leu Phe Cys Val Ser Leu Ala Cys

805 810 815

Pro Asp Glu Gly Thr Ser Arg Arg Thr His Ile Arg Pro Asp Val Ile

820 825 830

Lys Phe Pro Asn Leu His Ser Leu Thr Leu Arg Asn Leu Glu Phe Phe

835 840 845

Thr His Phe Tyr Ser Asp Thr Val Glu Gly Ile Glu Phe Pro Leu Leu

850 855 860

Arg Val Ile Tyr Leu Arg Gly Leu Pro Glu Phe Gln Asn Phe Trp Pro

865 870 875 880

Thr Ala Asn Asn Ala Ile Thr Asp Ser Asn Pro Leu Phe Asn Glu Lys

885 890 895

Val Ser Cys Pro Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Ser

900 905 910

Ile Thr Ala Leu Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys

915 920 925

Leu Glu Thr Leu Lys Val Glu Asn Cys Gly Lys Leu Arg His Leu Met

930 935 940

Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu

945 950 955 960

Glu Tyr Cys Glu Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu

965 970 975

Gly Asp Glu Ile Met Cys Asn Glu Pro Leu Phe Pro Gln Leu Glu Glu

980 985 990

Leu Glu Leu Gln Asn Leu Pro Lys Leu Arg His Phe Ile Leu Thr Lys

995 1000 1005

Gln Ala Leu Glu Phe Pro Phe Leu Ile Glu Val Lys Ile Arg Asn Cys

1010 1015 1020

Pro Glu Met Lys Met Leu Val Gln Arg Arg Phe Val Ser Thr Ser Ser

1025 1030 1035 1040

Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn

1045 1050 1055

Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu Lys Val Leu

1060 1065 1070

Lys Leu His Glu Ala Asn Asn Ile Thr Ala Leu Cys Ser His Gln Leu

1075 1080 1085

Pro Thr Thr Tyr Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys

1090 1095 1100

Gly Lys Leu Arg His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu

1105 1110 1115 1120

Asn Leu Arg Ile Leu Leu Leu Gly Tyr Cys Glu Ser Met Glu Glu Val

1125 1130 1135

Ile Ile Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr Asn Glu Pro

1140 1145 1150

Leu Phe Pro Leu Leu Glu Glu Leu Ile Leu Asp Lys Leu Pro Lys Leu

1155 1160 1165

Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro Phe Leu Arg

1170 1175 1180

Glu Val Lys Ile Arg Lys Cys Pro Glu Met Lys Met Leu Val Gln Gln

1185 1190 1195 1200

Arg Ser Val Ser Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu

1205 1210 1215

Leu Lys Val Val Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser

1220 1225 1230

Cys Pro Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Ser Ile Thr

1235 1240 1245

Ala Leu Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Glu

1250 1255 1260

Thr Leu Glu Val Glu Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro

1265 1270 1275 1280

Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu Gly Tyr

1285 1290 1295

Cys Glu Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu Gly Glu

1300 1305 1310

Glu Asn Met Thr Asn Glu Pro Leu Phe Pro Leu Leu Glu Glu Leu Ile

1315 1320 1325

Leu Asp Lys Leu Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala

1330 1335 1340

Leu Glu Phe Pro Phe Leu Arg Glu Val Lys Ile Arg Lys Cys Pro Glu

1345 1350 1355 1360

Met Lys Met Leu Val Gln Gln Arg Ser Val Ser Thr Ser Ser Leu Lys

1365 1370 1375

Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn Lys Ala

1380 1385 1390

Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu Lys Val Leu Lys Leu

1395 1400 1405

His Glu Ala Asn Asn Ile Thr Ala Leu Cys Ser His Gln Leu Pro Thr

1410 1415 1420

Thr Tyr Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys Gly Lys

1425 1430 1435 1440

Leu Arg His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu

1445 1450 1455

Arg Ile Leu Leu Leu Gly Tyr Cys Glu Ser Met Glu Glu Val Ile Ile

1460 1465 1470

Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr Asn Glu Pro Leu Phe

1475 1480 1485

Pro Leu Leu Glu Glu Leu Ile Leu Asp Lys Leu Pro Lys Leu Gly His

1490 1495 1500

Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro Phe Leu Arg Glu Val

1505 1510 1515 1520

Lys Ile Arg Lys Cys Pro Glu Met Lys Met Leu Val Gln Gln Arg Ser

1525 1530 1535

Val Ser Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys

1540 1545 1550

Val Val Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro

1555 1560 1565

Asn Leu Lys Val Leu Lys Leu His Glu Ala Asn Asn Ile Thr Ala Leu

1570 1575 1580

Cys Ser His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Glu Thr Leu

1585 1590 1595 1600

Glu Val Glu Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro Ser Val

1605 1610 1615

Ala Arg Gly Leu Leu Asn Leu Arg Ile Leu Leu Leu Gly Tyr Cys Glu

1620 1625 1630

Ser Met Glu Glu Val Ile Ile Glu Glu Glu Gln Glu Gly Glu Glu Asn

1635 1640 1645

Met Thr Asn Glu Pro Leu Phe Pro Leu Leu Glu Glu Leu Ile Leu Asp

1650 1655 1660

Lys Leu Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu

1665 1670 1675 1680

Phe Pro Phe Leu Arg Glu Val Lys Ile Arg Lys Cys Pro Glu Met Lys

1685 1690 1695

Met Leu Val Gln Gln Arg Ser Val Ser Thr Ser Ser Leu Lys Ser Val

1700 1705 1710

Asn Asn Asp Asp Glu Leu Lys Val Val Asp Leu Asn Lys Ala Met Phe

1715 1720 1725

Asn Ser Lys Val Ser Cys Pro Asn Leu Glu Leu Leu Arg Leu Tyr Lys

1730 1735 1740

Ala Asn Ser Val Gly Ser Leu Phe Ser His Gln Leu Pro Thr Thr Tyr

1745 1750 1755 1760

Phe Ser Lys Leu Glu Thr Leu Glu Val Glu Asn Cys Gly Lys Leu Arg

1765 1770 1775

His Leu Met Ser Pro Ser Val Ala Arg Gly Leu Leu Asn Leu Arg Ile

1780 1785 1790

Leu Ile Leu Arg Asp Cys Glu Ser Met Glu Glu Val Ile Thr Glu Glu

1795 1800 1805

Glu Gln Glu Gly Asp Glu Ile Met Cys Asn Glu Pro Leu Phe Pro Gln

1810 1815 1820

Leu Glu Glu Leu Lys Leu Glu Asn Leu Pro Lys Leu Arg His Phe Ile

1825 1830 1835 1840

Leu Thr Lys Gln Ala Leu Glu Ile Pro Phe Leu Ile Glu Val Gln Ile

1845 1850 1855

Arg Asn Cys Pro Glu Met Lys Met Leu Val Gln Gln Arg Ser Val Ser

1860 1865 1870

Thr Ser Ser Leu Lys Ser Val Asn Asn Asp Asp Glu Leu Lys Val Val

1875 1880 1885

Asp Leu Asn Lys Ala Met Phe Asn Ser Lys Val Ser Cys Pro Asn Leu

1890 1895 1900

Glu Leu Leu Arg Leu Tyr Lys Ala Asn Ser Val Gly Ser Leu Phe Ser

1905 1910 1915 1920

His Gln Leu Pro Thr Thr Tyr Phe Ser Lys Leu Met Gln Leu Gly Ile

1925 1930 1935

Arg Asn Cys Gly Lys Leu Arg His Leu Met Ser Pro Ser Val Ala Arg

1940 1945 1950

Gly Leu Leu Asn Leu Arg Ile Leu Ile Leu Gly Asp Cys Glu Ser Met

1955 1960 1965

Glu Glu Val Ile Thr Glu Glu Glu Gln Glu Gly Glu Glu Asn Met Thr

1970 1975 1980

Asn Glu Ser Leu Phe Pro Cys Leu Glu Met Leu Lys Leu Glu Asn Leu

1985 1990 1995 2000

Pro Lys Leu Gly His Phe Phe Leu Thr Lys Arg Ala Leu Glu Phe Pro

2005 2010 2015

Phe Leu Arg Glu Val Lys Ile Arg Thr Cys Pro Glu Met Lys Ile Phe

2020 2025 2030

Val Gln His Gly Ser Val Ser Thr Pro Ser Leu Glu Ile Val Asn Asn

2035 2040 2045

Asp Asp Glu Val Lys Val Asp Asp Leu Asn Glu Trp Ile His Gln Arg

2050 2055 2060

Phe Asn Ser Lys Glu Glu Asp Gly Ser Glu Ser Glu Ser Ser Gln Glu

2065 2070 2075 2080

Glu Asp Gly Ser Glu Ser Glu Ala Ser His Glu Asp Gly Ser Lys Cys

2085 2090 2095

Glu Ala Ser Gln Glu Glu Asp Arg Ser Glu Ser Glu Asp Ser Met Ser

2100 2105 2110

Asp Gly Arg Ser

2115

<210> 2

<211> 6351

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

atggaaatgg taactaatat tttgagccca gtcgcagaac acttgatcat accgccagtt 60

gtgcgacaga ttgggtattt gttttactat aggcgcaaca tcaggtctct ggatgaagaa 120

tctaataagc tcgagaatat cagaagtggg gtgaatcaaa gagtggaggc tgcccggaga 180

aacttacaag tcatttcacc caatgttgag gcttggttaa ctagtgttga tactactact 240

gctgatgtgg cagttgtaat gggaggtcga actgaggttg aaaggggttg catctacggt 300

tggtgtccaa cattgaagtc acgttacttg ctgagcagga gagccaagaa aattacactg 360

gaagttacta aacttcaaaa ggaaggtaac gagtatgctg ttttctgcta tccggttcca 420

gctgatgaaa ttgaagctat acctagtaac actaatgagg agtttgtctc tagaaaacag 480

aaggaggaag aggtcatgac agctttgaaa gatgaggaga tcactattgt tgggatatgt 540

ggtatgggtg gtgttggtaa aacatcactg gctgagaaag taagagcaag ggcaaaacaa 600

gaaaggttat ttaatgatgt tgtcatggta actgtcagtc aacaacaaga cctgaaaaga 660

attcagggcg agatcgccgg agaggtcggg ctgacgtcat tgcaaggaga caatttgtta 720

agtcgtggag atcagctgcg tgcaaggtta atgcaagaag gaagtcgcgt ccttgtaatt 780

ttggatgatg tttgggaggc tcttgatgat ctagagaaac ttggaattcc cactggcagc 840

aaccacaact atcagtgcaa agtggcattg acgacgcgcc gccaagatgt ttgtgacgct 900

atgaaggctc aaaagactgt agatgttgta atcttatctg atgaagaagc atgggtcctt 960

tttaggcaga aagccggtta ttcagctgat gatccctctc tttctgaagt agcaaaagaa 1020

gttgccaaag aatgcaaggg gctgccactt gcaattgtta ttgttgcagg agcactaaag 1080

actaaaacca agccttcatg ggatgatgcc cttgtagaat taagaaaagc atcaccaaaa 1140

aatatcccaa gagtgcttac aaaggtgtat caacctctga agacaagcta tgatcactta 1200

gagagtgatg aagccaggta tgtctttttg ctttgttcct tgtttgagga agatagtgat 1260

atttggaccg aagaattact taaatatgga gtgggacttg gcatcttttc ggaactcgaa 1320

aatttagaat gtgcaagaaa tagggtgtgt aatctgttag aaacattgaa aaattgtttc 1380

ttgttatccc aaggtaaaga caaaaattat gtcaaaatgc atgatgtggt ccgtgacgtg 1440

gctatatata ttgcgtctga gggtgagcat aaatttttgg tgaaccacaa cgtgaactct 1500

aacgtttttt tgaggaaggt ttcttatgaa cagtattctc atatgtctat cgtggcaaac 1560

aaattcgacg agaggccaac accaatcttc tgccctaggc ttaagctttt gatgttgaaa 1620

cttagattcg aggaaggttt taaacttcaa gatgatttct ttgacggaat gtctgagctt 1680

tcagttatta aactttctgg ttacgatagg aactctatct tgccatttcc ttcttctatt 1740

caaagattgt ctaatttgtc tacactttgg ctttcaaatc ttagattgga tgatgtgtct 1800

attattggta aacttgtgac tcttgaaatc ctttctatta ggggttctga tcttcaagag 1860

cttccagttg agatcggtaa cttggctaat cttactatgc ttgagtactg gaatactgga 1920

tacagaaaga ggatgagaat ttcaccgggt gtgttgtcaa ggttggtgag acttgaggag 1980

ttgcacatgg ttggtgttga agactgctct tactctactt tgagagagct tgaatctttg 2040

tctaggttga cagctttggc attcgacgag tgttctgttg acgtgatcta ctctaacctt 2100

ggactttctt caaagcttac taggtacgca ttgaagatgg gtagacacta tactttcaca 2160

tcttttatgg aaacatacaa caaagcaatt gaccttgacg tgactaaggg aactccactt 2220

ggagactgga tttgcttgtt gttgaggaac tctgaggtgg tgcactcaag gggtaaggga 2280

tctaagaacg ttatggtgga gcttcaaaac gttaaagact tgatgttgtc agactgtgat 2340

tctcttaaca tccattacca gaacaacatt tcattcccag aattggagag gttggaggtg 2400

aggtactgtg actatcttag acatcttttc tgcgtgtctc ttgcttgccc agatgagggt 2460

acttctagga ggacacacat tagaccagat gttattaaat tcccaaattt gcactcactt 2520

acattgagga accttgagtt ctttacacac ttctactcag acacagtgga gggtatcgaa 2580

ttccctcttt tgagggtgat ctaccttagg ggattgccag agttccagaa cttctggcca 2640

actgctaaca atgcaattac tgattcaaat ccacttttca atgagaaggt ttcttgtcca 2700

aacttgaagg ttcttaaatt gcatgaagca aactctatca ctgcattgtg ttcacaccag 2760

cttcctacta cttatttttc aaaattggag actttgaagg tggaaaactg cggtaagttg 2820

aggcatctta tgtcaccttc agtggctagg ggtttgctta atcttaggat tcttttgttg 2880

gagtactgcg agtctatgga agaggtgatc atcgaagagg aacaagaagg tgatgagatc 2940

atgtgcaatg aaccattgtt tccacagttg gaggagttgg aacttcagaa cttgccaaag 3000

ttgaggcatt ttattcttac aaaacaagct ttggagtttc cattccttat cgaagttaag 3060

atcagaaact gcccagaaat gaaaatgctt gtgcagagga gattcgtttc tacatcttca 3120

ttgaaatctg ttaataacga cgacgagttg aaggttgttg atcttaacaa ggcaatgttt 3180

aattcaaaag tttcatgtcc taatttgaag gttttgaaac ttcatgaggc taataatatt 3240

acagcattgt gctctcatca gcttccaact acatacttct ctaaattgga gacacttgaa 3300

gttgagaatt gtggaaagct tagacatctt atgtctccat ctgttgcaag gggtttgttg 3360

aaccttagga tccttcttct tggttactgt gaatctatgg aggaagtgat tatcgaagaa 3420

gagcaagagg gagaagagaa catgactaat gaacctcttt ttcctctttt ggaagaactt 3480

attttggata agttgcctaa gttgggtcac ttctttctta caaaaagggc acttgaattt 3540

ccattcttga gagaagttaa aattaggaaa tgcccagaaa tgaagatgct tgtgcagcaa 3600

aggtcagttt ctacatcatc tcttaagtca gttaacaacg atgacgagtt gaaagttgtg 3660

gatttgaata aagcaatgtt taactcaaaa gtttcttgtc caaaccttaa agttttgaag 3720

cttcacgagg ctaattctat tacagctttg tgttcacatc aacttcctac tacatatttt 3780

tctaaattgg agactttgga ggtggagaat tgcggtaaat tgaggcacct tatgtcacct 3840

tcagttgcaa ggggacttct taatttgaga attcttttgc ttggatattg tgagtcaatg 3900

gaggaagtga ttattgagga agaacaagaa ggagaggaaa acatgacaaa tgagcctttg 3960

ttcccattgc ttgaggaact tatccttgat aagcttccta aacttggaca ctttttcctt 4020

acaaagagag cattggaatt tccttttttg agggaggtga aaattagaaa gtgtccagaa 4080

atgaagatgc ttgtgcagca aaggtcagtg tcaacatcat ctttgaagtc agtgaacaat 4140

gacgacgaac ttaaggtggt ggacttgaat aaagcaatgt tcaattctaa ggtgtcatgc 4200

cctaacctta aagtgttgaa attgcacgag gcaaataata tcactgctct ttgttcacac 4260

caattgccta caacttattt ctctaagttg gaaactcttg aagtggagaa ttgtggaaaa 4320

cttaggcatt tgatgtcacc ttctgttgct agaggacttc ttaaccttag aattttgctt 4380

ttgggttact gcgaatcaat ggaagaagtg atcatcgaag aggaacaaga aggtgaggag 4440

aatatgacta acgagccttt gtttccattg ttggaggagc ttattcttga taaacttcca 4500

aagttgggtc atttcttctt gacaaagagg gcacttgagt tcccattttt gagagaggtt 4560

aagattagaa aatgcccaga aatgaagatg cttgtgcaac aaagatctgt gtctacttct 4620

tcattgaagt ctgttaacaa tgacgatgag ttgaaagtgg ttgacttgaa caaggcaatg 4680

tttaactcta aagtttcttg cccaaatctt aaggtgctta agcttcatga ggcaaacaat 4740

atcactgcac tttgctcaca tcagttgcca actacttact tttctaagct tgaaactttg 4800

gaggtggaaa attgcggaaa acttaggcac ttgatgtcac catcagttgc aaggggtctt 4860

cttaacttga ggattttgtt gttgggttat tgcgaatcta tggaagaagt tattatcgag 4920

gaggagcaag aaggtgaaga aaatatgact aacgaacctc tttttccact tcttgaagag 4980

ttgatcttgg acaaacttcc aaaattggga catttttttc ttactaagag ggctttggag 5040

tttcctttcc ttagagaggt gaagattaga aagtgcccag aaatgaagat gcttgttcag 5100

cagagatcag tgtcaacttc ttctttgaaa tcagttaata atgacgatga attgaaagtg 5160

gtggatctta acaaagctat gtttaactct aaagtgtctt gcccaaatct tgagttgttg 5220

agattgtaca aggcaaactc tgttggttct cttttctcac accagcttcc aacaacttat 5280

ttctctaaac ttgagacact tgaggtggag aactgtggaa aattgaggca tcttatgtct 5340

ccatctgttg ctaggggatt gttgaacttg aggatcctta ttttgagaga ttgtgagtca 5400

atggaagaag ttattactga ggaggagcaa gaaggagacg agatcatgtg taacgaacct 5460

ttgtttcctc aacttgaaga attgaaactt gaaaatttgc caaagcttag acactttatc 5520

ttgacaaagc aagctcttga aatccctttt cttattgagg ttcaaattag gaactgccca 5580

gaaatgaaga tgttggttca gcagaggtct gtttcaactt catcacttaa gtctgtgaac 5640

aatgatgatg aacttaaggt ggtggacctt aataaggcta tgttcaactc taaggtgtct 5700

tgtcctaatt tggagcttct tagactttat aaagcaaatt ctgtgggatc tcttttttct 5760

caccaacttc ctacaacata tttctctaaa cttatgcagc ttggaattag aaattgcggt 5820

aagttgagac atttgatgtc accttcagtg gcaagaggtc ttttgaatct tagaatcctt 5880

atccttggtg actgcgaatc tatggaggaa gttatcactg aggaggaaca agaaggtgag 5940

gaaaacatga caaacgaatc tcttttccca tgtcttgaga tgttgaaatt ggaaaacctt 6000

ccaaagcttg gacatttttt cttgactaaa agagctcttg agttcccttt ccttagggaa 6060

gtgaaaatta gaacttgccc agagatgaaa atctttgttc agcatggatc tgtttcaaca 6120

ccttcattgg agattgttaa caacgacgac gaggtgaagg tggacgactt gaatgagtgg 6180

attcaccaaa gatttaattc aaaagaggag gacggttctg agtcagagtc ttcacaagaa 6240

gaggatggat ctgagtctga ggcttcacat gaggacggat ctaagtgcga agcttctcaa 6300

gaggaggata ggtcagagtc tgaggattct atgtcagacg gtaggtctta a 6351

<210> 3

<211> 158

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Met Glu Phe Phe Ser Tyr Gly Leu Val Asp Lys Val Thr Gly Cys Leu

1 5 10 15

Ile Lys Pro Val Ala Arg Trp Ile Gly Tyr Phe Val Tyr Tyr Lys Arg

20 25 30

Asn Ile Thr Cys Met Glu Asn Glu Ser Glu Lys Leu Glu Asn Ile Arg

35 40 45

Ile Gly Val Asp Gln Arg Ala Glu Ala Asn Arg Arg Asn Leu Gln Val

50 55 60

Ile Ser Pro Asn Val Glu Ala Trp Phe Thr Ser Val Ala Thr Ile Thr

65 70 75 80

Ala Glu Val Ala Asp Val Thr Arg Arg Gly Arg Asn Glu Val Asp Arg

85 90 95

Tyr Asp Trp Cys Pro Asn Leu Lys Ser Arg Tyr Ser Leu Ser Arg Arg

100 105 110

Ala Lys Arg Ile Ala Leu Glu Leu Ile Glu Leu Arg Asn Glu Gly Asn

115 120 125

Asn Tyr Ala Val Phe Cys Tyr Pro Ala Val Glu Asn Glu Pro Leu Pro

130 135 140

Ile Asn Ser Ala Glu Glu Phe Asp Ser Arg Lys Leu Gln Glu

145 150 155

<210> 4

<211> 474

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

atggaattct tctcatatgg tttggtggac aaggtaacag gttgcttgat aaagccagtt 60

gcgcgatgga tcgggtattt tgtttactac aagagaaaca tcacatgtat ggaaaatgaa 120

tctgagaagc tggagaatat cagaattggg gtggatcaaa gagccgaggc taaccggaga 180

aacttacaag tcatttcacc caatgttgag gcttggttta ctagtgttgc taccattact 240

gctgaggtgg cagatgtaac acgacgaggt agaaatgagg ttgatagata tgattggtgt 300

ccaaacttga agtcacgtta ctccctgagc aggagagcta agagaattgc attggagttg 360

attgaacttc gaaatgaagg caacaattat gctgttttct gctatcctgc tgttgaaaat 420

gaacctctac ctatcaacag cgctgaggag tttgattcta gaaaattgca agag 474

相关技术
  • 一种基于二级结构动态选择策略的蛋白质结构预测方法
  • 一种基于有偏采样的蛋白质结构预测方法
  • 一种基于特定距离约束的蛋白质结构预测方法
  • 一种随机突变获得的谷氨酸脱羧酶突变体基因及其编码蛋白质和应用
  • 一种随机突变获得的谷氨酸脱羧酶突变体基因及其编码蛋白质和应用
技术分类

06120115759938