掌桥专利:专业的专利平台
掌桥专利
首页

转氨酶及用于制备西他列汀或其中间体的用途

文献发布时间:2023-06-19 19:28:50



技术领域

本发明属于生物技术领域,具体涉及一种转氨酶、该转氨酶用于制备西他列汀或其中间体的用途,以及一种西他列汀或其中间体(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮的制备方法。

背景技术

糖尿病是由于胰岛素分泌改变,导致胰岛素缺乏及作用减弱,或者胰岛素活性降低,或者在两者共同影响下,出现的代谢性疾病,以高血糖为特征,并同时伴有蛋白质、糖及脂肪的代谢紊乱。糖尿病及其并发症对人类健康的危害程度居心血管疾病、肿瘤之后的第三位,成为危害人类健康的重要疾病。在糖尿病的四种类型中,II型糖尿病占90%以上,多见于30岁以上的中老年人,病因主要是由于机体对胰岛素不敏感。

西他列汀磷酸盐(Sitagliptin phosphate)是2006年FDA批准上市的第一个二肽基酶-IV(DPP-4)抑制剂,用于治疗II型糖尿病。其单用或与二甲双胍、吡格列酮合用都有明显的降血糖作用,且服用安全,耐受性好,不良反应少。

WO2019011236A1中报道了1-吗啉-4-(2,4,5-三氟苯基)-1,3-丁二酮(本发明中又简称为吗啉双酮)可以经转氨酶(transaminase)催化制得(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮,(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮可以进一步得到Boc-(R)-3-氨基-4-(2,4,5-三氟苯基)丁酸(简称西他列汀-Boc丁酸),西他列汀-Boc丁酸再经反应制得西他列汀磷酸盐,但是反应中酶活还需要进一步提高。

发明内容

本发明所要解决的技术问题是为了克服现有技术中将转氨酶催化吗啉双酮底物以生产西他列汀中间体或西他列汀时转化率不高等缺陷,提供了一种转氨酶及其用于制备西他列汀中间体或其西他列汀的用途。将本发明的转氨酶用于催化吗啉双酮底物以生产西他列汀中间体或西他列汀时转化率高、稳定性好,进而降低了生产成本,有利于工业化生产。

为解决上述技术问题,本发明第一方面提供了一种转氨酶,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下一个、两个或三个的残基位置处的氨基酸残基差异:

第150位氨基酸残基为A、L、Q、V、W、T、E或C;

第152位氨基酸残基为A、H、I、K、L、M、N、Q、S、T、V或Y;

第155位氨基酸残基为A、K、N或R。

换言之,所述转氨酶与如SEQ ID NO:1所示的氨基酸序列相比,具有S150A/L/Q/V/W/T/E/C、C152A/H/I/K/L/M/N/Q/S/T/V/Y和/或Q155A/K/N/R的改变。本发明中,所述改变不一定需要在SEQ ID NO:1的基础上进行突变,只要转氨酶最终实现与如SEQ ID NO:1所示的氨基酸序列相比,具有S150A/L/Q/V/W/T/E/C、C152A/H/I/K/L/M/N/Q/S/T/V/Y和/或Q155A/K/N/Q/R的氨基酸差异,则同样落入本发明保护的范围。

在一些实施方案中,转氨酶的氨基酸序列可在上述的特定位置以外的位置另外具有1-2、1-3、1-4、1-5、1-6、1-7、1-8、1-9、1-10、1-11、1-12、1-13、1-14、1-15、1-16、1-17、1-18、1-19、1-20个氨基酸残基的差异;这些残基的差异包括以保守氨基酸残基取代。通常这些取代不影响所述转氨酶的酶活。

在一些实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下两个的残基位置处的氨基酸残基差异:第150位氨基酸残基为A、L、Q、V或W;第152位氨基酸残基为L、Q、T、A或S;第155位氨基酸残基为A或R。

在一些实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下三个的残基位置处的氨基酸残基差异:第150位氨基酸残基为A、V、W、T、E或C;第152位氨基酸残基为H、I、K、L、M、N、Q、S、T、V或Y;第155位氨基酸残基为A、K、N或R。

在一些优选的实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下两个的残基位置处的氨基酸残基差异:第150位氨基酸残基为A、L、V或W;第152位氨基酸残基为L、T、A或S。

在一些优选的实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下两个的残基位置处的氨基酸残基差异:第150位氨基酸残基为Q或V;第155位氨基酸残基为A或R。

在一些优选的实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下两个的残基位置处的氨基酸残基差异:第152位氨基酸残基为L或Q;第155位氨基酸残基为R。

在一些更优选实施方案中,所述转氨酶的氨基酸序列与如SEQ ID NO:1所示的氨基酸序列相比包含选自以下组的氨基酸残基差异,如下表格所示:

/>

在一些进一步更优选实施方案中,编码所述转氨酶的核苷酸序列与如SEQ ID NO:2所示的核苷酸序列相比包含选自以下组的核苷酸差异,如下表格所示:

/>

/>

上表中,152CTG表示编码第152位氨基酸残基的密码子由TGC替换为CTG,155CGT表示编码第155位氨基酸残基的密码子由CAA替换为CGT,150ACC表示编码第150位氨基酸残基的密码子由AGT替换为ACC,在本表中其他的氨基酸残基密码子的替换表示方式与之类似。

为解决上述技术问题,本发明第二方面提供了一种分离的核酸,其编码如本发明第一方面所述的转氨酶。

为解决上述技术问题,本发明第三方面提供了一种重组表达载体,其包括如本发明第二方面所述的分离的核酸。

较佳地,所述重组表达载体的骨架为质粒pET21a。

为解决上述技术问题,本发明第四方面提供了一种转化体,其为在宿主中导入如本发明第二方面所述的分离的核酸或者如本发明第三方面所述的重组表达载体。

较佳地,所述宿主为大肠杆菌(Escherichia coli);例如大肠杆菌BL21。

为解决上述技术问题,本发明第五方面提供了一种制备如本发明第一方面所述的转氨酶的方法,所述方法包括在适于表达所述转氨酶的条件下培养如本发明第四方面所述的转化体。

在某一较佳实施例中,所述方法具体包括:(1)将含所述转氨酶的转化体接种至含抗生素的培养基例如LB培养基中振荡培养,得种子液;(2)将(1)中的种子液转接至含抗生素的培养基例如LB培养基中振荡培养;(3)向(2)中的培养基中加入IPTG诱导过夜,离心后收集菌体;(4)洗涤并重悬(3)中收集的菌体,破碎后离心,即得含所述转氨酶的粗酶液。其中,所述抗生素可以优选为50μg/mL卡那霉素。其中,(1)中所述振荡培养的条件可以优选为37℃、12h。其中,(2)中所述种子液的接种量可以优选为2%体积。其中,所述振荡培养的条件可以优选为37℃、直至OD

所述转化体表达转氨酶后,可采用本领域常规技术手段进行提取,例如可制备粗酶液,粗酶液制备后可进行常规的浓缩、置换,也可将粗酶液进一步经离子交换层析、亲和层析、疏水层析和分子筛层析等纯化步骤中的一种或多种以提纯所述转氨酶。在某一较佳实施例中,可采用以下步骤:(1)将含所述转氨酶的转化体接种至含抗生素的培养基例如LB培养基中振荡培养,得种子液;(2)将(1)中的种子液转接至含抗生素的培养基例如LB培养基中振荡培养;(3)向(2)中的培养基中加入IPTG诱导过夜,离心后收集菌体;(4)洗涤并重悬(3)中收集的菌体,破碎后离心,即得含所述转氨酶的粗酶液。在某一较佳实施例中,采用将离心后收集菌体和缓冲液按比例(例如1:7)均质获得粗酶液。

为解决上述技术问题,本发明第六方面提供了一种酶制剂,其包含如本发明第一方面所述的转氨酶。

较佳地,所述的酶制剂通常可包括转氨酶的辅助因子例如吡哆醛磷酸。本发明中,所述的酶制剂通常可以是从培养物中获得的含转氨酶的转化体宿主细胞或其培养液得到的酶制剂,或者用其加工后得到的制品;其中,所述制品是指由转化体宿主细胞得到的提取物,通过对提取物中的转氨酶进行分离或纯化得到的分离产品,或通过固定化转化体细胞及其提取物或提取物的分离产品而得到的固定化制品。

为解决上述技术问题,本发明第七方面提供了一种酶组合,其包含如本发明第一方面所述的转氨酶中的两种或多种。

为解决上述技术问题,本发明第八方面提供了一种制备(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮的方法,其包括在氨基供体存在时,在反应溶剂中用本发明第一方面所述的转氨酶、本发明第六方面所述的酶制剂或本发明第七方面所述的酶组合来催化底物1-吗啉-4-(2,4,5-三氟苯基)-1,3-丁二酮(简称吗啉双酮)得(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮的步骤。

较佳地,所述反应溶剂为异丙醇和水。

较佳地,所述氨基供体为异丙胺盐酸盐。

较佳地,所述氨基供体与所述底物的摩尔比为1:1~10:1。

较佳地,所述底物的浓度为5~100g/L例如10g/L。

较佳地,所述转氨酶与所述底物的质量比为1:1~6:1,例如3:1;其中所述转氨酶以菌体或蛋白形式存在。

较佳地,所述制备的反应体系中还包括转氨酶的辅助因子例如吡哆醛磷酸,其浓度优选为0.5~5mM例如1mM。

较佳地,所述反应的温度为30-60℃,例如45℃。

较佳地,所述反应时的转速为100-300rpm,例如200rpm。

在某一较佳实施例中,所述转氨酶为转氨酶的粗酶液形式。所述粗酶液的制备可以包括以下步骤:

将含有转氨酶基因的工程菌在液体培养基例如LB中37℃培养至OD600达到0.6~0.8时,加入终浓度为0.5mM的IPTG,20~30℃例如18℃诱导培养16~24h后,将培养液8000~14000rpm例如10000rpm离心5~30min例如10min收集菌体;

将表达转氨酶的菌体与磷酸缓冲液按1:7M/V(g/mL)均质、离心即得;所述磷酸缓冲液例如为50mM的磷酸缓冲液,pH6.0。

为解决上述技术问题,本发明第九方面提供了一种制备西他列汀或西他列汀磷酸盐的方法,其包括根据如本发明第八方面所述的制备方法制备(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮的步骤。

为解决上述技术问题,本发明第十方面提供了一种如本发明第一方面所述的转氨酶、本发明第六方面所述的酶制剂或本发明第七方面所述的酶组合来在制备(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮、西他列汀或西他列汀磷酸盐中的用途。

较佳地,所述西他列汀磷酸盐为西他列汀磷酸盐一水合物。

本发明中,所述的1-吗啉-4-(2,4,5-三氟苯基)-1,3-丁二酮(本发明中又简称为吗啉双酮),具体结构式如下:

在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。

本发明所用试剂和原料均市售可得。

本发明的积极进步效果在于:将本发明转氨酶用于催化酮酰胺底物以生产西他列汀中间体时转化率高、稳定性好、立体选择性高,进而降低了生产成本,有利于工业化生产。

具体实施方式

下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。下列实施例中未注明具体条件的实验方法,按照常规方法和条件,或按照商品说明书选择。

本发明中的实验方法如无特别说明均为常规方法,基因克隆操作具体可参加J.萨姆布鲁克等编的《分子克隆实验指南》。

本发明中的氨基酸简写符号如无特殊说明均为本领域常规,具体简写符号对应的氨基酸如表1所示。

表1

所述氨基酸对应的密码子也为本领域常规,具体氨基酸与密码子的对应关系如表2所示。

表2

Pet21a购买自Novagen公司;NdeI酶、HindIII酶购买自Thermo Fisher公司,BL21感受态细胞购买自北京鼎国昌盛生物技术有限责任公司。

转化率UPLC方法:色谱柱:ZORBAX Eclipse plus C18(RRHD,1.8μm,50×2.1mm);流动相A:0.1%TFA水溶液;流动相B:0.1%TFA甲醇溶液;梯度洗脱:60%A+40%B(0.01min),30%A+70%B(1.5min),100%B(1.6min),100%B(2.0min),60%A+40%B(2.1min),60%A+40%B(3.5min);柱温:35℃;流速:0.5mL/min;进样量:1μL。

吗啉双酮对照品保留时间:1.408min;

(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮对照品保留时间:0.696min;

其中,吗啉双酮底物原料和对照品(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮由本公司自行合成,合成方法参考WO2019011236A1;3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮消旋体由实验室自行合成,由吗啉双酮进行氨基化和催化加氢制得。对照品(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮构型的确定:(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮可进一步反应制得(3R)-N-叔丁氧羰基-3-氨基-4-(2,4,5-三氟苯基)-丁酸(参考WO2019011236A1),以(3R)-N-叔丁氧羰基-3-氨基-4-(2,4,5-三氟苯基)-丁酸标准品(采购于安徽海康药业有限责任公司)做对照,可以确定为R构型。

构型确定的HPLC方法:

色谱柱:Daicel Chiralpak AD-H(4.6mm*250mm,5μm);流动相:正己烷:异丙醇=90:10;检测波长:210nm;流速:1.0ml/min;进样体积:10μl;柱温:25℃;运行时间:40min。

手性HPLC方法检测产物ee值方法如下:

色谱柱:Daicel ChiralpakAD-H柱4.6mm×250mm,5μm;流动相:正己烷:异丙醇:二乙胺=40:60:0.1;检测器:UV268nm;柱温:25℃;流速:0.8mL/min;进样量:10μL。

3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮消旋体对照品保留时间:10.290min和28.087min;

(R)-3-氨基-1-吗啉-4-(2,4,5-三氟苯基)-1-丁酮对照品保留时间:28.093min。

实施例1转氨酶突变体酶液的制备

根据表3中转氨酶基因,全基因进行合成基因SEQ ID NO:2、4、6,酶切位点NdeI、HindIII,连接载体pET21a,获得含有转氨酶基因的重组质粒。基因合成公司为苏州金唯智生物科技有限公司(苏州工业园区星湖街218号生物纳米科技园C3楼)。重组质粒转化至宿主大肠杆菌BL21感受态细胞,得到含有转氨酶Enz.1~Enz.3基因的工程菌株。

同样地,将表4中根据Enz.1基因进行定点突变得到的转氨酶Enz.4~Enz.36的基因,酶切位点NdeI、HindIII,连接载体pET21a,获得分别含有转氨酶Enz.4~Enz.36的基因的各重组质粒。各重组质粒分别转化至宿主大肠杆菌BL21感受态细胞,得到表4含有转氨酶基因的工程菌株Enz.4~Enz.36。表格中的152CTG表示编码第152位氨基酸残基的密码子由TGC替换为CTG,155CGT表示编码第155位氨基酸残基的密码子由CAA替换为CGT,150ACC表示编码第150位氨基酸残基的密码子由AGT替换为ACC,在本表中其他的氨基酸残基密码子的替换表示方式与之类似。

将上述含有转氨酶基因的工程菌在经平皿划线活化后,挑单菌落接种至含50μg/ml卡那霉素的5ml LB液体培养基中,37℃震荡培养12h。按2%(v/v)接种量转接至150ml同样含50μg/ml卡那霉素的新鲜LB液体培养基中,37℃震荡至OD600达到0.8左右时,加入IPTG至其终浓度为0.5mM,18℃诱导培养16h。培养结束后,将培养液10,000rpm离心10min,弃上清液,收集菌体,置于-80℃超低温冰箱中保存,待用。

表3

表4

/>

实施例2各转氨酶突变体用于催化吗啉双酮

实施例1得到的菌体和50mM的磷酸缓冲液(pH7.0)按1:7(M/V)均质,取上清液获得转氨酶粗酶液。

5mL反应体系中(表5),加入2.5mL异丙醇,50mg吗啉双酮,0.1mL 12.5mg/mL的PLP(吡哆醛磷酸)水溶液,0.2mL 4M异丙胺盐酸盐,0.5mL 1M三乙醇胺,1.1mL粗酶液,45℃、200rpm摇床反应,反应18小时取样进行灭酶处理后离心,取上清液甲醇稀释20倍后检测转化率和ee值。

其中,检测转化率的方法见上述的转化率UPLC方法部分。经过检测发现,各底物和产物的保留时间与各自的对照品一致。检测结果如下表6-1、6-2、6-3、6-4所示。检测ee值的方法见上述手性HPLC检测ee值的方法,经检测,各突变体酶催化所得产物ee值都能达到99%以上。

表5反应体系

表6-1

表6-2第一批酶突变体的转化率

表6-3第二批酶突变体的转化率

表6-4第三批酶突变体的转化率

由上表6-2~6-4可知,以上酶突变体的转化率大多都比Enz.1的转化率提高了10%以上。

SEQUENCE LISTING

<110> 弈柯莱生物科技(上海)股份有限公司

<120> 转氨酶及用于制备西他列汀或其中间体的用途

<130> P21015155C

<160> 6

<170> PatentIn version 3.5

<210> 1

<211> 330

<212> PRT

<213> Artificial Sequence

<220>

<223> Enz.1 氨基酸序列

<400> 1

Met Ala Phe Ser Ala Asp Thr Pro Glu Ile Val Tyr Thr His Asp Thr

1 5 1015

Gly Leu Asp Tyr Ile Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn

202530

Pro Leu Ala Gly Gly Ala Ala Trp Ile Glu Gly Ala Phe Val Pro Pro

354045

Ser Glu Ala Arg Ile Pro Ile Phe Asp Gln Gly Phe Tyr Thr Ser Asp

505560

Ala Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu

65707580

Gly Asp His Ile Glu Arg Leu Phe Ser Asn Ala Glu Ser Ile Arg Leu

859095

Ile Pro Pro Leu Thr Gln Asp Glu Val Lys Glu Ile Ala Leu Glu Leu

100 105 110

Val Ala Lys Thr Glu Leu Arg Glu Ala Gln Val Thr Val Thr Ile Thr

115 120 125

Arg Gly Tyr Ser Ser Thr Pro Phe Glu Arg Asp Ile Thr Lys His Arg

130 135 140

Pro Gln Val Tyr Met Ser Ala Cys Pro Tyr Gln Trp Ile Val Pro Phe

145 150 155 160

Asp Arg Ile Arg Asp Gly Val His Leu Met Ile Ala Gln Ser Val Arg

165 170 175

Arg Thr Pro Arg Ser Ser Ile Asp Pro Gln Val Lys Asn Phe Gln Trp

180 185 190

Gly Asp Leu Ile Arg Ala Ile Gln Glu Thr His Asp Arg Gly Phe Glu

195 200 205

Leu Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly Thr Gly

210 215 220

Phe Asn Val Val Val Ile Lys Asp Gly Val Val Arg Ser Pro Gly Arg

225 230 235 240

Arg Ala Leu Pro Gly Ile Thr Arg Lys Thr Val Leu Glu Ile Ala Glu

245 250 255

Ser Leu Gly His Glu Ala Ile Leu Ala Asp Ile Thr Pro Ala Glu Leu

260 265 270

Tyr Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp

275 280 285

Pro Phe Val Ser Val Asp Gly Asn Ser Ile Ser Asp Gly Val Pro Gly

290 295 300

Pro Val Thr Gln Ser Ile Ile Arg Arg Tyr Trp Glu Leu Asn Val Glu

305 310 315 320

Pro Ser Ser Leu Leu Thr Pro Val Gln Tyr

325 330

<210> 2

<211> 990

<212> DNA

<213> Artificial Sequence

<220>

<223> Enz.1 核苷酸序列

<400> 2

atggcattct cagcagacac gccggaaatt gtttacaccc acgatacggg cctggactac 60

attacctaca gcgactacga actggacccg gcaaacccgc tggctggcgg tgcagcatgg 120

attgagggtg cgtttgtgcc gccgagtgaa gcccgtattc caatctttga tcagggtttc 180

tatacgtctg acgcaaccta caccacgttt catgtttgga acggtaatgc tttccgtctg 240

ggcgaccaca ttgaacgcct gttcagcaat gcagaatcta ttcgcctgat cccgccgctg 300

acgcaagatg aagtcaaaga aatcgcgctg gaactggtgg ccaagaccga actgcgtgaa 360

gcccaggtca ccgtgacgat tacccgcggc tatagctcta cgccgtttga acgtgatatc 420

accaaacatc gcccgcaggt gtatatgagt gcgtgcccgt accaatggat tgttccgttc 480

gatcgtatcc gcgacggtgt gcacctgatg attgcacaga gcgtccgtcg caccccgcgt 540

agttccattg atccgcaggt gaagaacttt caatggggcg acctgattcg tgcaatccaa 600

gaaacccatg atcgcggttt cgaactgccg ctgctgctgg attgtgacaa cctgctggct 660

gaaggtacgg gctttaatgt ggttgtcatc aaagatggtg tggttcgtag cccgggtcgt 720

cgcgctctgc cgggtattac gcgcaagacc gttctggaaa tcgcggaatc tctgggccac 780

gaagcgattc tggccgatat cacgccggca gaactgtacg atgctgacga agttctgggt 840

tgctcaaccg gcggtggcgt ctggccgttc gtttcggtcg atggtaattc aatttcggac 900

ggtgtgccgg gtccggttac ccagagcatt atccgtcgtt actgggaact gaatgtggaa 960

ccgtcgtcgc tgctgacccc ggtgcaatac 990

<210> 3

<211> 330

<212> PRT

<213> Artificial Sequence

<220>

<223> Enz.2 氨基酸序列

<400> 3

Met Ala Phe Ser Ala Asp Thr Pro Glu Ile Val Tyr Thr His Asp Thr

1 5 1015

Gly Leu Asp Tyr Ile Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn

202530

Pro Leu Ala Gly Gly Ala Ala Trp Ile Glu Gly Ala Phe Val Pro Pro

354045

Ser Glu Ala Arg Ile Ser Ile Phe Asp Gln Gly Phe Tyr Thr Ser Asp

505560

Ala Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu

65707580

Gly Asp His Ile Glu Arg Leu Phe Ser Asn Ala Glu Ser Ile Arg Leu

859095

Ile Pro Pro Leu Thr Gln Asp Glu Val Lys Glu Ile Ala Leu Glu Leu

100 105 110

Val Ala Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr Ile Thr

115 120 125

Arg Gly Tyr Ser Ser Thr Pro Phe Glu Arg Asp Ile Thr Lys His Arg

130 135 140

Pro Gln Val Tyr Met Ser Ala Cys Pro Tyr Gln Trp Ile Val Pro Phe

145 150 155 160

Asp Arg Ile Arg Asp Gly Val His Leu Met Val Ala Gln Ser Val Arg

165 170 175

Arg Thr Pro Arg Ser Ser Ile Asp Pro Gln Val Lys Asn Phe Gln Trp

180 185 190

Gly Asp Leu Ile Arg Ala Ile Gln Glu Thr His Asp Arg Gly Phe Glu

195 200 205

Leu Pro Leu Leu Leu Asp Cys Asp Asn Leu Leu Ala Glu Gly Pro Gly

210 215 220

Phe Asn Val Val Val Ile Lys Asp Gly Val Val Arg Ser Pro Gly Arg

225 230 235 240

Ala Ala Leu Pro Gly Ile Thr Arg Lys Thr Val Leu Glu Ile Ala Glu

245 250 255

Ser Leu Gly His Glu Ala Ile Leu Ala Asp Ile Thr Pro Ala Glu Leu

260 265 270

Tyr Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp

275 280 285

Pro Phe Val Ser Val Asp Gly Asn Ser Ile Ser Asp Gly Val Pro Gly

290 295 300

Pro Val Thr Gln Ser Ile Ile Arg Arg Tyr Trp Glu Leu Asn Val Glu

305 310 315 320

Pro Ser Ser Leu Leu Thr Pro Val Gln Tyr

325 330

<210> 4

<211> 990

<212> DNA

<213> Artificial Sequence

<220>

<223> Enz.2 核苷酸序列

<400> 4

atggcgttct cagcggacac ccctgaaatc gtttacaccc acgacaccgg tctggactat 60

atcacctact ctgactacga actggacccg gctaacccgc tggctggtgg tgctgcttgg 120

atcgaaggtg ctttcgttcc gccgtctgaa gctcgtatct ctatcttcga ccagggtttt 180

tatacttctg acgctaccta caccaccttc cacgtttgga acggtaacgc tttccgtctg 240

ggggaccaca tcgaacgtct gttctctaat gcggaatcta ttcgtttgat cccgccgctg 300

acccaggacg aagttaaaga gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360

gcgatggtta ccgttacgat cacccgtggt tactcttcta ccccattcga gcgtgacatc 420

accaaacatc gtccgcaggt ttacatgagc gcttgcccgt accagtggat cgtaccgttt 480

gaccgcatcc gtgacggtgt tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540

agctctatcg acccgcaggt taaaaacttc cagtggggtg acctgatccg tgcaattcag 600

gaaacccacg accgtggttt cgagttgccg ctgctgctgg actgcgacaa cctgctggct 660

gaaggtccgg gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720

gctgctctgc cgggtatcac ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780

gaagctatcc tggctgacat caccccggct gaactgtacg acgctgacga agttctgggt 840

tgctcaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaactc tatctctgac 900

ggtgttccgg gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960

ccttcttctc tgctgacccc ggtacagtac 990

<210> 5

<211> 330

<212> PRT

<213> Artificial Sequence

<220>

<223> Enz.3 氨基酸序列

<400> 5

Met Ala Phe Ser Ala Asp Thr Pro Glu Ile Val Tyr Thr His Asp Thr

1 5 1015

Gly Leu Asp Tyr Ile Thr Tyr Ser Asp Tyr Glu Leu Asp Pro Ala Asn

202530

Pro Leu Ala Gly Gly Ala Ala Trp Ile Gly Gly Ala Phe Val Pro Pro

354045

Ser Glu Ala Arg Ile Pro Ile Phe Asp Gln Gly Phe Tyr Thr Ser Asp

505560

Ala Thr Tyr Thr Thr Phe His Val Trp Asn Gly Asn Ala Phe Arg Leu

65707580

Gly Asp His Ile Glu Arg Leu Phe Ser Asn Ala Glu Ser Ile Arg Leu

859095

Ile Pro Pro Leu Thr Gln Asp Glu Val Lys Glu Ile Ala Leu Glu Leu

100 105 110

Val Ala Lys Thr Glu Leu Arg Glu Ala Met Val Thr Val Thr Ile Thr

115 120 125

Arg Gly Tyr Ser Ser Thr Pro Phe Glu Arg Asp Ile Thr Lys His Arg

130 135 140

Pro Gln Val Tyr Met Phe Ala Ser Pro Tyr Leu Gln Ile Val Pro Phe

145 150 155 160

Asp Arg Ile Arg Asp Gly Val His Leu Met Val Ala Gln Ser Val Arg

165 170 175

Arg Thr Pro Arg Ser Ser Ile Asp Pro Gln Val Lys Asn Phe Gln Trp

180 185 190

Gly Asp Leu Ile Arg Ala Ile Gln Glu Thr His Asp Arg Gly Phe Glu

195 200 205

Leu Pro Leu Leu Leu Asp Gly Asp Asn Leu Leu Ala Glu Gly Pro Gly

210 215 220

Phe Asn Val Val Val Ile Lys Asp Gly Val Val Arg Ser Pro Gly Arg

225 230 235 240

Ala Ala Leu Pro Gly Ile Thr Arg Lys Thr Val Leu Glu Ile Ala Glu

245 250 255

Ser Leu Gly His Glu Ala Ile Leu Ala Asp Ile Thr Pro Ala Glu Leu

260 265 270

Tyr Asp Ala Asp Glu Val Leu Gly Cys Ser Thr Gly Gly Gly Val Trp

275 280 285

Pro Phe Val Ser Val Asp Gly Asn Ser Ile Ser Asp Gly Val Pro Gly

290 295 300

Pro Val Thr Gln Ser Ile Ile Arg Arg Tyr Trp Glu Leu Asn Val Glu

305 310 315 320

Pro Ser Ser Leu Leu Thr Pro Val Gln Tyr

325 330

<210> 6

<211> 990

<212> DNA

<213> Artificial Sequence

<220>

<223> Enz.3 核苷酸序列

<400> 6

atggcgttct cagcggacac ccctgaaatc gtttacaccc acgacaccgg tctggactat 60

atcacctact ctgactacga actggacccg gctaacccgc tggctggtgg tgctgcttgg 120

attggaggtg ctttcgttcc gccgtcggaa gctcgtatcc cgatcttcga ccagggtttt 180

tatacttctg acgctaccta caccaccttc cacgtttgga acggtaacgc tttccgtctg 240

ggggaccaca tcgaacgtct gttctctaat gcggaatcta ttcgtttgat cccgccgctg 300

acccaggacg aagttaaaga gatcgctctg gaactggttg ctaaaaccga actgcgtgaa 360

gcgatggtta ccgttacgat cacccgtggt tactcttcta ccccattcga gcgtgacatc 420

accaaacatc gtccgcaggt ttacatgttc gctagcccgt acctgcagat cgtaccgttt 480

gaccgcatcc gggacggtgt tcacctgatg gttgctcagt cagttcgtcg tacaccgcgt 540

agctctatcg acccgcaggt taaaaacttc cagtggggtg acctgatccg tgcaattcag 600

gaaacccacg atcgtggttt cgagttgccg ctgctgctgg acggggacaa cctgctggct 660

gaaggtccgg gtttcaacgt tgttgttatc aaagacggtg ttgttcgttc tccgggtcgt 720

gctgctctgc cgggtatcac ccgtaaaacc gttctggaaa tcgctgaatc tctgggtcac 780

gaagctatcc tggctgacat caccccggct gaactgtacg acgctgacga agttctgggt 840

tgctcaaccg gtggtggtgt ttggccgttc gtttctgttg acggtaactc tatctctgac 900

ggtgttccgg gtccggttac ccagtctatc atccgtcgtt actgggaact gaacgttgaa 960

ccttcttctc tgctgacccc ggtacagtac 990

技术分类

06120115928612