掌桥专利:专业的专利平台
掌桥专利
首页

光学活性氨基酰胺化合物的对映选择性化学酶合成

文献发布时间:2023-06-19 19:28:50



技术领域

本发明涉及通过NHase酶催化来立体选择性制备α氨基酰胺化合物的新型生物催化方法。发明的另一方面涉及新型NHase酶以及进一步改善的NHase酶突变体、编码这些酶的核酸分子、适合制备这类酶及突变体的重组微生物。发明的另一方面涉及制备内酰胺化合物的化学生物催化方法,其包括通过NHase酶催化来制备α氨基酰胺化合物的新催化方法,以及通过应用某些化学氧化催化剂的α氨基酰胺化学氧化,所述催化剂适合在保留其立体化学构型下将α氨基酰胺转变成相应的内酰胺。新型化学生物催化方法特别适合有价值药物化合物的合成,例如尤其是(S)-左乙拉西坦。

背景技术

腈水合酶(NHase;EC 4.2.1.84)催化腈水合作用成相应的酰胺[S.Prasad,T.C.Bhalla,Nitrile hydratases(NHases):At the interface of academia andindustry,Biotechnol.Adv.28(2010)725–741]。能区分两种类型的NHase,即非含咕啉钴和非含血红素铁的NHase。这两种都由α-和β-亚基构成,并且功能性异源表达取决于辅助蛋白的作用[E.T.Yukl,C.M.Wilmot,Cofactor biosynthesis through protein post-translational modification,Curr.Opin.Chem.Biol.16(2012)54–59.]。

成功的异源表达已有描述:NHase,来自产酸克雷伯菌(Klebsiella oxytoca)[F.-M.Guo,J.-P.Wu,L.-R.Yang,G.Xu,Overexpression of a nitrile hydratase fromKlebsiella oxytoca KCTC 1686in Escherichia coli and its biochemicalcharacterization,Biotechnol.Bioprocess Eng.20(2015)995–1004]和芽孢杆菌属(Bacillus sp.)RAPc[R.A.Cameron,M.Sayed,D.A.Cowan,Molecular analysis of thenitrile catabolism operon of the thermophile Bacillus pallidus RAPc8,Biochim.Biophys.Acta.1725(2005)35–46],以及热稳定NHase,来自嗜热假单胞菌(Pseudomonas thermophile)[A.Miyanaga,S.Fushinobu,K.Ito,T.Wakagi,CrystalStructure of Cobalt-Containing Nitrile Hydratase,Biochem.Biophys.Res.Commun.288(2001)1169–1174]和橙色单胞菌(Aurantimonasmanganoxydans)[X.Pei,H.Zhang,L.Meng,G.Xu,L.Yang,J.Wu,Efficient cloning andexpression of a thermostable nitrile hydratase in Escherichia coli using anauto-induction fed-batch strategy,Process Biochem.48(2013)1921–1927]。Pei等人还在其中描述了如果来自橙色单胞菌(M.manganoxydans)的NHase在大肠杆菌中与伴侣蛋白GroEL/ES或DnaK/J-GrpE共表达,则所表达蛋白以显著更高收率获得。

在文献中,已经描述了来自不同生物体的对映选择性NHase,如嗜碱硝化菌(Nitriliruptor alkaliphilus)、大豆根瘤菌(Bradyrhizobium japonicum)和恶臭假单胞菌(Pseudomonas putida)[S.Wu,R.D.Fallon,M.S.Payne,Over-production ofstereoselective nitrile hydratase from Pseudomonas putida 5B in Escherichiacoli:activity requires a novel downstream protein,Appl.Microbiol.Biotechnol.48(1997)704–708;J.L.Tucker,L.Xu,W.Yu,R.W.Scott,L.Zao,N.Ran,Chemoenzymatic processes for preparation of Levetiracetam,WO2009009117,2009;S.van Pelt,M.Zhang,L.G.Otten,J.Holt,D.Y.Sorokin,F.vanRantwijk,G.W.Black,J.J.Perry,R.A.Sheldon,Probing the enantioselectivity of adiverse group of purified cobalt-centred nitrile hydratases,Org.Biomol.Chem.9(2011)3011]。

(S)-选择性腈水合酶已经描述于WO2009009117的左乙拉西坦(3)生成的上下文中,然而,在外消旋2-(2-氧代吡咯烷-1-基)-丁腈(7)的经典酶动力学拆分(EKR)中,

仅导致最高50%的理论收率(4)。

本发明解决的第一个问题是提供新型合成方法,允许生成左乙拉西坦(4)和相关内酰胺,尤其是收率提高。

本发明解决的另一个问题是发现(S)-选择性NHase能够使用2-(2-吡咯烷-1-基)-丁腈(1),尤其是(S)-1作为底物。

本发明解决的另一个问题是发现稳健的(S)-选择性NHase,以用于这类新方法。

本发明仍解决的另一个问题是提供显示改善的特性的这类NHase酶突变体。更特定地,这类改善突变体应显示改进,如改善的对映选择性和/或改善的底物转化。

发明内容

尚未描述(S)-2-(吡咯烷-1-基)丁酰胺((S)-2)型杂环α氨基酰胺和具有环状叔氨基的结构上相关的杂环化合物的生物催化合成。

本发明基于以下意外发现:可通过对映选择性(S)-腈水合酶以较高收率从相应的外消旋腈(rac-1)(或从相关腈)获得(S)-2-(吡咯烷-1-基)丁酰胺((S)-2)(或相关酰胺化合物)(方案1)。与WO2009009117所述的现有技术方法相反,本发明人意外观察到起始材料(rac-1)的动态动力学拆分(DKR)。在外消旋腈与其化学组分吡咯烷、丙醛和HCN之间形成平衡的合适条件下观察到(rac-1)的外消旋作用。由此,通过(S)-NHase作用从外消旋混合物中移出的(S)-1,经外消旋反应连续补充,最终产生高于50%的产品收率。

方案1.(S)-左乙拉西坦(4)的化学酶反应途径。

允许底物(rac)-1外消旋作用的反应条件在本发明之前是未确定的。

与本发明NHase的底物相反,本领域的外消旋含氧底物2-(2-氧代吡咯烷-1-基)-丁腈(7)不允许外消旋作用,因为其不分解且不形成与其各组成物的平衡,所以不允许外消旋底物的DKR,而仅是动力学拆分。

首先,建立NHase组,其包含17个Co型和4个Fe型NHase。19种腈水合酶在适用条件下以可溶形式表达且显示甲基丙烯腈水合作用的活性。7个候选物能够转化rac-1;Co型CtNHase、KoNHase和NaNHase以及Fe型GhNHase、PkNHase、PmNHase和PkNHase。对这7个NHase更详细表征。

温度和pH研究显示,Co型NHase比Fe型NHase更稳定。尤其是CtNHase对升高的温度和pH值更耐受。CtNHase是Co型NHase中最有前景的酶,不仅仅是因为其高稳定性。野生型显示就(S)-2形成而言已有84%的ee值。

最佳Fe型NHase是GhNHase,其具有出色的rac-1转化水平,然而,稳定性和对映选择性低于CtNHase。最终,出于下列原因选择CtNHase用于突变实验:其趋向(S)-2的对映选择性高,它处理高底物浓度优于GhNHase,不受丙醛抑制且它的高起始稳定性对于突变研究是有利的。

应用理性工程化改造以特异性改变CtNHase的底物结合袋。使用结构生物学方法,鉴定了对接的产物(docked product)

4种沿着酶活性位点排列的序列延伸,通过随机工程化改造靶向。在β1:βL48、βF51和βG54区域发现对rac-1水合作用产生最有益影响的残基。就α1和α2、αV110I和αP121而言,每种延伸分别仅发现一个有益氨基酸交换。β2:βH146L/βF167Y区域中显示有利的组合突变体。α亚基中的改变主要影响酶活性,β亚基中的氨基酸交换对于对映选择性有强烈影响。然而,对映选择性极高的突变体大多显示低转化水平。

以我们所有关于关键残基的知识,更详细地来研究位置αP121、βL48和βF51,构建28CtNHase组合突变体。当βL48中的氨基酸交换彼此组合时,筛选rac-1转化发现了有极高对映选择性的CtNHase突变体。通过处于97.6%高对映体过量的CtNHase-αP121T/βL48R达到多至67%的rac-1转化。组合βG54C、βG54R或βG54V的突变体CtNHase-βL48P达到≥99.8%的极高ee值,在有额外丙醛的反应中转化率大于35.7%。这个成功可能主要归因于在筛选中使用(S)-选择性酰胺酶。

附图说明

图1:pMS470d8的载体图。

图2:甲基丙烯腈水合作用的活性。计算不同来源NHase的酶活性,每mg无细胞提取物(黑色柱)和每mg NHase(阴影线柱)(CFE中的NHase量,经SDS-PAGE估计)。在测定中,114mM底物在pH 7.2和25℃转化。

图3:底物分解实验。当α-乙基-1-吡咯烷乙腈,一种α-氨基腈分离时,在敏感型Feigl-Anger滤纸上检测到释放的氰化物。将底物溶于乙醇和6种不同的缓冲液中,范围从pH 5到10。

图4:GhNHase(上图)和CtNHase(下图)在氰化钾存在时的活性。跟踪114mM甲基丙烯腈在25℃和pH 7.2下的转化,存在多至50mM KCN,采用224nm的分光光度法。

图5:GhNHase(上图)和CtNHase(下图)在丙醛存在时的活性。在多至50mM丙醛的存在下,采用在224nm处的分光光度法,跟踪114mM甲基丙烯腈在25℃和pH 7.2下的转化。

图6:rac-1在较低反应温度的转化。50mM底物通过在50/40mM磷酸钠缓冲液,pH7.2中的20%(v/v)NHase-CFE,于5(白色柱)或25℃(黑色柱)和300rpm对GhNHase(右面一对柱)和CtNHase(左面一对柱)过夜转化。

图7:不同反应条件下的4种NHase在酶进料反应中的转化率。测试两种缓冲液并进行酶进料反应。50mM rac-1在5℃过夜应用。反应起始于10%(v/v)CFE,进料反应在1小时后补充额外10%。

图8:通过CtNHase-CFE在不同pH和温度的靶反应。柱代表25℃(白色柱,左)和5℃(黑色柱,右)的转化。菱形指示在25℃(白色)和5℃(黑色)趋向(S)-对映体的对映体过量。50mM rac-1通过10%(v/v)CFE在25℃或5℃和500rpm转化2小时。

图9:在不同pH下通过GhNHase-CFE的靶反应。柱代表25℃下的转化。菱形指示趋向(S)-对映体的对映体过量。50mM rac-1通过20%(v/v)CFE在25℃或5℃和500rpm转化2小时。10% CFE等于324μL/mL GhNHase。

图10:通过GhNHase-CFE的rac-1转化的催化剂量的影响。反应在25℃和500rpm进行2小时。10% CFE等于324μL/mL GhNHase。生成的酰胺2含量(以%底物形式)由圆圈表示;(S)-对映体的对映体过量由菱形显示。

图11:通过CtNHase-CFE的rac-1转化的催化剂量的影响。反应在5℃和500rpm进行2小时。10% CFE等于520μL/mL CtNHase。生成的酰胺2的量(以%底物形式)由圆圈表示;(S)-对映体的对映体过量由菱形显示。

图12:通过2% GhNHase生成2的时程。50mM rac-1在200mM Tris-HCl缓冲液,pH7,25℃和500rpm中转化2小时。2% CFE等于64.8μL/mL GhNHase。

图13:通过GhNHase细胞,对于不同rac-1浓度和pH值的转化。柱代表转化并且菱形代表ee值。

图14:通过CtNHase细胞,对不同rac-1浓度和pH值的转化。柱代表转化并且菱形代表ee值。

图15:150mMα-乙基-1-吡咯烷乙腈通过CtNHase向相应的酰胺转化的水平,采用静息细胞形式,有额外的吡咯烷和丙醛。1:仅腈,2:有150mM吡咯烷,3:有150mM丙醛,4:有75mM吡咯烷,5:有75mM丙醛,6:有75mM吡咯烷和75mM丙醛。

图16:rac-1通过单CtNHase变体在靶反应中的转化。有(每对柱中的白色柱)和没有(每对柱中的黑色柱)150mM丙醛下,rac-1通过8.5mg/mL CtNHase细胞的转化,在25℃和700rpm下于500mM Tris-HCl缓冲液,pH 7中持续2小时。反应一式三份进行并通过HPLC-UV分析。

图17:前体rac-1和左乙拉西坦3的GC校准线,使用咖啡因作为内标。

图18:NaIO

图19:通过CtNHase双重突变αP121/βL48R的rac-1制备规模进料分批水合作用。黑色箭头指示底物和丙醛添加的点。

缩写

bp 碱基对

CFE无细胞提取物

CWW细胞湿重

DNA脱氧核糖核酸

cDNA 互补DNA

ee 对映体过量

HPLC 高效液相色谱

kb 千碱基

MAN甲基丙烯腈

NHase腈水合酶

OD 光密度

ON 过夜

PCR聚合酶链式反应

rpm每分钟转数

RNA核糖核酸

具体实施方式

定义

a)一般术语:

对于本文描述和所附权利要求,使用“或”意味着“和/或”,除非另有说明。类似地,“包含(comprise、comprises、comprising)”、“包括(include、includes、including)”可互换且不意在限制。

还应理解在使用术语“包含”的多个实施方案的描述中,本领域技术人员应理解某些特定情况下,实施方案能用语言“基本上由…组成”或“由…组成”替代描述。

本文所用术语“纯化的”、“基本上纯化的”和“分离的”指没有其他不同化合物的状态,其中本发明化合物通常以其天然状态缔合,从而“纯化的”、“基本上纯化的”和“分离的”对象包含至少0.1%、0.5%、1%、5%、10%或20%、或至少50%或75质量%的给定样品,按重量算。在一实施方案中,这些术语指本发明化合物包含至少95、96、97、98、99或100质量%的给定样品,按重量算。本文所用术语“纯化的”、“基本上纯化的”和“分离的”指一种核酸或蛋白或者多种核酸或蛋白时,也指不同于天然存在的纯化或浓缩状态,例如原核或真核环境中,如细菌或真菌细胞,或者哺乳动物生物体,尤其是人体。“分离的”含义涵盖大于天然存在的任何程度的纯化或浓缩,包括(1)从其他相关结构或化合物中纯化或者(2)与原核或真核环境中通常不缔合的结构或化合物缔合。根据本领域技术人员已知的多种方法和过程,本文所述核酸或蛋白或者核酸或蛋白种类可以是分离的,或另外与其自然界中通常不缔合的结构或化合物缔合。

术语“约”指示所示值±25%的潜在变化,特别是±15%、±10%,更特别是±5%、±2%或±1%。

术语“基本上”描述约80-100%的值范围,例如85-99.9%,特别是90-99.9%,更特别是95-99.9%,或98-99.9%并且尤其是99-99.9%。

“主要”指高于50%范围的比例,例如51-100%的范围,特别是75-99.9%的范围,更特别是85-98.5%,如95-99%。

本发明上下文中的“主产物”是指单个化合物或至少两种化合物如2、3、4、5或更多种化合物的组,特别是2或3种化合物,单个化合物或化合物组“主要”通过本文所述反应制备,并且基于所述反应形成产物的成分总量,以主要比例包含于所述反应。比例可以是摩尔比例、重量比例,或特别是基于色谱分析,自反应产物的对应色谱计算的面积比例。

本发明上下文中的“副产物”是指单个化合物或至少两种化合物如2、3、4、5或更多种化合物的组,特定是2或3种化合物,单个化合物或化合物组并非“主要”通过本文所述反应制备。

由于酶促反应的可逆性,除非另有说明,本发明涉及在2个反应方向上的本文所述酶促或生物催化反应。

本文所述多肽的“功能性突变体”包括如下所定义这类多肽的“功能性等效物”。

术语“立体异构体”包括构象异构体,特别是构型异构体。

根据本发明,一般包括本文所述化合物的所有“立体异构形式”,如“构造异构体”和“立体异构体”。

“立体异构形式”特别涵盖“立体异构体”和其混合物,例如构型异构体(光学异构体),如对映体例如(R)-和(S)对映体,或几何异构体(非对映异构体),如E-和Z-异构体,以及其组合。如果一个分子中存在一个或多个不对称中心,本发明涵盖这些不对称中心不同构象的所有组合,如对映体对。

术语“区域特异性”或“区域特异性的”描述反应方向,其涉及含有至少2个可能反应位点的反应物。如果这类反应发生并生成两种或更多产物且一种产物“主导”,则反应被称为“区域选择性”。如果仅一种产物生成或“基本上”生成,则反应被称为“区域特异性”(即在构型保持下推进)。

术语“立体保守性”反应描述化学、电化学或生物化学反应对于不对称反应物的影响,所述反应物含有至少一个不对称碳原子。如果这类反应发生并生成其中立体化学构型在不对称碳原子处未改变的产物,或在不对称碳原子处“基本上”未改变的产物,则反应可分类为“立体保守性”,或同义地,作为在“立体保留”下进行的反应。

“立体选择性”描述以立体异构纯或富集形式生成化合物的特定立体异构体的能力,或者以本文所述酶催化方法在多个立体异构体中特异性或主要转化特定立体异构体的能力。更具体地,这意味着本发明产物相对于特定的立体异构体被富集,或离析物相对于特定的立体异构体被耗尽。这可经纯度%ee-参数定量,根据下式计算:

%ee=[X

其中X

%ee-参数也可应用于定量所谓特定对映体的“对映体过量”或“立体异构体过量”,所述对映体通过特定酶形成或转化或未转化。特定的ee-%值在50-100%范围内,如更特定60-99.9%,甚至更特定70-99%、80-98%或85-97%。

术语“基本上为立体异构纯”指相对于特定化合物的立体异构体总量的特定立体异构体相对比例至少为90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%。

术语“选择性转化”或“增加选择性”一般指不对称化学化合物的特定立体异构形式例如(S)型,以高于对应其他立体异构形式例如(R)型的比例或量(在摩尔基础上比较)转化。这在整个反应过程中(即反应起始与终止之间),在反应某一时间点或反应“间隔”期间观察到。特别地,选择性可在“间隔”期间观察到相对于底物初始量的1-99%、2-95%、3-90%、5-85%、10-80%、15-75%、20-70%、25-65%、30-60%或40-50%的转化。更高比例或量可以例如通过以下形式表示:

-在整个反应过程或其间隔期间观察到更高的异构体最大收率;

-在底物确定的%转化值程度下更高的异构体相对量;和/或

-在更高%转化值程度下的相同的异构体相对量;

其中每一种相对于参考方法被特定观察到,所述参考方法在其他方面与已知化学或生化手段相同的条件下进行。

根据本发明,一般还包括本文所述化合物的所有“异构形式”,如结构异构体且特别是立体异构体和这些的混合物,例如光学异构体如(R)和(S)型,或几何异构体如E-和Z-异构体,以及这些的组合。如果分子中存在数个不对称中心,则本发明包括这些不对称中心不同构象的所有组合,例如,对映体对或立体异构形式的任何混合物。

本发明所述的“收率”和/或转化率在定义的时间段例如4、6、8、10、12、16、20、24、36或48小时中确定,其中发生反应。特别地,反应在精确定义的条件下进行,例如本文所定义的“标准条件”。

本领域熟知不同收率参数(“收率”或Y

“收率”和“Y

比(specific)产率描述每小时和每升发酵肉汤每克生物质生成的产物量。湿细胞重的量表述为WCW,描述生化反应中生物活性微生物的量。值给定为g产物/g WCW/h(即g/gWCW-

如果本公开涉及不同程度偏好的特征、参数和其范围(包括通常,但未明确优选的特征、参数和其范围),除非另有说明,两个或更多这类特征、参数和其范围的任意组合为本说明书的公开内容所涵盖,而无论它们的各自优选程度。

b)生化术语:

术语“生物催化方法”指存在本发明的至少一种酶的催化活性情况下进行的任何方法,即方法中存在粗或纯化的、溶解的、分散的或固定化的酶,或存在全微生物活的或静息的或失活的、破裂的细胞,其具有或表达这类酶活性。因此,生物催化方法包括酶和微生物方法。

“动力学拆分”是在对映体混合物如外消旋混合物中区分两种对映体的方式。在动力学拆分中,两种对映体以不同反应速度在化学反应中与手性催化剂或试剂反应,产生反应性较低(无反应性)对映体的对映体富集样品。动力学拆分依赖对映体之间的反应性差异。随着更多产物形成,对映体过量(ee)的未反应起始材料继续上升。

本文所述“酶动力学拆分”(EKR)指对映体混合物基于酶催化反应的动力学拆分,其中酶优选或专门转化对映体混合物的单个对映体成为相应的(对映体)产物。

本文所用术语“化学-酶动态动力学拆分”或“动态动力学拆分”或“动态拆分”(DKR)指如上定义的“酶动力学拆分”,偶联反应性较低或无反应性对映体的化学外消旋方法,从而再补充对映体形式的酶底物,其优选或专门由所应用的酶转化。进行本发明DKR的合适反应条件在后续描述中如下进一步说明。更特别地,这类条件将有利于在外消旋腈起始原料与其化学成分(即杂环胺、醛和HCN,例如吡咯烷、丙醛和HCN)之间形成平衡。特别地,合适反应条件包括任选地缓冲的水性或水性/有机反应介质,pH范围是6-10,更特别是6.5-8.5,并且反应温度范围是0-70℃,特别是5-35℃。熟知用于进一步改变可逆化学或生化反应平衡的不同方法,以特定方向,特别向产物一侧。更特别地,这类合适DKR反应条件还可包括过量或添加量的醛,例如丙醛(也参考下面章节的描述)。过量或添加量的醛可在完整过程或至少某一或多个反应阶段中存在,如反应开始时。相对于环胺例如吡咯烷,过量可特别是在大于1当量范围内,如1.1当量-10当量,特别是1.5-5当量,尤其是2-3当量。

术语“结构域”指沿着进化相关蛋白的序列比对,在特定位置保守的一组氨基酸或部分氨基酸残基序列。其他位置的氨基酸能在蛋白同源物之间变化,在这类结构域特定位置高度保守的氨基酸指示其可能是在蛋白结构、稳定性或功能方面必需的氨基酸。通过它们在蛋白同源物家族比对序列中高保守程度来鉴定,它们能用作标识(identifier)以确定是否有任何讨论中的多肽属于先前鉴定的多肽家族。

术语“基序”或“共有序列”或“标记”指进化相关蛋白序列中的短保守区。基序是结构域中的频繁高保守部分,但也可仅包括部分结构域。

“蛋白家族”定义为共有相同进化源的蛋白组,由其相关功能、序列相似性或相似的一级、二级或三级结构反映。蛋白家族内的蛋白通常同源并且具有保守的功能域和基序的相似结构。

存在专家数据库以鉴定结构域,例如SMART(Schultz et al.(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic et al.(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder et al.,(2003)Nucl.Acids.Res.31,315-318),Prosite(Bucher and Bairoch(1994),Ageneralized profile syntax for biomolecular se-quences motifs and its function in automatic sequence interpretation.(In)ISMB-94;Proceed-ings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,Eds.,pp53-61,AAAI Press,Menlo Park;Hulo et al.,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman et al.,Nucleic Acids Re-search 30(1):276-280(2002))。结构域或基序还可用常规技术鉴定,如通过序列比对。

本文所述靶化合物的“前体”分子转化成所述靶化合物,特比地通过合适多肽的酶作用,在所述前体分子上进行至少一种结构变化。

“腈水合酶”或“NHase”指有水合酶活性的多肽,其将底物分子的氰基通过添加分子水转化成酰胺基。本发明上下文中的NHase属于酶类别(EC 4.2.1.84)。本发明的NHase包括一条或多条,特别是2条相同或不同,特别是不同的多肽链,形成酶活性四级结构。本文所述2条不同多肽链也称为alpha(α)和beta(β)亚基。更特别地,本发明的NHase具有将α氨基腈底物转化成相应的α氨基酰胺产物的能力。

“(S)-腈水合酶”或“(S)-NHase”指具有水合酶活性的多肽,其主要、基本上或专门将底物分子特定立体异构体的氰基通过添加分子水转化成保留立体化学构型的酰胺基,所述底物分子含有至少一个不对称碳原子。本发明上下文中的(S)-NHase属于酶类别(EC4.2.1.84)。更特别地,如果具有将特定参照(S)-底物分子转化成相应的参照(S)-产物分子的能力,则本发明的NHase归类为本发明的(S)-NHase。本发明上下文中的特定参照底物是(S)-吡咯烷丁腈((S)-1),特定参照产物是(S)-吡咯烷丁酰胺((S)-2)。

“NHase活性”或“(S)-NHase活性”如下文所述在“标准条件”下测定。其能用重组的表达NHase的宿主细胞、破裂的表达NHase的细胞、这些的部分或富集或纯化的NHase测定。它能在培养基或反应培养基中测定,特别地缓冲的,pH范围为6-10,特别是6-8,温度范围是约0-50℃,如约5-35℃,特别是5-25℃,并且存在以初始浓度范围1-200mM加入的参照底物,特别是5-150mM,特别是25-100mM。形成相应产物的转化反应进行1分钟-24小时,特别是5分钟-5小时,更特别是约10分钟-2小时。反应产物随后可以常规方式测定,例如通过反应培养基的HPLC,任选地在移出未溶解或固体成分后。特定的参照底物是吡咯烷丁腈。为确定“(S)-NHase活性”,本文所用参照底物特别是(S)-1并且参照产物特别是(S)-2。

本发明上下文中的“辅助蛋白”涵盖任何蛋白类型,其改善本文所述NHase的重组表达。宿主生物体中酶的正确折叠和活性位点金属的正确整合对于催化活性是关键的。缺乏必需金属离子的非正确折叠的一种或多种酶具有降低的催化活性或没有催化活性,因为其倾向于在宿主中聚集(如包涵体)或降解。能应用不同策略以在宿主生物体中确保酶正确折叠。例如,非正确折叠的酶可能有时通过强变性化学物质展开,然后在生理条件下再折叠。然而,这种方法耗时并且昂贵。所谓“辅助蛋白”的共表达或文献中另外命名的“活性蛋白”,代表另一种更有效的方法。

“共表达”或“共同表达”应广义理解为只要其以某一方式进行,引起功能性NHase的α和β多肽亚基适当表达。当处于存在辅助蛋白的情况时,“共表达”或“共同表达”还应广义理解为只要其以某一方式进行,引起这类辅助多肽的协同作用,协助具有NHAse活性的多肽的功能表达,特别是支持作用以向活性位点引入必需金属离子和所述表达NHAse多肽的正确折叠。同时或基本上同时共表达两种多肽代表一个非限制性替代选择。另一非限制性替代选择可见于按时顺序表达两种多肽,开始表达辅助多肽,然后是NHAse多肽表达。另一非限制性替代选择可见于两种多肽的时间重叠共表达,其中初始阶段内仅表达辅助多肽并且重叠阶段内表达两种多肽。其他替代选择可由熟练的技术人员开发,而不需要创造性努力。

在分子生物学中,辅助蛋白大类也定名为分子“伴侣蛋白(chaperone)”,代表协助共价折叠或展开以及组装或分解其他大分子结构的蛋白。

“伴侣蛋白”组属于所述伴侣蛋白分子大类。这些伴侣蛋白的结构类似两个圆环样结构,堆放在另一个的顶部以产生桶。各环由7、8或9个亚基构成,这取决于在其中发现伴侣蛋白的生物体。

I组伴侣蛋白在细菌以及内共生起源的细胞器中发现:叶绿体和线粒体。II组伴侣蛋白在真核胞质和古细菌中发现,鉴定不太充分。GroEL/GroES复合体是I组伴侣蛋白。不认为II组伴侣蛋白利用GroES型辅因子来折叠它们的底物。

伴侣蛋白系统GroES/GroEL形成桶样结构,带有允许错误折叠蛋白摄入的腔,从而消耗ATP再折叠[Gragerov A,E Nudler,N Komissarova,GA Gaitanaris,ME Gottesman,VNikiforov.1992.Proc Nat Acad Sci 89,10341-10344;Keskin O,Bahar I,Flatow D,Covell DG,Jernigan RL.2002.Biochem 41,491-501]。

文献描述了不同于这类伴侣蛋白的其他“辅助蛋白”,其与例如NHase结构基因共表达后,显著增强重组表达的NHase的特异活性。用于本发明上下文的“辅助蛋白”的特定实例是选自异源蛋白组的那些,其在也包含上述腈水合酶(E.C.4.2.1.84)α和β亚基的操纵组(operon)中发现。其实例同样如下文所述。

术语NHase的“生物功能”、“功能”、“生物活性”或“活性”指本文所述NHase从相应的前体腈中催化至少一种酰胺形成的能力。

本文所用术语“宿主细胞”或“转化细胞”指细胞(或生物体)被改变成携带至少一种核酸分子,例如编码一种或多种所需蛋白的一个或多个重组基因或者一种或多种核酸序列,其在转录后产生至少一种本发明功能多肽,特别是上文所定义NHase。宿主细胞特别是细菌细胞,例如蓝藻细胞、真菌细胞或植物细胞或植物。宿主细胞可包含重组基因或数个基因,例如安排为操纵组,其整合入宿主细胞的核或细胞器基因组。或者,宿主可包含染色体外的重组基因设置。

术语“生物体”指任何非人的多细胞或单细胞生物体,如植物或微生物。特别地,微生物是细菌、酵母、海藻或真菌。

特定生物体或细胞意味着当它天然生成本文所定义α氨基酰胺或当它天然不生成所述酯但将其用本文所述核酸转化以生成所述α氨基酰胺时,它“能够生成α氨基酰胺”。所生成的α氨基酰胺的量高于天然存在的生物体或细胞的转化的生物体或细胞,也被“能够生成α氨基酰胺的生物体或细胞”涵盖。

特定生物体或细胞意味着当它天然生成本文所定义的靶产物(例如α氨基酰胺类化合物)或当它天然不生成所述靶产物但将其用本文所述核酸转化以生成所述靶产物时,它“能够生成靶产物”。所生成靶产物的量高于天然存在生物体或细胞的转化的生物体或细胞,也由“能够生成靶产物的生物体或细胞”涵盖。

术语“发酵生产”或“发酵”指微生物(由所述微生物包含或产生的酶活性协助)在细胞培养中生成化合物的能力,使用至少一种添加至孵育的碳源。

术语“发酵肉汤”应理解为指液体,特别是水性或水性/有机溶液,其基于发酵方法并且未被加工(work up)或已经被加工,例如本文所述。

“酶催化”或“生物催化”方法指所述方法在酶催化作用下进行,包括本文所定义酶突变体。因此,所述方法能在分离的(纯化的、富集的)或粗形式的所述酶存在下或者细胞系统,特别是天然或重组微生物细胞的存在下进行,所述细胞包含所述活性形式酶并且具有催化本文所公开转化反应的能力。

本文所述“酶”可以是天然或重组生成的酶,其可以是野生型酶或通过适当突变或C-和/或N-末端氨基酸序列延伸(如含His标签的序列)来遗传修饰。酶能够与细胞例如蛋白杂质基本混合,但特别地以纯德形式。合适的检测方法描述于例如下面给出或通过文献已知的实验章节。

“纯形式”或“纯”或“基本上纯”的酶应根据本发明理解为纯化程度相对于总蛋白含量高于80的酶,特别地高于90,尤其高于95,并且相当特别地高于99wt%,通过通常地蛋白检测方法测定,例如双缩脲法或根据Lowry等人的蛋白检测(参考R.K.Scopes,ProteinPurification,Springer Verlag,New York,Heidelberg,Berlin(1982)的描述)。

“蛋白原”氨基酸具体包括(单字母密码子):G、A、V、L、I、F、P、M、W、S、T、C、Y、N、Q、D、E、K、R和H。

本发明所述“固定化”指根据本发明所用生物催化剂的共价或非共价的结合,例如在固体上的NHase,即基本上不溶于周围液体介质,载体材料。根据本发明,全细胞如根据本发明使用的重组微生物,也能相应地由这类载体方式固定化。

对于生成特定立体异构体和/或转化立体异构体,对特定酶或酶突变体所观察的术语“对映选择性改善”,指相对于参照酶观察到的对映选择性改善,特别是显示对映选择性改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表达对映选择性的合适参数在本文中定义为ee%-值。

对于转化特定底物,对特定酶或酶突变体所观察的术语“转化底物的酶活性改善”,指相对于参照酶观察到的转化改善,特别是显示所述转化改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表达转化的合适参数是以%表示的底物浓度减少,例如摩尔%,或以%表示的产物浓度增加,例如摩尔%。在底物包括立体异构体混合物的情况中,底物浓度指所有立体异构体的总体浓度。

对于它的酶活性的氰化物耐受性,对特定酶或酶突变体所观察的术语“氰化物耐受性改善”,指相对于参照酶观察到的所述耐受性改善,特别是显示所述耐受性改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表达氰化物耐受性的合适参数是在所述酶或酶突变体转化反应期间于特定氰化物浓度观察到的剩余酶比活性(U/mg),以缺乏氰化物情况下的%初始特异活性表示。

对于它的酶活性的底物耐受性,对特定酶或酶突变体所观察的术语“底物抑制减少”,指相对于参照酶观察到的它对底物抑制的耐受性的改善,特别是显示所述耐受性改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表示底物抑制的合适参数是特定底物的相应的K

对于它的酶活性的产物耐受性,对特定酶或酶突变体所观察的术语“产物抑制减少”,指相对于参照酶观察到的它对产物抑制的耐受性的改善,特别是显示所述耐受性改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表示产物抑制的合适参数是特定产物的相应的K

对于它的酶活性的操作稳定性,对特定酶或酶突变体所观察的术语“操作稳定性改善”,指相对于参照酶观察到的每分子酶所形成的产物总量的改善,特别是显示所述耐受性改善的未突变亲本酶或在突变体所含突变数目和/或类型方面不同的酶突变体。表示操作稳定性的合适参数是总失误数(total turnover number)。

c)化学术语:

本发明上下文中的术语“内酰胺衍生物”特指获自化学前体化合物的化合物,所述化合物包括环氨基,通过酶反应或特别地化学氧化反应将所述环氨基转化成内酰胺(或分子内酰胺)基团。

“烃”基是化学基团,其基本上由碳原子和氢原子构成并且可以是非环、线性或分支、饱和或不饱和部分,或者环饱和或未饱和部分,芳香族或非芳香族部分。烃基在非环结构情况下包括1-30、1-25、1-20、1-15或1-10或1-6或1-3个碳原子。它在环结构情况下包括3-30、3-25、3-20、3-15、3-10或特别是3、4、5、6或7个碳原子。特别地,它是非环、线性或分支、饱和或未饱和,特别是饱和部分,其包括1-10或特别地1-6或更特别地1-3个碳原子。

所述烃基可以是未取代的或可携带至少1个,如1、2、3、4或5,2个取代基;特别地它是未取代的。

这类烃基的具体实例是如下定义的非环线性或分支烷基或烯基残基;

“烷基”残基代表线性或分支、饱和烃残基。所述术语包括长链和短链烷基。其包括1-30、1-25、1-20、1-15或1-10或1-7,特别是1-6、1-5、或1-4或更特别是1-3个碳原子。

“烯基”残基代表线性或分支、单不饱和或多不饱和烃残基。所述术语包括长链和短链烯基。它包括2-30、2-25、2-20、2-15或2-10或2-7,特别是2-6、2-5或更特别地2-4个碳原子。可具有多至10,如1、2、3、4或5,特别是1或2,更特别是1个C=C双键。

术语“低级烷基”或“短链烷基”代表饱和、直链或支链烃基,具有1-3、1-4、1-5、1-6或1-7,特别是1-3个碳原子。例如,可提及:甲基、乙基、正丙基、1-甲基乙基、正丁基、1-甲基丙基、2-甲基丙基、1,1-二甲基乙基、正戊基、1-甲基丁基、2-甲基丁基、3-甲基丁基、2,2-二甲丙基、1-乙基丙基、正己基、1,1-二甲基丙基、1,2-二甲基丙基、1-甲基戊基、2-甲基戊基、3-甲基戊基、4-甲基戊基、1,1-二甲基丁基、1,2-二甲基丁基、1,3-二甲基丁基、2,2-二甲基丁基、2,3-二甲基丁基、3,3-二甲基丁基、1-乙丁基、2-乙丁基、1,1,2-三甲基丙基、1,2,2-三甲基丙基、1-乙基-1-甲基丙基和1-乙基-2-甲基丙基;以及正庚基,以及其单分支或多分支类似物。

“长链烷基”代表例如饱和直链或支链烃基,具有8-30例如8-20或8-15个碳原子,例如辛基、壬基、癸基、十一烷基、十二烷基、十三烷基、十四烷基、十五烷基、十六烷基、十七烷基、十八烷基、十九烷基、二十烷基、二十一烷基、二十二烷基、二十三烷基、二十四烷基、二十五烷基、二十六烷基、二十七烷基、二十八烷基、二十九烷基、三十烷基(squalyl)、结构异构体,尤其是其单分支或多分支异构体。

“长链烯基”代表上述“长链烷基”的单不饱和或多不饱和类似物。

“短链烯基”(或“低级烯基”)代表单不饱和或多不饱和,尤其是单不饱和、直链或支链烃基,具有2-4、2-6或2-7个碳原子和任意位置的一个双键,例如C

上述残基的“取代基”包含一个杂原子,如O或N。特别地取代基独立选自–OH、C=O或–COOH。

上面特定涉及的环饱和或不饱和部分指单环烃基,含有一个任选取代的、饱和或不饱和烃环基(或“碳环”基)。环可包括3-8,特别是5-7,更特别是6个环碳原子。作为单环残基实例,可提及“环烷基”基团,其是具有3-7个环碳原子的碳环基,如环丙基、环丁基、环戊基、环己基、环庚基和环辛基;以及相应的“环烯基”基团。“环烯基”(或“单或多不饱和环烷基”)代表,特别地代表单环、单不饱和或多不饱和碳环基,具有5-8,特别地多至6个碳环成员,例如单不饱和环戊烯基、环己烯基、环庚烯基和环辛烯基。

这类单环烃残基中取代基的数目可从1变到5,特别是1或2个取代基。这类环残基的合适取代基选自低级烷基、低级烯基或含一个杂原子如O或N的残基,例如–OH或–COOH。特别地取代基独立选自–OH、–COOH或甲基。

不饱和环基可包含一个或多个,例如1、2或3个C=C键并且是芳香族或特定是非芳香族。

上述环基还可包含至少一个如1、2、3或4,优选1或2个环杂原子,如O、N或S,特别是N或O。

本文所用术语“盐”特别地指碱金属盐,如化合物的Li盐、Na盐和K盐,碱土金属盐,如化合物的Be盐、Mg盐、Ca盐、Sr盐和Ba盐;以及铵盐,其中铵盐包括NH

本发明所述的术语化合物的“烷基酯”特别是低级烷基酯,例如C

发明的特别的实施方案

本发明涉及下列特别的实施方案:

1.一种制备通式I的α氨基酰胺的生物催化方法

其中

n是0或1-4的整数;特别是1或2,更特别是1,并且

R

任选地基本上为立体异构纯形式或作为立体异构体的混合物;如特别地相对于式I化合物的立体异构体总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例,特别是在R

1)使通式II的α氨基腈与具有腈水合酶(NHase)(E.C.4.2.1.84)活性的多肽接触

其中,n、R

从而特别地将所述通式II的腈化合物转化,特别地水合,成所述通式I的化合物,任选地基本上为立体异构纯形式或作为立体异构体的混合物;特别地基本上为立体异构纯形式,如特别地相对于式I化合物的立体异构体总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例,

以及

2)任选地分离式I的化合物。

这类方法可分批,半分批或连续进行。

2.实施方案1的方法,其中应用式II的腈,其中n和R

3.实施方案2的方法,其中应用通式IIa的腈,

所述通式IIa的腈包含在氰基α位置的不对称碳原子,并且

其中

n和R

R

其中所述腈以立体异构体的混合物形式应用,特别是在氰基α位置碳原子处包含(S)-或(R)-构型的异构体的混合物,并且其中所述立体异构混合物经由化学-酶动态动力学拆分(DKR)转化成反应产物,所述反应产物含有立体异构过量的式Ia化合物或式Ib化合物;特别是式Ia化合物,并且特别地基本上为立体异构纯形式,如相对于式I化合物的立体异构体总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例

其中

n、R

4.实施方案3的方法,其中获得反应产物,所述反应产物包含立体异构过量的式I-1a化合物或式I-1b化合物

其中

R

并且特别地处于立体异构过量,所述立体异构过量对应相对于立体异构体I-1a和I-1b的总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例。

5.实施方案4的方法,其中获得反应产物,所述反应产物包含立体异构过量的式XIa化合物或式XIb化合物

并且特别地处于立体异构过量,所述立体异构过量对应相对于立体异构体XIa和XIb的总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例。

6.实施方案4的方法,其中获得反应产物,所述反应产物包含立体异构过量的式XXIa化合物或式XXIb化合物

并且特别地处于立体异构过量,所述立体异构过量对应相对于立体异构体XXIa和XXIb的总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%的比例。

7.实施方案1的方法,其中获得含有式XX化合物的反应产物

8.前述实施方案中任一项的方法,其中所述步骤1)在分离的、富集的或粗NHase酶的存在下,或在功能性表达所述酶的重组生物体特别是微生物的存在下进行,特别是这类重组微生物的静息细胞,或者从其获得的非活的细胞、破裂细胞或细胞匀浆,或者无细胞体外表达系统。

9.前述实施方案中任一项的方法,其中所述NHase是如上所定义的(S)-NHase并且所获得的产物是式Ia化合物。

10.前述实施方案中任一项的方法,其中所述(S)-NHase选自多肽,所述多肽是非含咕啉钴的NHase或非含血红素铁的NHase的家族成员。

11.实施方案10的方法,其中所述(S)-NHase是异二聚体,所述异二聚体由一个α多肽亚基和一个β多肽亚基构成。

12.实施方案1的方法,其中所述(S)-NHase选自以下酶:

a)CtNHase,其包含根据SEQ ID NO:15或与SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:2或与SEQ ID NO:2具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;

b)KoNHase,其包含根据SEQ ID NO:17或与SEQ ID NO:17具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:4或与SEQ ID NO:4具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;

c)NaNHase,其包含根据SEQ ID NO:19或与SEQ ID NO:19具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:6或与SEQ ID NO:6具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;

d)GhNHase,其包含根据SEQ ID NO:21或与SEQ ID NO:21具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:8或与SEQ ID NO:8具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;

e)PkNHase,其包含根据SEQ ID NO:27或与SEQ ID NO:27具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及包含根据SEQ ID NO:13的部分多肽序列或与SEQ IDNO:13的所述部分序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-Nhase活性;

f)PmNHase,其包含根据SEQ ID NO:23或与SEQ ID NO:23具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:10或与SEQ ID NO:10具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;和

g)ReNHase,其包含根据SEQ ID NO:25或与SEQ ID NO:25具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,以及根据SEQ ID NO:12或与SEQ ID NO:12具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性。

13.实施方案12的方法,其中所述(S)-NHase选自CtNHase突变体,在所述突变体根据SEQ ID NO:15的α多肽亚基中含有至少一个,例如1-10,特别是1、2、3、4或5个氨基酸突变,特别是取代,和/或在所述突变体根据SEQ ID NO:2的β多肽亚基中含有至少一个,例如1-10,特别是1、2、3、4或5个氨基酸突变,特别是取代,同时保留(S)-NHase活性。

任选地,相较包含根据SEQ ID NO:15的α多肽亚基和根据SEQ ID NO:2的β多肽亚基的未突变的亲代酶,所述突变显示至少一种下列改善:

a)用于生成式(I-1a)特别是式Xia化合物的对映选择性改善,特别地显示用于生成相应式XIa的对映体(S)-2的ee%值>84%,如85-约100%或特别地90-99.9%或甚至更特别地95-99.9%;

b)用于转化式II底物的活性改善,特别是外消旋底物rac-1,为至少1-1000%,特别地1-500%,例如10%、20%、50%、100%、150%、200%、250%或300%;

c)氰化物耐受性改善,从而例如酶活性在1-100mM氰化物浓度范围下保留到100%,特别地5-75mM,例如5mM、10mM、20mM、30mM、40mM、50mM或60mM;

d)至少一种式II底物的底物抑制减少,从而例如初始活性率在10-750mM,特别地在50-500mM,例如在50mM、75mM、100mM、125mM、150mM、200mM、300mM、400mM、500mM底物的存在下保留;

e)至少一种式(I-1a)化合物特别是式(XIa)化合物的产物抑制减少,从而例如初始活性率在10-750mM,特别地在50-500mM,例如50mM、75mM、100mM、125mM、150mM、200mM、300mM、400mM、500mM产物的存在下保留;

f)热稳定性改善和/或抗剪切力(sheer force)的稳定性改善;以及

g)2-OH-丁腈水解的副活性降低,

其中这些特性a)-g)可独立或以任何组合形式存在。

第一特别组的突变体显示对映选择性改善,如上面a)所定义。

第二特别组的突变体显示底物转化改善,如上面b)所定义。

第三特别组的突变体显示如上面a)所定义的对映选择性改善以及如上面b)所定义的底物转化改善。

第四特别组的突变体显示如上面a)所定义的对映选择性改善,如上面b)所定义的底物转化改善以及如上面c)所定义的氰化物耐受性改善。

第五特别组的突变体显示如上面a)所定义的对映选择性改善,如上面b)所定义的底物转化改善以及如上面d)所定义的底物抑制减少。

第六特别组的突变体显示如上面a)所定义的对映选择性改善,如上面b)所定义的底物转化改善以及如上面e)所定义的产物抑制减少。

第七特别组的突变体显示如上面a)所定义的对映选择性改善,如上面b)所定义的底物转化改善以及如上面f)所定义的任选的稳定性改善和/或抗剪切力的稳定性改善。

第八特别组的突变体显示如上面a)所定义的对映选择性改善,如上面b)所定义的底物转化改善以及如上面g)所定义的2-OH-丁腈水解的副活性降低。

第九特别组的突变体显示a)-g)所有点的改善。

14.实施方案13的方法,其中所述CtNHase突变体选自这样的突变体:

在其根据SEQ ID NO:15的α多肽亚基中具有至少一个在序列位置中的突变,特别是氨基酸取代,所述序列位置选自

α序列位置

αA71X、αK73X、αD79X、αT81X、αL87X、αG94X、αV98X、

αE101X、αN102X、αT103X、αA105X、αV106X、αV110X;

αP121X、αG124X、αY135X、αV140X、αL147X、V153X、αA156X、αL173X、

αP174X;

特别是αV110X和αP121X,

其中各X独立选自天然氨基酸;并且特别地所述α多肽亚基的突变体,其至少改善式II底物的底物转化,特别是外消旋底物rac-1

和/或在其根据SEQ ID NO:2的β多肽亚基中具有至少一个在序列位置中的突变,特别是氨基酸取代,所述序列位置选自

β序列位置

βT32X、βV33X、βM34X、βS35X、βL36X、βL40X、βA42X、βN43X、βN45X、

βF46X、βN47X、βL48X、βE50X、βF51X、βR52X、βH53X、βG54X、βE56X、

βR57X、βN59X、βI61X、βD62X、βL64X、βK65X、βG66X、βT67X、βE70X;

βG125X、βA126X、βR127X、βA128X、βR129X、βA131X、βV132X、βG133X、

βV136X、βR137X、βK141X、βP143X、βV144X、βG145X、βH146X、βP150X、

βY152X、βT153X、βG155X、βK156X、βV157X、βT159X、βI162X、βH164X、

βG165X、βV166X、βF167X、βV168X、βT169X、βP170X;

特别是βL48X、βF51X、βG54X、βH146X和βF167X,

其中各X独立选自天然氨基酸;并且特别地所述β多肽亚基的突变体,其至少改善用于生成式(I-1a)特别是式XIa化合物的对映选择性,特别地显示用于生成相应式XIa的对映体(S)-2的ee%值>84%,如85-约100%或特别地90-99.9%或更特别地95-99.9%,或甚至更特别地99-99.9%。

15.实施方案14的方法,其中所述CtNHase突变体选自:

a)单突变体:βF51L、βF51I、βF51V、βL48R和βL48P;

b)双突变体:

αV110I/βF51L、

αP121T/βF51L、

βF51V/βG54V、

βF51V/βG54I、

βF51V/βG54R、

βF51I/βG54R、

βN43I/βG54C、

βF51I/βE70L、

βH53L/βG54V、

αV110I/βL48R、

αV110I/βL48P、

αV110I/βL48F、

αP121T/βL48R、

αP121T/βL48P、

αP121T/βL48F、

βH146L/βF167Y、

βL48R/βG54C、

βL48R/βG54R、

βL48R/βG54V、

βL48P/βG54C、

βL48P/βG54R、

βL48P/βG54V、

βL48F/βG54C、

βL48F/βG54R、和

βL48F/βG54V;

特别是

αV110I/βF51L、

αP121T/βF51L、

βF51V/βG54V、

βN43I/βG54C、

βF51I/βE70L、

βH53L/βG54V、

αP121T/βL48R、

βH146L/βF167Y、和

βL48R/βG54V;

c)三突变体

βF51L/βH146L/βF167Y、

βL48R/βH146L/βF167Y、

βL48P/βH146L/βF167Y、

βL48F/βH146L/βF167Y、

αV110I/βF51V/βG54I、

αP121T/βF51V/βG54I、

βL48P/βF51V/βG54V、和

βL48R/βF51I/βG54I;

特别是βL48R/βF51I/βG54I

d)多重突变体:

βF51I/βG54R/βH146L/βF167Y、

βF51V/βG54I/βH146L/βF167Y、

βF51V/βG54R/βH146L/βF167Y、

βF51V/βG54V/βH146L/βF167Y、

αV110I/αP121T/βF51I/βH146L/βF167Y、

αV110I/αP121T/βF51L/βH146L/βF167Y。

16.前述实施方案中任一项的方法,其中所述式II的外消旋化合物的对映选择性转化在至少一种下列条件下连续或间断性进行:

a)水性或水性-有机反应介质;

b)存在添加量的醛,特别是式II腈在水性介质中的自发分解期间所形成的醛,如特别是形成自式rac-1化合物的丙醛,浓度范围为1-200mM,更特别地5–150mM,特别是25-100mM;

c)pH控制,特别地通过应用6-10范围内的pH,更特别地6-8,特别是6.5-7.5;

d)温度控制,特别地通过应用0-50℃范围内的温度,更特别地5-35℃,特别是5-25℃;

e)底物浓度控制,特别地通过应用1-200mM范围内的浓度,更特别地5–150mM,特别是25-100mM;尤其是连续或逐步控制底物浓度,特别地通过应用1-200mM范围内的浓度,更特别地5–150mM,特别是25-100mM;

f)醛浓度控制,如特别是形成自式rac-1化合物的丙醛,特别地通过应用1-200mM范围内的醛浓度,更特别地5–150mM,特别是25-100mM;尤其是连续或逐步控制醛浓度(如特别是形成自式rac-1化合物的丙醛),特别地通过应用1-200mM范围内的醛浓度,更特别地5–150mM,特别是2-100mM;

g)0.01-100mg/ml CWW范围内的催化剂浓度,特别地0.1–20mg/ml,更特别地2-10mg/ml CWW;

h)存在添加量的环胺,特别是式II腈在水性介质中的自发分解期间所形成的环胺,如特别是形成自式rac-1化合物的吡咯烷,浓度范围为1-200mM,更特别地5–150mM,特别是25-100mM;或者

i)环胺浓度控制,特别是式II腈在水性介质中的自发分解期间所形成的环胺,如特别是形成自式rac-1化合物的吡咯烷,特别地通过应用1-200mM浓度范围内的环胺,更特别地5–150mM,特别是25-100mM;尤其是连续或逐步控制环胺浓度,如特别是形成自式rac-1化合物的吡咯烷,特别地通过应用1-200mM范围内的醛浓度,更特别地5–150mM,特别是25-100mM。

在上面条件的任意下列组合情况下进行特定方法:

a)+b)

a)+b)+c)

a)+b)+c)+d)

a)+b)+c)+d)+e)或

a)+b)+c)+d)+f)

各任选地与g)组合;

或者

a)+h)

a)+c)+h)

a)+c)+d)+h)

a)+c)+d)+e)+h)或

a)+c)+d)+f)+h)

各任选地与g)组合;

或者

a)+h)+i)

a)+c)+h)+i)

a)+c)+d)+h)+i)

a)+c)+d)+e)+h)+i)或

a)+c)+d)+f)+h)+i)

各任选地与g)组合;

或者

a)+b)+h)

a)+b)+c)+h)

a)+b)+c)+d)+h)

a)+b)+c)+d)+e)+h)或

a)+b)+c)+d)+f)+h)

各任选地与g)组合;

或者

a)+b)+h)

a)+b)+c)+h)+f)+i)

a)+b)+c)+d)+h)+f)+i)或

a)+b)+c)+d)+e)+h)+f)+i)

各任选地与g)组合;

或者

特别地

a)+b)+c)+d)+e)+f)+g);或

a)+b)+c)+d)+e)+f)+g)+h)+i)。

本文所用术语“控制”涵盖连续、间断性或逐步测量以及任选地补充相应化合物以维持所述化合物的初始浓度或维持其浓度在预期浓度范围内。

醛,如特别是丙醛,或环胺,如特别是吡咯烷,或者两者可被添加至反应混合物,并且它们的浓度可控制以改变分解和腈(II)或IIa的新形成的平衡,特别是R-1分解和尤特别是rac-1的新形成,从而结合游离氰化物并因此尽可能减少游离氰化物阴离子浓度,由此最小化或甚至避免氰化物的Nhase抑制。

17.前述实施方案中任一项的方法,其中所述NHase酶在共表达至少一种NHaseα亚基和至少一种NHaseβ亚基以及至少一种辅助蛋白的情况下重组表达,特别地大肠杆菌作为表达宿主,更特别是大肠杆菌BL21。

18.实施方案17的方法,其中所述辅助蛋白选自

a)辅助蛋白,其与NHase的α亚基和β亚基来源于相同的生物体,特别地辅助蛋白包含选自SEQ ID NO:137、139、141、143和145的氨基酸序列,或与SEQ ID NO:137、139、141、143和145中的任意一种具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性;和

b)伴侣蛋白,尤别是GroES/EL或DnaK/j-GrpE。

19.实施方案18的方法,其中

a)如实施方案12-15中任一项所定义的CtNHase或其突变体与辅助蛋白共表达,所述辅助蛋白包含根据SEQ ID NO:137的多肽序列或与SEQ ID NO:137具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性;

b)实施方案12所定义的KoNHase与辅助蛋白共表达,所述辅助蛋白包含根据SEQID NO:139的多肽序列或与SEQ ID NO:139具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性;

c)如实施方案12所定义的NaNHase与辅助蛋白共表达,所述辅助蛋白包含根据SEQID NO:141的多肽序列或与SEQ ID NO:141具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性;

d)如实施方案12所定义的GhNHase与辅助蛋白共表达,所述辅助蛋白包含根据SEQID NO:143的多肽序列或与SEQ ID NO:143具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性

e)如实施方案12所定义的PmNHase与辅助蛋白共表达,所述辅助蛋白包含根据SEQID NO:144的多肽序列或与SEQ ID NO:144具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性;并且

f)如实施方案12所定义的ReNHase与辅助蛋白共表达,所述辅助蛋白包含根据SEQID NO:145的多肽序列或与SEQ ID NO:145具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列,同时保留其作为辅助蛋白的活性。

20.一种分离的(S)-NHase酶,其选自

a)KoNHase,其包含根据SEQ ID NO:17或与SEQ ID NO:17具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的α多肽亚基,和/或根据SEQ ID NO:4或与SEQ ID NO:4具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的序列的β多肽亚基,同时保留(S)-NHase活性;和

b)CtNHase突变体,其保留(S)-NHase活性并且包含突变的α多肽亚基,其与SEQ IDNO:15至少有一个氨基酸残基不同并且与SEQ ID NO:15具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性和/或突变的β多肽亚基,其与SEQ ID NO:2至少有一个氨基酸残基不同并且与SEQ ID NO:2具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性。

21.实施方案20b)的分离的(S)-NHase突变体,其中所述突变体选自如实施方案13-15中任一项所定义的CtNHase突变体。

22.一种核酸分子,所述核酸分子包含编码如实施方案20和21中任一项所定义的功能性(S)-NHase酶多肽亚基的核苷酸序列。

23.实施方案22的核酸分子,其中所述核酸分子还包含编码至少一种辅助多肽的核苷酸序列,所述辅助多肽协助(S)-NHase多肽亚基的组装,包括其非咕啉钴和非血红素铁中心,特别地选自编码辅助蛋白的核酸分子,所述核酸分子包含选自SEQ ID NO:136、138、140、142和144的核酸序列,或与SEQ ID NO:136、138、140、142和144中的任意一种具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或99.9%序列相同性的核酸序列,同时保留其编码多肽的能力,所述多肽具有作为辅助蛋白的活性。

24.一种表达盒,其包含在至少一种调节的核苷酸序列控制下的如实施方案22或23所定义的至少一种核苷酸序列。

25.一种表达载体,其包含如实施方案24所定义的至少一种表达盒。

26.一种重组微生物,其携带如实施方案22或23所定义的至少一种核酸或者实施方案24所述的至少一种表达盒或者实施方案25所述的至少一种表达载体。

这类重组微生物的特别的实施方案涵盖完整(活的)、失活的、非活的或静息的细胞微生物。

27.一种制备式IIIa或IIIb的内酰胺化合物的化学-生物催化方法

其中

n是0或1-4的整数;特别是1或2,更特别是1,并且

R

任选地基本上为立体异构纯形式或作为立体异构体的混合物;如特别地相对于式IIIa和IIIb的立体异构体总量的至少90%、91%、92%、93%、94%,更特别地95%、96%、97%、98%、99%、99.5%、99.9%或100%,

所述方法包括下列步骤

1)任选地化学合成式IIc的α氨基腈的立体异构混合物

其中,n、R

其通过Strecker合成,特别地通过使氰化物化合物,特别是HCN或碱金属或碱土金属氰化物,如更特别是NaCN或KCN,式R

其中,n和R

2)对映选择性生物催化转化式IIc化合物,任选地如步骤1)所述获得,其通过实施方案1-19中任一项所定义的方法,经由化学-酶动态动力学拆分以获得反应产物,所述反应产物含有立体异构过量的式Ia化合物或式Ib化合物:

其中,n、R

以及

3)将所述Ia或Ib的α氨基酰胺化学氧化为通式IIIa或IIIb的相应内酰胺衍生物

其中,n、R

28.实施方案27的方法,其中用非均相或均相氧化催化剂进行步骤3)的化学氧化,特别是均相催化剂,所述催化剂能够在酰胺基α-位的不对称碳原子基本保留立体化学的情况下氧化式(Ia)或(Ib)化合物的杂环α氨基。

29.实施方案28的方法,其中所述氧化催化剂选自无机钌盐,特别是(+III)、(+IV)、(+V)或(+VI)盐,更特别是(+III)或(+IV)盐与至少一种能够将钌盐,特别是(+III)、(+IV)、(+V)或(+VI)盐,更特别是(+III)或(+IV)原位氧化成,特别是钌(+VIII)盐的氧化剂的组合,并且任选地存在单价或多价金属配体,例如草酸钠。

30.实施方案29的方法,其中所述无机钌(+III)或(+IV)盐选自RuCl

31.实施方案30的方法,其中所述氧化剂选自

a)碱性高碘酸盐,特别是碱性-偏高碘酸盐,特别是NaIO

b)碱性氯酸盐,特定是NaOCl,其水合物,特别是NaOCl*5H

c)a)与b)的混合物。

32.实施方案29-31中任一项的方法,其中所述氧化催化剂选自

a)RuO

b)RuO

c)RuCl

d)RuCl

e)RuCl

f)a)-d)中每一个与单价或多价金属配体的组合,例如草酸钠。

33.实施方案29-32中任一项的方法,其中通过使所述式Ia化合物或所述式Ib化合物的水性或水性-有机溶液在0-30℃的温度范围内与氧化催化剂反应进行化学氧化。

34.实施方案29-33中任一项的方法,其中通过使所述式Ia化合物或所述式Ib化合物与催化量的所述无机钌盐,特别是所述(+III)或(+IV)盐和所述氧化剂反应进行化学氧化,其中所述式Ia或Ib化合物与氧化剂的初始摩尔比在1:1-1:5范围内,特别是1:1.5-1:3。

35.实施方案29-34中任一项的方法,其中添加单价或多价金属配体至反应混合物,从而所述钌(+III)或(+IV)盐与所述配体的摩尔比在1:1-1:5范围内,特别是1:1.5-1:2.5。

36.实施方案27-35中任一项的方法,其中获得的内酰胺衍生物选自式XIIIa的左乙拉西坦和式XXIa的布瓦西坦以及式XX的吡拉西坦。

37.实施方案27-36中任一项的方法,其中所述方法还包括回收,例如通过从反应培养基中沉淀,以及电化学再利用消耗的氧化剂,特别是将碱性卤酸盐电化学氧化恢复至(back to)碱性高卤酸盐氧化剂,更特别是将碱性碘酸盐,尤其是碘酸钠或碘酸钾电化学氧化,恢复至碱性高碘酸盐氧化剂,尤其是高碘酸钠或高碘酸钾氧化剂。

优选将碘酸钠至高碘酸钠电化学再利用。

特别地,碱性卤酸盐更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾,甚至更特别是碘酸钠,如下文更详细所述分离自反应混合物。例如,通过沉淀分离,特别地通过应用水溶性有机溶剂,例如进行醇沉分离。更特别地,添加甲醇或异丙醇以形成沉淀物。这个沉淀物随后可被分离,例如通过过滤,任选地通过倾析。因而所得卤酸盐,特别是碘酸盐,甚至更特别是碘酸钠,随之可经历电化学再利用方法。

以此类推,本发明允许在任何其他化学和/或生物化学氧化反应中将消耗的任意碱性高卤酸盐氧化剂再利用,并且特定是将碱性卤酸盐电化学氧化,恢复至碱性高卤酸盐氧化剂,更特别是将碱性碘酸盐,尤其是碘酸钠或碘酸钾,甚至更特别是碘酸钠电化学氧化,恢复至碱性高碘酸盐氧化剂,尤其是高碘酸钠或高碘酸钾氧化剂,甚至更特别地恢复至高碘酸钠,其随后可再次用于所述化学或生物化学氧化方法。

38.实施方案37的方法,其中所述电化学再利用包括将所述碱性卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾,甚至更特别是碘酸钠阳极氧化,恢复至所述碱性高卤酸盐氧化剂,特别地恢复至碱性高碘酸盐氧化剂,如高碘酸钠或高碘酸钾氧化剂,甚至更特别地恢复至高碘酸钠氧化剂。

39.实施方案37或38的方法,其中应用硼掺杂金刚石阳极。

40.实施方案27-39中任一项的方法,其中所述阳极氧化在至少一种下列条件下进行:

a)(1)至少一种碱性卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾的水溶液,初始浓度c

b)水溶液的pH为7或更高,如pH为至少8,优选至少10,特别为至少12,更特别为至少13,并且具体为至少14,

c)温度范围为0-80℃,更优选10-60℃,特别为20-30℃并且具体为20-25℃,

d)电压范围为1-30V,特别为1-20V并且更特别为1-10V,

e)电流密度范围为10-500mA/cm

f)应用的电荷范围为1-10法拉(Farad),更优选2-6F,特别为2.5-4F并且具体为2.75-3.5法拉,

特别是包含至少特征a)、b)、e)和f)的组合。

特别地,最优电流密度j能在所应用的电解类型方面由本领域技术人员确定。批式或分批电解可使用10-500mA/cm

一般,在较高流速或较高卤酸盐(如碘酸盐)浓度下,电流密度j可以更高,而在较低流速或较低卤酸盐(如碘酸盐)浓度下,电流密度必须更低以维持电流效率(CE)。

在一个特别的实施方案中,所述碱性卤酸盐的碱性水溶液中碱的初始摩尔浓度c

在另一个特别的实施方案中,所述水溶液的pH为至少12、至少13并且具体为至少14。

在另一个特别的实施方案中,所述至少一种碱性卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾在所述水溶液中的初始浓度c

在另一个特别的实施方案中,所述c

在另一个特别的实施方案中,应用包含至少上面特征a)、b)、e)和f)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

在另一个特别的实施方案中,应用包含至少上面特征a)和b)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

根据其一个非常特别的实施方案,所述碱金属是钠,并且再利用的产物是高碘酸钠,以仲高碘酸钠获得。

根据所述非常特别的实施方案,下列具体参数可单独或组合应用:

-在分批电解中,电流密度j的范围为50-100mA/cm

-应用的电荷Q的范围为3-4F

-初始浓度c

-初始浓度c

-c

在本发明碘酸盐再利用方法的另一特别的实施方案中,通过电解优先获得的仲高碘酸盐转化成偏高碘酸盐。

出于此目的,电解后,仲高碘酸盐分离自阳极液,如下更详细所述。在阳极室通过过滤或倾析从液相获得沉淀物。沉淀可通过常规方式完成,例如通过添加氢氧化钠或浓缩溶剂。为了获得偏高碘酸盐,通过添加酸来中和所述仲高碘酸盐,特别是硫酸或硝酸并且随后以已知方式自身再结晶。

41.一种制备碱性高卤酸盐,特别是高碘酸盐的方法,所述方法包括将碱性卤酸盐,特别是碘酸盐的电化学阳极氧化为碱性高卤酸盐,特别是高碘酸盐,其中特别地应用硼掺杂金刚石阳极。所述碱性阳离子特别地选自钠或钾,尤其是钠。

42.实施方案41的方法,其中应用硼掺杂金刚石阳极。

43.实施方案41或42的方法,其中所述阳极氧化在至少一种下列条件下进行:

a)(1)至少一种碱性卤酸盐,特别是碘酸盐的水溶液,初始浓度c

b)水溶液的pH为7或更高,如pH为至少8,优选至少10,特别为至少12,至少13并且具体为至少14,

c)温度范围为0-80℃,更优选10-60℃,特别为20-30℃并且具体为20-25℃,

d)电压范围为1-30V,特别为1-20V并且更特别为1-10V,

e)电流密度范围为10-500mA/cm

f)应用的电荷范围为1-10F,更优选2-6F,特别为2.5-4F并且具体为2.75-3.5F,

特别地,最优电流密度j能在所应用电解类型方面由本领域技术人员确定。批式或分批电解可使用10-1000mA/cm

一般,在较高流速或较高卤酸盐(如碘酸盐)浓度下,电流密度j可以更高,而在较低流速或较低卤酸盐(如碘酸盐)浓度下,电流密度必须更低以维持电流效率(CE)。

在一个特别的实施方案中,所述碱性卤酸盐的碱性水溶液中碱的初始摩尔浓度c

在另一个特别的实施方案中,所述水溶液的pH为至少12、至少13并且具体为至少14。

在另一个特别的实施方案中,所述至少一种碱性卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾在所述水溶液中的初始浓度c

在另一个特别的实施方案中,所述c

在另一个特别的实施方案中,应用包含至少特征a)、b)、e)和f)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

在另一个特别的实施方案中,应用包含至少上面特征a)和b)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

根据其一个特别的实施方案,所述碱金属是钠,并且所获得的产物是高碘酸钠,以仲高碘酸钠获得。

根据所述非常特别的实施方案,下列具体参数可单独或联合应用:

-在分批电解中,电流密度j的范围为50-100mA/cm

-应用的电荷Q的范围为3-4F

-初始浓度c

-初始浓度c

-c

在本发明碘酸盐制备方法的另一特别的实施方案中,将通过电解优先获得的仲高碘酸盐转化成偏高碘酸盐。

出于此目的,电解后,仲高碘酸盐分离自阳极液,如下更详细所述。在阳极室通过过滤或倾析从液相获得沉淀物。沉淀可通过常规方式完成,例如通过添加氢氧化钠或浓缩溶剂。为了获得偏高碘酸盐,通过添加酸来中和仲高碘酸盐,特别是硫酸或硝酸并且随后以已知方式自身再结晶。

44.一种制备式IIIa或IIIb的内酰胺化合物的方法

其中

n是0或1-4的整数;并且

R

所述方法包括将式Ia或Ib的α氨基酰胺的区域选择性化学氧化为通式IIIa或IIIb的相应的内酰胺衍生物

其中,n、R

45.实施方案44的方法,其中用非均相或均相的氧化催化剂进行步骤的化学氧化,特别是均相催化剂,所述催化剂能够在酰胺基α-位的不对称碳原子基本保留立体化学的情况下氧化式(Ia)或(Ib)化合物的杂环α氨基。

46.实施方案45的方法,其中所述氧化催化剂选自无机钌盐,特别是(+III)、(+IV)、(+V)或(+VI)盐,更特别是(+III)或(+IV)盐与至少一种能够将钌盐,特别是(+III)、(+IV)、(+V)或(+VI)盐,更特别是(+III)或(+IV)原位氧化成,特别是钌(+VIII)盐的氧化剂的组合,并且任选地存在单价或多价金属配体,例如草酸钠。

47.实施方案46的方法,其中所述无机钌(+III)或(+IV)盐选自RuCl

48.实施方案47所述的方法,其中所述氧化剂选自

a)碱性高碘酸盐,特别是碱性-偏高碘酸盐,特别是NaIO

b)碱性氯酸盐,特定是NaOCl,其水合物,特别是NaOCl*5H

c)a)与b)的混合物。

49.实施方案46-48中任一项的方法,其中所述氧化催化剂选自

a)RuO

b)RuO

c)RuCl

d)RuCl

e)RuCl

f)a)-d)中每一个与单价或多价金属配体的组合,例如草酸钠。

50.实施方案46-49中任一项的方法,其中通过使所述式Ia化合物或所述式Ib化合物的水性或水性-有机溶液在0-30℃的温度范围内与氧化催化剂反应进行化学氧化。

51.实施方案46-50中任一项的方法,其中通过使所述式Ia化合物或所述式Ib化合物与催化量的所述无机钌盐,特别是所述(+III)或(+IV)盐和所述氧化剂反应进行化学氧化,其中所述式Ia或Ib化合物与所述氧化剂的初始摩尔比在1:1-1:5范围内,特别是1:1.5-1:3。

52.实施方案46-51中任一项的方法,其中添加所述单价或多价金属配体至反应混合物,从而所述钌(+III)或(+IV)盐与所述配体的摩尔比在1:1-1:5范围内,特别是1:1.5-1:2.5。

53.实施方案44-52中任一项的方法,其中获得的内酰胺衍生物选自式XIIIa的左乙拉西坦和式XXIa的布瓦西坦以及式XX的吡拉西坦。

54.实施方案44-53中任一项的方法,其中所述方法还包括回收以及电化学再利用消耗的氧化剂,特别是将碱性卤酸盐电化学氧化恢复至碱性高卤酸盐氧化剂,更特别是将碱性碘酸盐,尤其是碘酸钠或碘酸钾电化学氧化,恢复至碱性高碘酸盐氧化剂,尤其是高碘酸钠或高碘酸钾氧化剂。

55.实施方案54的方法,其中所述电化学再利用包括将所述碱性卤酸盐阳极氧化,恢复至所述碱性高卤酸盐氧化剂。

56.实施方案54或55的方法,其中应用硼掺杂金刚石阳极。

57.实施方案54-56中任一项的方法,其中所述阳极氧化在至少一种下列条件下进行:

a)(1)至少一种碱性卤酸盐,特别是碘酸盐的水溶液,初始浓度c

b)水溶液的pH为7或更高,如pH为至少8,优选至少10,特别为至少12,更特别为至少13并且具体为至少14,

c)温度范围为0-80℃,更优选10-60℃,特别为20-30℃并且具体为20-25℃,

d)电压范围为1-30V,特别为1-20V并且更特别为1-10V,

e)电流密度范围为10-500mA/cm

f)应用的电荷范围为1-10法拉,更优选2-6F,特别为2.5-4F并且具体为2.75-3.5法拉,

特别地,最优电流密度j能在所应用电解类型方面由本领域技术人员测定。批式或分批电解可使用10-1000mA/cm

一般,在较高流速或较高卤酸盐(如碘酸盐)浓度下,电流密度j可以更高,而在较低流速或较低卤酸盐(如碘酸盐)浓度下,电流密度必须更低以维持电流效率(CE)。

在一个特别的实施方案中,所述碱性卤酸盐的碱性水溶液中碱的初始摩尔浓度c

在另一个特别的实施方案中,所述水溶液的pH为至少12、至少13并且具体为至少14。

在另一个特别的实施方案中,所述至少一种碱性卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或碘酸钾在所述水溶液中的初始浓度c

在另一个特别的实施方案中,所述c0(NaOH):c0(NaIO

在另一个特别的实施方案中,应用包含至少特征a)、b)、e)和f)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

在另一个特别的实施方案中,应用包含至少上面特征a)和b)的特征组合。由此,特征a)可包括特征a(1)和a(2),或特征a(2)和a(3),或更优选特征a(1)、a(2)和a(3)。

根据其一个特别的实施方案,所述碱金属是钠,并且所获得的产物是高碘酸钠,以仲高碘酸钠获得。

根据所述特别的实施方案,下列具体参数可单独或组合应用:

-在分批电解中,电流密度j的范围为50-100mA/cm

-应用的电荷Q的范围为3-4F

-初始浓度co(NaIO

-初始浓度co(NaOH)为约1.0M

-co(NaIO

在本发明碘酸盐制备方法的另一特别的实施方案中,所述通过电解优先获得的仲高碘酸盐转化成偏高碘酸盐。

出于此目的,电解后,仲高碘酸盐分离自阳极液,如下更详细所述。在阳极室通过过滤或倾析从液相获得沉淀物。沉淀可通过常规方式完成,例如通过添加氢氧化钠或浓缩溶剂。为了获得偏高碘酸盐,通过添加酸来中和所述仲高碘酸盐,特别是硫酸或硝酸且随后以已知方式自身再结晶。

发明的其他方面和实施方案

1.本发明的多肽

在此上下文中,下列定义适用:

通用术语“多肽”或“肽”可互换使用,指连续、肽连接的氨基酸残基的天然或合成的线性链或者序列,其包括约10或多至超过1,000个残基。有多至30个残基的短链多肽也命名为“寡肽”。

术语“蛋白”指由一个或多个多肽组成的大分子结构。它的多肽的氨基酸序列代表蛋白的“一级结构”。氨基酸序列也通过特殊结构要素的形成来预先确定蛋白的“二级结构”,如多肽链内形成的α-螺旋和β-折叠结构。多个这类二级结构要素的排列定义了蛋白的“三级结构”或空间排列。如果蛋白包括一条以上多肽链,所述链空间排列形成蛋白的“四级结构”。正确的蛋白的空间排列或“折叠”是蛋白功能的前提。变性或展开会破坏蛋白功能。如果这类破坏可逆,则蛋白功能可通过再折叠恢复。

典型的蛋白功能在本文中称为“酶功能”,即蛋白用作底物,例如化合物的生物催化剂,并且催化所述底物转化成产物。酶可显示高或低程度的底物和/或产物特异性。

“多肽”在本文中称为具有特定“活性”,因而暗指显示所指活性的正确折叠的蛋白,例如特定酶活性。

因此,除非另有说明,术语“多肽”也涵盖术语“蛋白”和“酶”。

类似地,术语“多肽片段”涵盖术语“蛋白片段”和“酶片段”。

术语“分离的多肽”指通过本领域已知任意方法或组合从天然环境中移出的氨基酸序列,所述方法包括重组、生化和合成方法。

“靶多肽”指使蛋白或多肽靶向胞内细胞器即线粒体或质体或者胞外空间(分泌信号肽)的氨基酸序列。编码靶肽的核酸序列可融合至编码蛋白或多肽氨基末端,例如N末端的核酸序列,或可用于取代天然靶向的多肽。

本发明还涉及本文具体所述多肽的“功能等价物”(还命名为“类似物”或“功能性突变”)。

例如,“功能等价物”指多肽,其在用于测定酶NHase活性的试验中展示出相比本文具体所述多肽高或低至少1-10%,或至少20%,或至少50%,或至少75%,或至少90%的活性。

本发明所述“功能等价物”也涵盖特别的突变体,其在本文所示氨基酸序列的至少一个序列位置中具有不同于具体所述的氨基酸,但具有上述生物活性之一,例如酶活性。“功能等价物”因而包含通过一种或多种如1-20特别是1-15或5-10个氨基酸添加、取代特别是保守取代、缺失和/或插入可获得的突变体,其中所示变化能在任何序列位置上发生,只要它们引起具有本发明所述特性谱(profile)的突变体。如果活性模式在突变体与未改变的多肽之间定性上相符,即例如与同一激动剂或拮抗剂或者底物相互作用,然而观察到比率不同(即由EC

上述意义中的“功能等价物”也是本文所述多肽的“前体”以及多肽的“功能衍生物”和“盐”。

这个情况中的“前体”是有或没有所需生物活性的天然或合成的多肽前体。

表述“盐”指本发明所述蛋白分子的羧基盐以及氨基的酸加成盐。羧基盐能以已知方式生成并包含无机盐例如钠、钙、铵、铁和锌盐,以及带有有机碱例如胺的盐,如三乙醇胺、精氨酸、赖氨酸、哌啶等。发明还涵盖酸加成盐,例如带有无机酸的盐,如盐酸或硫酸,以及带有有机酸的盐,如乙酸和草酸。

本发明所述多肽的“功能衍生物”还能使用已知技术在官能氨基酸侧基或它们的N末端或C末端上生成。这类衍生物包括例如羧酸基团的脂肪族酯、羧酸基团的酰胺,其可通过与氨或者伯胺或仲胺反应获得;游离氨基的N-酰基衍生物,通过与酰基反应生成;或游离羟基的O-酰基衍生物,通过与酰基反应生成。

“功能等价物”天然也包含能获自其他生物体的多肽以及天然存在的变体。例如,同源序列区能通过序列对比建立,并且等价多肽能在本发明具体参数基础上确定。

“功能等价物”也包含“片段”,如本发明所述多肽的个体结构域或序列基序,或者N-和C-末端截断形式,其可以展示或不展示所需生物功能。特别地这类“片段”至少定性保留所需生物功能。

此外,“功能等价物”是融合蛋白,其具有本文所示多肽序列之一或从中衍生的功能等价物以及在功能性N末端或C末端连接至少一种其他、功能上不同的异源序列(即没有融合蛋白部分的基本相互功能的损伤)。这些异源序列的非限制性实例是例如信号肽、组氨酸锚或酶。

依照本发明,也包含的“功能等价物”是具体所公开多肽的同源物。这些与具体所公开的氨基酸序列之一具有至少60%,特别地至少75%,特别地至少80或85%,例如90、91、92、93、94、95、96、97、98或99%同源性(或相同性),这是通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。以本发明所述同源多肽百分比表示的同源性或相同性特别指基于本文具体所述氨基酸序列之一的总长,以百分比表示的氨基酸残基的相同性。

以百分比表示的相同性数据还可在BLAST比对、blastp算法(蛋白-蛋白BLAST)协助下确定,或是通过应用下文指定的Clustal设置。

在可能的蛋白糖基化的情况中,本发明所述“功能等价物”包括本文所述多肽,以去糖基或糖基化的形式以及能通过改变糖基化模式获得的修饰形式。

本发明所述多肽的功能等价物或同源物能通过诱变生成,例如通过点突变、延长或缩短蛋白或者如下更详细所述。

本发明所述多肽的功能等价物或同源物能通过筛选突变体组合数据库来鉴定,例如缩短突变体。例如,蛋白变体的混杂数据库能通过核酸水平的组合诱变来生成,如通过合成的寡核苷酸混合物的酶连接。有许多方法能用于从简并寡核苷酸序列中生成潜在同源物数据库。简并基因序列的化学合成能在自动DNA合成仪上进行,并且合成的基因随后能在适当表达载体中连接。使用简并基因组能够在混合物中提供所有序列,其编码所需组的潜在蛋白序列。本领域技术人员已知简并寡核苷酸的合成方法。

在本领域中,已知一些技术用于筛选组合数据库的基因产物,其通过点突变或缩短而生成,以及用于筛选有选定特性的基因产物的cDNA库。这些技术能适应基因库的快速筛选,所述基因库通过本发明所述同源物的组合诱变生成。所述技术最常用于在高通量分析基础上筛选大基因库,包括在能复制的表达载体中克隆基因库,用所得载体数据库转化合适细胞以及在一定条件下表达组合基因,其中检测所需活性促进了编码基因的载体分离,其产物可检测到。递归融合诱变(Recursive Ensemble Mutagenesis,REM)是增加数据库中功能突变体频率的技术,能与筛选测试联用以鉴定同源物。

本文所提供的实施方案提供了本文所公开多肽的直系同源物和旁系同源物以及鉴定和分离这类直系同源物和旁系同源物的方法。术语“直系同源物”和“旁系同源物”的定义如下给出且适用于氨基酸和核酸序列。

本发明多肽包括本发明酶的所有活性形式,包括活性亚序列,例如催化结构域或活性位点。在一方面,本发明提供如下所示催化结构域或活性位点。在一方面,本发明提含包括活性位点结构域或由活性结构域组成的肽或多肽,如用数据库如Pfam(http://pfam.wustl.edu/hmmsearch.shtml)(其是多序列比对与隐马尔可夫模型的大集合,涵盖许多共同蛋白家族,The Pfam protein families database,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)或等价物例如InterPro和SMART数据库(

本发明还涵盖有所需活性的“多肽变体”,其中变体多肽选自与特定的,特别是天然的氨基酸序列(通过特定SEQ ID NO提及)具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列相同性,并含有相对于所述SEQ ID NO的至少一种取代修饰的氨基酸序列。

2.核酸和构建体

2.1核酸

在此上下文中,下列定义适用:

术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”互换使用,指核苷酸序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或者核糖核苷酸,并且包括以下的编码和非编码序列:基因、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然存在的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针。技术人员认识到RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被尿嘧啶(U)代替。术语“核苷酸序列”还应理解为包括多核苷酸分子或寡核苷酸分子,以单独片段的形式或作为较大核酸的成分。

“分离的核酸”或“分离的核酸序列”涉及核酸或核酸序列,其所处环境不同于天然存在的核酸或核酸序列并且能包括基本不含污染的内源物质的那些。

本文用于核酸的术语“天然存在的”指在生物体细胞内天然发现并且未由人在实验室中有意修饰的核酸。

多核苷酸或核酸序列的“片段”指连续核苷酸,特别是本文实施方案中多核苷酸的至少15bp、至少30bp、至少40bp、至少50bp和/或至少60bp长度。特别地多核苷酸片段包含至少25、更特别地至少50、更特别地至少75、更特别地至少100、更特别地至少150、更特别地至少200、更特别地至少300、更特别地至少400、更特别地至少500、更特别地至少600、更特别地至少700、更特别地至少800、更特别地至少900、更特别地至少1000个本文实施方案中多核苷酸的连续核苷酸。不受限制,本文多核苷酸的片段可用作PCR引物和/或探针,或用于反义基因沉默或RNAi。

如本文所用,术语“杂交”或在某些条件下杂交意在描述用于杂交的条件和洗涤,其中彼此显著相同或同源的核苷酸序列相互保持结合。条件可以是至少约70%、如至少约80%和如至少约85%、90%或95%相同的这类序列,相互保持结合。下文提供低严格度、中严格度和高严格度杂交条件的定义。合适的杂交条件还能由本领域技术人员通过最少的实验选择,如Ausubel等人所示例(1995,Current Protocols in Molecular Biology,JohnWiley&Sons,sections 2,4,and 6)。另外,严格度条件描述于Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)。

“重组核酸序列”是产生自应用实验室方法(例如分子克隆)的使用的核酸序列,以使一种以上来源的遗传物质聚集起来,产生或修饰天然不存在并且不会另外在生物体中发现的核酸序列。

“重组DNA技术”指制备重组核酸序列的分子生物学方法,如实验室手册(Laboratory Manuals),Weigel和Glazebrook编,2002,冷泉港实验室出版社;和Sambrook等人,1989,纽约州冷泉港的冷泉港实验室出版社所述。

术语“基因”指包含一个区域的DNA序列,其转录成RNA分子,例如细胞中的mRNA,其可操作地连接至合适的调控区如启动子。因而,基因可包含数种可操作地连接的序列,如启动子、5’前导序列,含有例如参与翻译起始的序列,cDNA或基因组DNA的编码区、内含子、外显子,和/或含有例如转录终止位点的3’非翻译序列。

“多顺反子”指核酸分子,特别是mRNA,其能在相同核酸分子内分开编码一种以上多肽。

“嵌合基因”指在一个物种中天然未发现的任何基因,特别是在该基因中,存在天然相互不关联的一种或多种核酸序列部分。例如,启动子与部分或所有转录区或者另一调控区天然不相关。术语“嵌合基因”应理解为包括表达构建体,其中启动子或转录调控序列可操作地连接一种或多种编码序列或反义即有义链的反向互补序列或反向重复序列(有义和反义,从而RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一种或多种编码序列部分以生成新基因获得的基因。

“3’UTR”或“3’非翻译序列”(也称为“3’非翻译区”或“3’末端”)指基因编码序列下游发现的核酸序列,其包括例如转录终止位点和(大部分但非所有真核mRNA)多聚腺苷酸化信号如AAUAAA或其变体。转录终止后,mRNA转录物可在多聚腺苷酸化信号下游剪切并添加聚(A)尾,所述聚(A)尾参与mRNA到翻译位点如细胞质的转运。

术语“引物”指短核酸序列,其与模板核酸序列杂交并且用于与模板互补的核酸序列的聚合。

术语“选择性标记物”指表达后可用于选择一个或多个细胞的任何基因,所述细胞包括选择性标记物。选择性标记物的实例如下所述。技术人员会了解不同抗生素、杀真菌剂、营养缺陷型或除草剂选择性标记物适用于不同靶物种。

本发明还涉及编码本文所定义多肽的核酸序列。

特别地,本发明还涉及编码上述多肽之一和它们的功能等价物的核酸序列(单链和双链DNA及RNA序列,例如cDNA、基因组DNA和mRNA),其能用例如人工核苷酸类似物获得。

本发明涉及编码本发明所述多肽或其生物活性区段的分离的核酸分子,以及能用作例如杂交探针或引物的核酸片段,以鉴定或扩增本发明所述的编码核酸。

本发明还涉及与本文具体所公开序列有一定程度“相同性”的核酸。两种核酸之间的“相同性”指在各情况下在核酸总长上的核苷酸相同性。

两种核苷酸序列(同样适用于肽或氨基酸序列)之间的“相同性”是当产生这两种序列的比对时,两种序列中相同的核苷酸残基(或氨基酸残基)数目的函数(function)。相同残基定义为两种序列在给定的比对位置处相同的残基。本文所用的序列相同性百分比计算自最优比对,这是通过将两种序列之间相同的残基数除以最短序列中的残基总数,并乘以100。最优比对是相同性百分比最高可能的比对。可能在一条或两条序列中的一个或多个比对的位置中引入空位(gap)以获得最优比对。这些空位随后被视作计算序列相同性百分比的非相同残基。出于确定氨基酸或核酸序列相同性百分比的目的的比对能以多种方式实现,使用计算机程序和例如万维网上公开可得的计算机程序。

特别地,将BLAST程序(Tatiana et al,FEMS Microbiol Lett.,1999,174:247-250,1999)设置成默认参数,可获自美国国家生物技术信息中心(NCBI)网址ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi,能用于获得蛋白或核酸序列的最优比对并计算序列相同性百分比。

另一实例中,所述相同性可通过Informax公司(美国)的Vector NTI Suite 7.1程序计算,采用Clustal法(Higgins DG,Sharp PM.((1989))),用下列设置。

多重比对参数:

成对比对参数:

或者,相同性可根据Chenna等人(2003),网页:http://www.ebi.ac.uk/Tools/clustalw/index.html#和下列设置确定。

本文所提及的全部核酸序列(单链和双链DNA以及RNA序列,例如cDNA和mRNA)能以已知方式通过从核苷酸构建单元化学合成而生成,例如通过双螺旋的个体重叠、互补核酸构建单元的片段缩合。例如,寡核苷酸的化学合成能以已知方式通过亚磷酰胺方法(Voet,Voet,2nd edition,Wiley Press,New York,pages 896-897)进行。通过DNA聚合酶的Klenow片段和连接反应以及通用克隆技术的手段的合成的寡核苷酸的积聚和空位填充描述于Sambrook等人(1989),见下。

本发明所述核酸分子能另外包含来自编码遗传区3'和/或5'末端的非翻译序列。

本发明还涉及与具体所述核苷酸序列或其区段互补的核酸分子。

本发明所述核苷酸序列使得生成探针和引物可行,其能用于在其他细胞类型和生物体中鉴定和/或克隆同源序列。这类探针或引物一般包括核苷酸序列区域,其在“严格”条件(如本文他处所定义)下于本发明所述核酸序列有义链或相应反义链的至少约12,特别地至少约25,例如约40、50或75个连续核苷酸上杂交。

“同源”序列包括直系同源序列或旁系同源序列。鉴定直系同源物或旁系同源物的方法包括系统发生方法、序列相似性和杂交方法,所述方法为本领域已知并在本文中描述。

“旁系同源物”产生自基因重复,产生2个或更多有相似序列和相似功能的基因。旁系同源物通常聚在一起并通过相关植物种类内基因复制形成。在相似基因组内发现旁系同源物,使用成对Blast分析或在基因家族的系统发生分析中使用程序如CLUSTAL。在旁系同源物中,能将共有序列鉴定为具有相关基因内序列特征并且有所述基因的相似功能。

“直系同源物”或直系同源序列的序列彼此相似,因为它们在源自共同祖先的物种中发现。例如,有共同祖先的植物物种已知包含许多具有相似序列和功能的酶。技术人员能鉴定直系同源序列并预测直系同源物功能,例如,通过用CLUSTAL或BLAST程序构建一个物种基因家族的多基因树。鉴定或确认同源序列内相似功能的方法是通过比较宿主细胞或生物体如植物或微生物中的转录物谱,所述细胞或生物体过表达或缺乏(敲除/敲减)相关多肽。技术人员应理解有相似转录物谱的基因会具有相似功能,所述基因有超过50%的调节转录物相同,或超过70%的调节转录物相同,或超过90%的调节转录物相同。本文序列的同源物、旁系同源物、直系同源物和任意其他变体预期以相似方式发挥功能,这是通过使宿主细胞、生物体如植物或生物体生成本发明的酶。

术语“选择性标记物”指表达后可用于选择一个或多个细胞的任何基因,所述一个或多个细胞包括选择性标记物。选择性标记物的实例如下所述。技术人员会了解不同抗生素、杀真菌剂、营养缺陷型或除草剂选择性标记物适用于不同靶物种。

本发明所述核酸分子能通过分子生物学标准技术和本发明所述的提供的序列信息来回收。例如,cDNA能分离自合适的cDNA库,使用具体所公开的完整序列之一或其区段作为杂交探针和标准杂交的技术(描述于例如Sambrook,(1989))。

另外,包含所公开序列之一或其区段的核酸分子能通过聚合酶链式反应分离,使用在这个序列基础上构建的寡核苷酸引物。以此方式扩增的核酸能克隆于适当载体并能由DNA测序表征。本发明所述寡核苷酸还能通过标准合成方法生成,例如使用自动DNA合成仪。

本发明所述核酸序列或其衍生物、这些序列的同源物或部分能例如通过常规杂交技术或PCR技术分离自其他细菌,如经基因组或cDNA库。这些DNA序列在标准条件下与本发明所述序列杂交。

“杂交”指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力,而非特异结合在这些条件下于非互补伴侣蛋白之间不发生。对此,序列可以是90-100%互补。互补序列能够特异性彼此结合的特性用于例如Northern印迹或Southern印迹或者PCR或RT-PCR中的引物结合。

保守区域的短的寡核苷酸可有利地用于杂交。然而,也能使用本发明所述核酸的较长片段或者用于杂交的完整序列。这些“标准条件”根据所用核酸(寡核苷酸、较长片段或完整序列)或根据用于杂交的核酸的类型–DNA或RNA–而变化。例如,DNA:DNA杂合体的熔解温度比相同长度的DNA:RNA杂合体低约10℃。

例如,根据特别的核酸,标准条件指缓冲水溶液中42-58℃的温度,浓度为0.1-5xSSC(1X SSC=0.15M NaCl,15mM柠檬酸钠,pH 7.2)或另外存在50%甲酰胺,例如42℃,5xSSC,50%甲酰胺。有利地,DNA:DNA杂合体的杂交条件是0.1x SSC并且温度是约20℃-45℃,特别地约30℃-45℃。对于DNA:DNA杂合体,杂交条件有利的是0.1x SSC并且温度是约30℃-55℃,特别地约45℃-55℃。这些用于杂交的所示温度是在没有甲酰胺情况下就长度约100个核苷酸且G+C含量为50%的核酸计算的熔解温度值。DNA杂交的实验条件如相关遗传学教科书例如Sambrook等人,1989所述,并且能用本领域技术人员已知的公式计算,例如取决于核酸长度、杂合体类型或G+C含量。本领域技术人员能通过下列教科书获得关于杂交的其他信息:Ausubel等人(编),(1985),Brown(编)(1991)。

“杂交”能特别在严格条件下完成。例如,这类杂交条件描述于Sambrook(1989),或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。

本文所用术语杂交或在某些情况下杂交意在描述用于杂交的条件和洗涤,其中彼此显著相同或同源的核苷酸序列相互保持结合。条件可以是至少约70%,如至少约80%和例如至少约85%、90%或95%相同的这类序列,相互保持结合。下文提供低严格度、中严格度和高严格度杂交条件的定义。

合适的杂交条件能由本领域技术人员通过最少实验选择,如Ausubel等人示例(1995,Current Protocols in Molecular Biology,John Wiley&Sons,sections 2,4,and6)所示例。另外,严格度条件描述于Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)。

如本文所用,低严格度的定义的条件如下。将含有DNA的滤器在溶液中在40℃预处理6小时,所述溶液含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1% Ficoll,1% BSA和500μg/ml变性鲑鱼精子DNA。杂交在有以下改良的相同溶液中进行:使用0.02% PVP,0.02% Ficoll,0.2% BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖和5-20x106 32P-标记的探针。将滤器在杂交混合物中40℃孵育18-20小时,随后在55℃洗涤1.5小时。溶液含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS。洗涤溶液用新鲜溶液代替并在60℃再孵育1.5小时。将滤器吸干并暴露用于放射自显影。

如本文所用,中严格度的定义的条件如下。将含有DNA的滤器在溶液中在50℃预处理7小时,所述溶液含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1% Ficoll,1% BSA和500μg/ml变性鲑鱼精子DNA。杂交在有以下改良的相同溶液中进行:使用0.02% PVP,0.02% Ficoll,0.2% BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖和5-20x106 32P-标记的探针。将滤器在杂交混合物中50℃孵育30小时,随后在55℃洗涤1.5小时。溶液含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1% SDS。洗涤溶液用新鲜溶液代替并在60℃再孵育1.5小时。将滤器吸干并暴露用于放射自显影。

如本文所用,高严格度的定义的条件如下。将含有DNA的滤器在缓冲液中预杂交8小时至65℃过夜,所述缓冲液由6x SSC,50mM Tris-HCl(pH 7.5),1mM EDTA,0.02%PVP,0.02% Ficoll,0.02% BSA和500μg/ml变性鲑鱼精子DNA构成。滤器在预杂交混合物中65℃杂交48小时,所述混合物含有100μg/ml变性鲑鱼精子DNA和5-20x106cpm 32P-标记的探针。通过在含2x SSC,0.01% PVP,0.01% Ficoll和0.01% BSA的溶液中37℃持续1小时进行滤器洗涤。然后是在0.1x SSC中50℃洗涤45分钟。

如果上述条件不合适(例如用于跨物种杂交),可使用本领域熟知的其他低严格度、中严格度和高严格度条件(例如用于跨物种杂交)。

编码本发明多肽的核酸序列的检测试剂盒可包括特异于编码多肽的核酸序列的引物和/或探针,以及使用引物和/或探针以检测样品中编码多肽的核酸序列的相关方案。这类检测试剂盒可用于确定植物、生物体、微生物或细胞是否被修饰,即用编码多肽的序列转化。

为测试本文实施方案所述变体DNA序列的功能,感兴趣的序列可操作地连接至可选择的或可筛选的标记物基因并在瞬时表达试验中测试所述报告基因的表达,例如用微生物或原生质体或在稳定转化的植物中。

本发明还涉及具体所公开或可衍生的核酸序列的衍生物。

因此,本发明所述核酸序列能衍生自本文具体公开的序列并且差异在于一个或多个(例如1-10个)核苷酸的一个或多个,如1-20个,特别是1-15或5-10个添加、取代、插入或缺失,并且此外编码有所需特性谱的多肽。

本发明还涵盖核酸序列,所述核酸序列包含所谓沉默突变或根据特殊来源或宿主生物体的密码子使用,相较具体所示序列已经被改变。

可制备本发明的一个特别的实施方案所述的变体核酸以使其核苷酸序列适应特定表达系统。例如,如果氨基酸由特定密码子编码,则已知细菌表达系统能更有效地表达多肽。由于遗传密码的简并性,超过一种密码子可编码同一氨基酸序列,多种核酸序列能编码同一蛋白或多肽,所有这些DNA序列由本文实施方案所涵盖。适当时,本文所述编码多肽的核酸序列可优化用于提高宿主细胞表达。例如,本文实施方案的核酸可用密码子合成,特别是宿主的以改善表达。

本发明还涵盖天然产生的变体,例如其中所述序列的剪接变体或等位基因变体。

等位基因变体在完整序列范围上具有所衍生的氨基酸水平的至少60%同源性,特别是至少80%同源性,相当尤其特别是至少90%同源性(涉及氨基酸水平的同源性,参考上面对于多肽给出的细节)。有利地,同源性可能在序列的部分区域上更高。

本发明还涉及能通过保守核苷酸取代获得的序列(即作为其结果,讨论中的氨基酸由相同电荷、大小、极性和/或溶解度的氨基酸取代)。

本发明还涉及通过序列多态性衍生自具体所公开核酸的分子。由于自然等位变异,这类遗传多态性可存在来自不同群或某一群内的细胞。等位基因变体还可包括功能等价物。这些自然变异通常在基因核苷酸序列中生成1-5%的差异。所述多态性可引起本文所公开多肽的氨基酸序列的变化。等位基因变体还可包括功能等价物。

此外,衍生物还应理解为本发明所述核酸序列的同源物,例如动物、植物、真菌或细菌同源物、缩短的序列、编码和非编码DNA序列的单链DNA或RNA。例如,同源物在本文具体公开的序列给定的完整DNA区上具有DNA水平的至少40%,特别是至少60%,尤其特别是至少70%,相当尤其特别是至少80%同源性。

此外,衍生物应理解为例如有启动子的融合。添加至所示核苷酸序列的启动子能通过至少一个核苷酸交换、至少一个插入、倒置和/或缺失来修饰,尽管不削弱启动子功能或功效。此外,启动子功效能通过改变其序列而增加或能与甚至不同属的生物体的更有效的启动子完全交换。

2.2用于表达本发明多肽的构建体

在此上下文中,下列定义适用:

“基因表达”涵盖“异源表达”和“过表达”并且涉及基因转录和mRNA翻译成蛋白。过表达指基因产物生成超过了未转化细胞或遗传背景类似的生物体中的生成水平,如转基因细胞或生物体中的mRNA、多肽和/或酶活性水平所测得。

本文所用“表达载体”指核酸分子,用分子生物学方法和重组DNA技术进行工程化改造,以递送外来或外源DNA进入宿主细胞。表达载体通常包括核苷酸序列适当转录所需的序列。编码区经常编码感兴趣蛋白,但也可编码RNA例如反义RNA、siRNA等。

本文所用术语“表达载体”包括任何线性或环状重组载体,其包括但不限于病毒载体、噬菌体和质粒。技术人员能够根据表达系统选择合适载体。在一个实施方案中,所述表达载体包括本文实施方案的核酸,其可操作地连接至少一种控制转录、翻译、起始和终止的“调控序列”,如转录启动子、操纵子或增强子或mRNA核糖体结合位点,任选地,其包括至少一种选择标记物。当调控序列在功能上涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接”。

本文所用“表达系统”涵盖在给定表达宿主的体内或体外表达一种或共表达两种或更多多肽所需的任意核酸分子的组合。相应的编码序列可位于单个核酸分子或载体如含多克隆位点的载体上,或在多顺反子核酸上,或可分布于两个或更多物质上不同的载体。作为一个特别的实例,可提及操纵组(operon),其包括启动子序列、一种或多种操纵子序列以及一种或多种各自编码本文所述酶的结构基因。

本文所用术语“扩增(amplifying)”和“扩增(amplification)”指使用任何适当扩增方法以产生或检测天然表达核酸的重组体,如下详述。例如,本发明提供方法和试剂(如特定简并寡核苷酸引物对,寡聚胸腺嘧啶引物(oligo dT primer)以体内、离体或体外扩增(如通过聚合酶链式反应,PCR)天然表达(如基因组DNA或mRNA)或重组(如cDNA)的本发明核酸。

“调控序列”指决定本文实施方案中核酸序列表达水平并且能够调节可操作地连接至调控序列的核酸序列转录速度的核酸序列。调控序列包含启动子、增强子、转录因子、启动子元件等。

“启动子”、“有启动子活性的核酸”或“启动子序列”应理解为指根据本发明,核酸在功能性连接待转录的核酸时调节所述核酸的转录。“启动子”特别指控制编码序列的核酸序列,这是通过提供用于RNA聚合酶和合适转录所需的其他因子的结合位点,包括但不限于转录因子结合位点、阻遏和激活蛋白结合位点。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可包括影响转录、RNA加工或相关编码核酸序列稳定性的上游和下游元件。启动子包括自然衍生和合成的序列。编码核酸序列通常位于转录起始位点处开始的转录起始方向的启动子下游。

在此上下文中,“功能”或“可操作的”连接应理解为例如一种核酸与调控序列的依序排列。例如,有启动子活性的序列和待转录核酸序列以及任选的其他调控元件如确保核酸转录的核酸序列并且例如终止子,其以使得调控元件中的每一个能在核酸序列转录后行使其功能的这样的方式连接。这不必定需要化学意义上的直接连接。遗传控制序列例如增强子序列,能甚至对更远位置或甚至来自其他DNA分子的靶序列发挥其作用。优选的排列是待转录核酸序列位于启动子序列后面(即在3’末端),从而两种序列共价连接在一起。启动子序列与待重组表达的核酸序列之间的距离可以是小于200个碱基对,或小于100个碱基对或小于50个碱基对。

除了启动子和终止子,下列可提及作为其他调控元件的实例:靶向序列、增强子、多聚腺苷酸化信号、选择性标记物、扩增信号、复制起点等。合适的调控序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。

术语“组成型启动子”指允许可操作地连接其的核酸序列连续转录的未受调控的启动子。

本文所用术语“可操作地连接”指处于功能关系的多核苷酸元件连接。核酸在被置于与另一核酸序列的功能关系时为“可操作地连接”。例如,启动子或更确切是转录调控序列,如果它影响编码序列转录,则可操作地连接所述编码序列。可操作地连接意味着DNA序列通常是连续的。与启动子序列相关的核苷酸序列关于待转化植物(plant)可以是同源或异源来源。序列还可以是完全或部分合成。无论来源如何,与启动子序列相关的核酸序列在结合本文实施方案的多肽后,会根据它连接的启动子特性而被表达或被沉默。相关核酸可编码在整个生物体的所有时间,或者在特定时间或者特定组织、细胞或细胞区室需要被表达或被抑制的蛋白,这类核苷酸序列特别地编码蛋白,赋予宿主细胞或随其改变或转化的生物体所需的表型性状。更特别地,相关核苷酸序列引起细胞或生物体中生成本文所定义的感兴趣的一种或多种产物。特别地,核苷酸序列编码具有本文所定义酶活性的多肽。

上文所定义的核苷酸序列可以是“表达盒”的一部分。术语“表达盒”和“表达构建体”可同义使用。(特别地重组)表达构建体包含核苷酸序列,其编码本发明所述多肽并且其在调控核酸序列的遗传控制下。

在本发明所述的应用的方法中,表达盒可以是“表达载体”的一部分,特别是重组表达载体。

“表达单元”应理解为指根据本发明,有表达活性的核酸,其包含本文所定义的启动子并且在功能性连接待表达的核酸或基因后调节表达,即所述核酸或所述基因的转录和翻译。因此,它在这一点上也称为“调控核酸序列”。除了启动子,其他调控元件例如增强子也能存在。

“表达盒”或“表达构建体”应理解为指根据本发明,功能性连接至待表达核酸或待表达基因的表达单元。与表达单元相反,表达盒因而不仅包含调节转录和翻译的核酸序列,而且包含待表达为转录和翻译所产生的蛋白的核酸序列。

术语“表达”或“过表达”在本发明上下文中,描述微生物中一种或多种多肽的生成或胞内活性的增加,所述多肽由相应DNA编码。为此,能例如向生物体引入基因,用另一基因代替现有基因,增加基因拷贝数,使用强启动子或使用编码高活性的相应多肽的基因;任选地,可组合这些措施。

特别地本发明所述的这类构建体可包含相应编码序列5’-上游的启动子和3’-下游终止序列以及任选的其他常见调控元件,在各情况中可操作地连接编码序列。

本发明所述核酸构建体特别地包含编码多肽的序列,例如衍生自本文所述氨基酸相关SEQ ID NO或其相反互补体,或其衍生物和同源物并且所述序列可操作地或功能性地连接一个或多个调控信号,优选用于控制例如增加基因表达。

除了这些调控序列,这些序列的天然调控可仍然在实际结构基因前存在并且任选地可以被遗传修饰,从而关闭天然调控并且增强基因表达。然而,核酸构建体还能结构更简单,即没有额外调控信号在编码序列和天然启动子前插入,所述天然启动子的调控未被移除。相反,天然调控序列被突变,从而调控不再发生并且基因表达增加。

优选的核酸构建体还有利地包含一种或多种已提及的“增强子”序列,与启动子功能性连接,所述序列使得核酸序列表达增强成为可能。额外的优选序列还可在DNA序列3’-末端插入,如其他调控元件或终止子。一个或多个拷贝的本发明所述的核酸可存在于构建体。在构建体中,其他标记物如补充营养缺陷型或抗生素耐受性的基因,也任选地存在以选择构建体。

合适的调控序列的实例在启动子中存在,如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacI

对于宿主生物体中的表达,核酸构建体有利地插入载体,例如质粒或噬菌体,使得宿主中的基因最优表达可行。载体还应理解为指除了质粒和噬菌体之外,技术人员已知的所有其他载体,例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、质粒、粘粒和线性或环状DNA或人工染色体。这些载体能够在宿主生物体或染色体外自主复制。这些载体是本发明的进一步开发。双元或cpo-整合载体也适用。

例如,合适质粒是大肠杆菌pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III

在载体的另一种开发中,所述载体包含本发明所述核酸构建体或本发明所述核酸,还能有利地以线性DNA形式引入微生物并经异源或同源重组整合入宿主生物体基因组。这个线性DNA能由线性化载体如质粒或仅核酸构建体或本发明所述核酸组成。

对于异源基因在生物体中的最优表达,优选修饰核酸序列以匹配用于生物体的特定“密码子使用”。“密码子使用”可通过计算机评估所讨论生物体中的其他已知基因来容易确定。

本发明所述表达盒如下产生:将合适启动子融合至适当编码核苷酸序列和终止子或多聚腺苷酸化信号。常规重组和克隆技术用于此目的,如描述于T.Maniatis,E.F.Fritsch and J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold SpringHarbor Laboratory,Cold Spring Harbor,NY(1989)以及T.J.Silhavy,M.L.Berman andL.W.Enquist,Experiments with Gene Fusions,Cold Spring Harbor Laboratory,ColdSpring Harbor,NY(1984)以及Ausubel,F.M.et al.,Current Protocols in MolecularBiology,Greene Publishing Assoc.and Wiley Interscience(1987)。

对于合适宿主生物体中的表达,重组核酸构建体或基因构建体有利地插入宿主特异性载体,使得宿主中的基因最优表达可行。载体为技术人员熟知并能在例如“克隆载体(cloning vectors)”(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中发现。

本文实施方案的一个替代性实施方案提供了在宿主细胞中“改变基因表达”的方法。例如,本文实施方案的多核苷酸可在某些背景下(如暴露于某些温度或培养调节)于宿主细胞或宿主生物体内被增强或被过表达或被诱导。

本文所提供多核苷酸表达的改变还可引起改变的和对照或野生型生物体中不同表达模式的异位表达。表达的改变产生自本文实施方案的多肽与外源或内源调节剂之间的相互作用,或作为多肽化学修饰的结果。所述术语还指本文实施方案中多核苷酸的改变的表达模式,其改变到低于检测水平或完全抑制活性。

在一个实施方案中,本文还提供分离的、重组的或合成的多核苷酸,其编码本文提供的多肽或变体多肽。

在一个实施方案中,所述数种编码多肽的核酸序列在单个宿主中共表达,特别地在不同启动子控制下。在另一个实施方案中,所述数种编码多肽的核酸序列能存在于单个转化载体或同时使用单独载体并选择包含两种嵌合基因的转化子共转化。类似地,一种或多种编码多肽的基因可在单个植物、细胞、微生物或生物体中与其他嵌合基因共同表达。

3.待应用于本发明的宿主

根据上下文,术语“宿主”可指野生型宿主或遗传改变的重组宿主或两者。

原则上,所有原核或真核生物体可视作本发明所述核酸或核酸构建体的宿主或重组宿主生物体。

使用本发明所述载体,能生成重组宿主,其例如用至少一个本发明所述载体转化并能用于生成本发明所述多肽。有利地,本发明所述重组构建体如上所述引入合适宿主系统并表达。使用本领域技术人员已知的特别的常见克隆和转染方法,例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等,用于在各表达系统中表达所示核酸。合适的系统描述于Current Protocols in Molecular Biology,F.Ausubel et al.,Ed.,WileyInterscience,New York 1997,or Sambrook et al.Molecular Cloning:A LaboratoryManual.2nd edition,Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press,Cold Spring Harbor,NY,1989.。

优选地,微生物如细菌、真菌或酵母用作宿主生物体。优选地,使用革兰氏阳性或革兰氏阴性菌,特别是肠杆菌科(Enterobacteriaceae)、假单胞菌科(Pseudomonadaceae)、根瘤菌科(Rhizobiaceae)、链霉菌科(Streptomycetaceae)、链球菌科(Streptococcaceae)或诺卡氏菌科(Nocardiaceae)的细菌,尤其特别是埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)、乳球菌属(Lactococcus)、诺卡氏菌属(Nocardia)、伯克霍尔德菌属(Burkholderia)、沙门氏菌属(Salmonella)、农杆菌属(Agrobacterium)、梭菌属(Clostridium)或红球菌属(Rhodococcus)的细菌。尤其优选大肠杆菌(Escherichia coli)属和种。此外,在α-变形菌(alpha-Proteobacteria)、β-变形菌(beta-Proteobacteria)或γ-变形菌(gamma-Proteobacteria)组中发现其他有利的细菌。有利地,酵母科如酵母属(Saccharomyces)或毕赤酵母属(Pichia)也是合适宿主。

或者,完整植物或植物细胞可用作天然或重组宿主。作为非限制性示例,从中衍生的下列植物或细胞可提及烟草(Nicotiana)属,特别是本氏烟草(Nicotiana benthamiana)和普通烟草(Nicotiana tabacum)(烟草);以及拟南芥(Arabidopsis),特别是鼠耳芥(Arabidopsis thaliana)。

根据宿主生物体,用于本发明所述方法的生物体通过本领域技术人员生长或培养。培养可以是分批、半分批或连续。营养物能在发酵开始时存在或者稍后半连续或连续供应。这也如下更详细描述。

4.酶和突变体的重组生成

本发明还涉及重组生成本发明所述多肽或其功能、生物活性片段的方法,其中培养产生多肽的微生物,任选地多肽表达通过应用至少一种诱导剂诱导基因表达来诱导,并且所表达的多肽从培养物中分离。若需要,多肽还能通过此方式以工业规模生成。

根据本发明生成的微生物能以分批方法或补料分批方法或重复补料分批方法连续或半连续培养。已知培养方法的总结可在Chmiel教科书中找到(Bioprozesstechnik1.Einführung in die Bioverfahrenstechnik[Bioprocess technology 1.Introductionto bioprocess technology)或在Storhas教科书中找到(Bioreaktoren und periphereEinrichtungen[Bioreactors and peripheral equipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))。

待使用的培养基必须适当满足各菌株要求。关于多种微生物的培养基描述在美国细菌学会(the American Society for Bacteriology)的手册"一般细菌学方法手册(Manual of Methods for General Bacteriology)"中给出(美国华盛顿特区,1981)。

这些本发明所述的可用的培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。

优选碳源是糖,如单糖、二糖或多糖。极佳碳源是例如葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素。糖还能经由复合化合物添加至培养基,如糖蜜或其他糖精炼的副产物。还能优选地添加不同碳源混合物。其他可能的碳源是油和脂肪例如豆油、葵花油、花生油和椰子油,脂肪酸例如棕榈酸、硬脂酸或亚油酸,醇类例如甘油、甲醇或乙醇以及有机酸,例如乙酸或乳酸。

氮源通常是有机或无机氮化合物或者含有这些化合物的材料。氮源实例包括氨气或铵盐如硫酸铵、氯化铵、磷酸铵、碳酸铵或硝酸铵,硝酸盐,尿素,氨基酸或复合氮源如玉米浆、大豆粉、大豆蛋白、酵母提取物、肉提取物等等。氮源能单独或作为混合物使用。

能存在于培养基的无机盐化合物包含钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的氯化物、磷盐或硫酸盐。

含无机硫的化合物如硫酸盐、亚硫酸盐、连二亚硫酸盐、连四硫酸盐、硫代硫酸盐、硫化物以及有机硫化合物如硫醇和硫醇,能用做硫源。

磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐能用作磷源。

能添加螯合剂至培养基,以保持金属离子溶于溶液。尤其合适的螯合剂包含二羟基酚如邻苯二酚或原儿茶酸盐,或有机酸如柠檬酸。

根据本发明使用的发酵培养基通常还包含其他生长因子,如维生素或生长启动子,包括例如生物素、核黄素、硫胺素、叶酸、烟酸、泛酸盐和吡哆醇。生长因子和盐经常源自复合培养基组分,如酵母提取物、糖蜜、玉米浆等。此外,可以将合适前体添加至培养基。培养基中化合物的确切组成强烈取决于各实验并针对每种特定情况单独决定。关于培养基优化的信息可在教科书"应用微生物.生理学,实用方法(Applied Microbiol.Physiology,APractical Approach)"((Ed.P.M.Rhodes,P.F.Stanbury,IRL Press(1997)p.53-73,ISBN0199635773)中发现。培养基还能获自商业供应商,如Standard 1(Merck)或BHI(脑心浸液,DIFCO)等。

培养基的所有组分灭菌,通过热(20min、1.5巴和121℃)或通过无菌过滤。所述组分能一起灭菌或若需要单独灭菌。培养基的所有组分能在培养开始时存在或者能连续或分批添加。

培养温度一般是15℃-45℃,特别是25℃-40℃,并且能在实验期间变化或保持恒定。培养基的pH应在5-8.5范围内,特别是约7.0。生长的pH可在生长期间通过添加碱性化合物如氢氧化钠、氢氧化钾、氨或氨水,或酸性化合物如磷酸或硫酸控制。消泡剂例如脂肪酸聚乙二醇酯能用于控制发泡。为维持质粒稳定性,能添加合适的选择性物质例如抗生素至培养基。为维持好氧条件,进料氧或含氧气体混合物例如环境空气至培养物。培养物的温度通常在20℃-45℃范围内。连续培养,直至形成最大所需产物。这个目标一般在10小时-160小时内达到。

发酵肉汤随后进一步加工。根据要求,生物质能通过分离技术完全或部分移出发酵肉汤,例如离心、过滤、倾析或这些方法的组合,或者能完全留在里面。

如果多肽在培养基中未分泌,则细胞也能裂解并且产物能通过用于分离蛋白的已知方法获自裂解物。细胞任选地被破坏,用高频超声,高压例如法压壶(French press)中,通过渗透,通过洗涤剂、裂解酶或有机溶剂作用,通过均质器方式或通过数种上述方法的组合。

多肽能通过已知层析技术纯化,例如分子筛层析(凝胶过滤)如Q-琼脂糖层析、离子交换层析和疏水层析,以及用其他常见技术如超滤、结晶、盐析、透析和非变性凝胶电泳。合适方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemicalprocesses],Verlag Walter de Gruyter,Berlin,New York or in Scopes,R.,ProteinPurification,Springer Verlag,New York,Heidelberg,Berlin.。

为分离重组蛋白,能有利地使用载体系统或寡核苷酸,其通过定义的核苷酸序列延长cDNA并因而编码改变的多肽或融合蛋白,其例如用于更容易的纯化。这类合适修饰是例如所谓的“标签”用作锚,如称为六聚组氨酸锚或表位的修饰能被识别为抗体的抗原(描述于例如Harlow,E.and Lane,D.,1988,Antibodies:A Laboratory Manual.Cold SpringHarbor(N.Y.)Press)。这些锚能用于将蛋白附着于固体载体上,例如聚合物基质,其能例如用作层析柱的填料,或能用于微量滴定板或一些其他载体。

同时,这些锚还能用于识别蛋白。为识别蛋白,还能使用常见标记物,如荧光染料,酶标记物,其在与底物反应后形成可检测的反应产物,或放射性标记物,单独或与锚组合以用于蛋白的衍生。

5.多肽固定

本发明所述酶或多肽能在本文所述方法中游离或固定使用。固定化酶是固定于惰性载体的酶。合适载体材料和固定在其上的酶已知来自EP-A-1149849、EP-A-1069183和DE-OS 100193773以及来自其中引用的参考文献。在这方面参考这些文档的完整公开内容。合适载体材料包括例如粘土、粘土矿物如高岭石、硅藻土、珍珠岩、二氧化硅、氧化铝、碳酸钠、碳酸钙、纤维素粉、阴离子交换剂材料,合成聚合物如聚苯乙烯、丙烯酸树脂、苯酚甲醛树脂、聚氨酯和聚烯烃,如聚乙烯和聚丙烯。为制备支撑酶,载体材料通常以细碎的颗粒形式采用,优选多孔形式。载体材料的粒径通常不超过5mm,特别是不超过2mm(粒径分布曲线)。类似地,当脱氢酶用作全细胞催化剂时,能选择游离或固定化的形式。载体材料是例如海藻酸钙和角叉菜胶。酶以及细胞还能与戊二醛直接交联(交联至CLEA)。相应和其他固定化技术描述于例如J.Lalonde and A.Margolin"Immobilization of Enzymes"in K.Drauz andH.Waldmann,Enzyme Catalysis in Organic Synthesis 2002,Vol.III,991-1032,Wiley-VCH,Weinheim。关于生物转化和生物反应器用于进行本发明所述方法的其他信息还在例如Rehm et al.(Ed.)Biotechnology,2nd Edn,Vol3,Chapter 17,VCH,Weinheim中给出。

6.用于本发明生物催化生成方法的反应条件

本发明的反应可在体内或体外条件下进行。

至少一种多肽/酶在本发明方法或上文所定义的多步骤方法的单独步骤中存在,能存在于天然或重组生成一种或多种酶的活细胞,存在于收获的细胞中,即在体内条件下,或存在于死亡细胞、透性化细胞、粗细胞提取物、纯化提取物,或以基本上纯或完全纯形式存在,即在体外条件下。至少一种酶可存在于溶液或作为载体上的固定化酶。一种或多种酶可同时以可溶和/或固定化形式存在。

本发明所述方法能在本领域技术人员已知的常见反应器中进行,并且能在不同规模范围进行,例如从实验室规模(数毫升到几十升的反应体积)到工业规模(数升到数千立方米的反应体积)。如果多肽以通过非活性,可选地透性化细胞包封的形式,以或多或少纯化的细胞提取物形式或以纯化形式使用,能使用化学反应器。化学反应器通常允许控制至少一种酶的量,至少一种底物的量,反应培养基的pH、温度和循环。当至少一种多肽/酶存在于活细胞时,所述方法可以是发酵。此情况中,生物催化生成会在生物反应器(发酵罐)中发生,其中能控制活细胞合适生存条件所需的参数(例如,培养基有营养物、温度、通气、有或没有氧气或其他气体、抗生素等)。本领域技术人员熟悉化学反应器或生物反应器,例如用于从实验室规模升级到工业规模的化学或生物技术方法的方法,或用于优化方法参数,这也广泛描述于文献(用于生物技术方法,参见例如Crueger und Crueger,Biotechnologie–Lehrbuch der angewandten Mikrobiologie,2.Ed.,R.Oldenbourg Verlag,München,Wien,1984)。

含有至少一种酶的细胞能通过物理或机械方式透性化,如超声或射频脉冲、法压壶,或化学方式如低渗介质、裂解酶和培养基中存在的洗涤剂,或这些方法的组合。洗涤剂的实例是洋地黄皂苷、正十二烷基麦芽糖苷、辛基糖苷、

本发明的生物转化反应也应用含有所需生物催化剂的非活的(non-living)细胞生物质,而不是活细胞。

如果至少一种酶是固定化的,其如上所述附着于惰性载体。

转换反应能分批、半分批或连续完成。反应物(并且任选地营养物)能在反应开始时提供或者能随后半连续或连续提供。

本发明的反应根据特定反应类型,可在水性、水性-有机或非水性,特别是水性或水性-有机反应介质中进行。

水性或水性-有机介质可含有合适缓冲液,以调整pH到5-11范围内的值,如6-10。

在水性-有机介质中,可应用有机溶剂,与水易混溶的、部分易混溶的或不混溶的。合适有机溶剂的非限制性实例如下所列。其他实例是单羟基或多羟基、芳香族或脂族醇,特别是多羟基脂族醇如甘油。

反应物/底物的浓度可适应最优反应条件,其可取决于所应用的特定酶。例如,初始底物浓度可以是0.1-0.5M,例如10-100mM。

反应温度可适应最优反应条件,其可取决于所应用的特定酶。例如,反应可在0-70℃温度范围内进行,例如0-50或5-35℃。反应温度的实例是约10℃、约15℃、约20℃、约25℃、约30℃和约35℃。

所述方法可推进,直至达到底物与随后产物之间的平衡,但可更早终止。常见方法时间范围是1分钟-25小时,特别是10分钟-6小时,例如1小时-4小时范围,特别是1.5小时-3.5小时。这些参数是合适方法条件的非限制性实例。

如果宿主是转基因植物,能提供最优生长条件,如最优光、水和营养物条件。

7.化学氧化

根据本发明,特定种类的氧化催化剂系统适合上述式I吡咯烷底物的区域特异性和立体保守的化学氧化,特别是(S)-2-(吡咯烷-1-基)丁酰胺(2)。

催化剂可以是均相或非均相催化剂,如下更详细所述。

步骤3)的化学氧化用特定氧化催化剂进行,所述催化剂能够在α位置不对称碳原子基本保留立体构型的情况下,将式(Ia)或(Ib)化合物中的杂环α氨基氧化成酰胺基以提供基本上为立体化学纯形式的终产物。

氧化催化剂选自以下组合:无机钌(+III)、(+IV)、(+V)或(+VI),特别是(+III)或(+IV)盐与至少一种氧化剂,所述氧化剂能够将钌(+III)、(+IV)、(+V)或(+VI),特别是(+III)或(+IV)原位氧化成,特别是钌(+VIII),并且任选地存在单价或多价金属配体,例如草酸钠。

所述无机钌(+III)或(+IV)盐选自RuCl

所述无机钌(+V)或(+VI)盐选自RuF

氧化剂可选自高卤酸盐(perhalogenate)、次卤酸盐(hypohalogenite)(特别是次氯酸盐(hypochlorite),NaClO)、卤酸盐(halogenate)(特别是溴酸盐,NaBrO

另一组氧化剂代表次卤酸盐和其水合物,优选碱性次卤酸盐,更优选次卤酸钠或次卤酸钾,特别是次氯酸钠或次氯酸钾五水合物或其组合。

另一组氧化剂代表上述次卤酸盐和高卤酸盐组的组合。

(i)均相氧化方法

氧化反应可如下进行:将式I底物溶于合适的水性或有机溶剂,所述溶剂是非极性非质子,基本上水不混溶的溶剂,例如羧酸酯,如乙酸乙酯、醚或烃(脂肪族或芳香族)或者卤代烃(脂肪族或芳香族)或与水混溶的有机溶剂,例如乙腈、丙酮、N-甲基-2-吡咯烷酮或N,N-二甲基甲酰胺。式I底物溶液的溶剂优选选自水,更优选选自水与至少一种所述与水混溶的有机溶剂的混合物,甚至更优选至少一种所述有机溶剂或至少两种所述有机溶剂的混合物。在另一个优选实施方案中,所述底物可以净(neat)添加。

之后,添加钌盐与至少一种氧化剂的水溶液或水/有机溶液混合物,任选地逐步添加,所述氧化剂用于原位氧化钌阳离子。或者,可以向钌盐与至少一种氧化剂的预制水溶液或水/有机溶液混合物添加底物的水或有机溶液或者水/有机溶液混合物,任选地逐步添加。终溶剂混合物优选由纯水构成,更优选水/有机溶剂混合物,特别是水/丙酮、水/乙酸乙酯、水/乙腈、水/N-甲基-2-吡咯烷酮,或水/N,N-二甲基甲酰胺的混合物并且具体是水/乙腈的混合物。水/有机溶剂混合物的终比例优选从纯水至纯有机溶剂,更优选4:1-1:4v/v,特别是4:2-2:4v/v,并且特别是1:1v/v。

为进行反应,可根据各溶剂中底物的溶解度选择一定范围内的初始底物浓度,例如0.001-1mol/l范围内。如果底物净添加,根据各催化剂混合物中底物的溶解度选择一定范围的初始底物浓度,优选0.001-1mol/l范围内,更特别是0.1-0.2mol/l范围内,并且具体是0.107mol/l。底物也可以以大于溶解度产物的量添加。

为进行反应,优选应用相比底物摩尔过量的氧化剂,优选1-10倍,更优选1.1-5倍,特别是2-3倍并且具体是2.6倍过量。

为进行反应,优选应用相对于底物催化量的钌盐,例如范围为0.001-100mol%,优选0.005-10mol%,特别是0.05-1mol%并且具体是0.5mol%。

所述反应在反应混合物的搅拌下进行,或反应可选在没有搅拌的情况下进行。活性钌催化剂的产生可通过超声处理协助。

所述反应在打开的或优选密闭的反应容器中进行。

氧化在优选2-12的pH值下进行,更优选4-10,特别是6-8,并且具体是pH 7。

反应温度选择的温度范围,取决于各溶剂混合物的熔点,优选-20到80℃,更优选-10到60℃,特别是-5到30度(grade)并且具体是0℃。

反应终止后,优选在10-240分钟后,特别是20-60分钟后并且具体是30分钟后,反应产物可从有机相或水相中分离。

(ii)非均相氧化方法

在另一个优选实施方案中,所述式I底物的立体特异化学氧化特别是(S)-2-(吡咯烷-1-基)丁酰胺(2)以连续、非均相的方法进行。而在分批(或不连续;时间相关)方法中,含有底物的电解质进行氧化并且一定时间后停止,产物从反应容器中分离,采用连续方法设计,底物溶液连续通过含有催化剂的材料,优选含有固定化形式的催化剂。

对于固定化,钌盐固定于惰性固体载体材料。钌盐优选Ru(III)Cl或RuO

式I底物与至少一种氧化剂溶于纯水、有机溶剂或其溶剂混合物。可应用与上面均相方法所述相同的溶剂和混合物。

底物浓度范围优选是0.001-10mol/l,更优选0.01-5mol/l,特别是0.1-1mol/l并且具体是0.05mol/l。

溶剂混合物比例范围优选是净水至2:4v/v水:有机溶剂,更优选4:1-1:4v/v,特别是4:2-2:4v/v并且具体是1:1v/v。

使用相比底物摩尔过量的氧化剂,优选1-10倍,更优选1.1-5倍,特别是2-3倍并且具体是2.6倍过量。

为进行反应,底物溶液经柱输送,这是通过使用合适的泵或另一合适的压力产生装置(pressure-generating arrangement)。流速范围根据底物浓度和/或氧化方法规模选定,例如2l/h,并且能由本领域技术人员方便地调整适应。底物溶液可一次或多次通过柱(材料)。

反应温度范围根据各溶剂系统熔点选定,优选-20到80℃,更优选-10到60℃,特别是-5到30℃并且具体是0℃。

氧化在优选2-12的pH值下进行,更优选4-10,特别是6-8并且具体是pH 7。

8.产物分离

本发明方法还能包括回收终产物或中间产物的步骤,任选地以立体异构或对映体基本纯的形式。

术语“回收”包括从培养物或反应培养基中提取、收获、分离或纯化化合物。回收化合物能根据本领域已知的任意常规分离或纯化方法进行,包括但不限于:用常规树脂(如阴离子或阳离子交换树脂,非离子型吸附树脂等)处理,用常规吸附剂(如活性炭、硅酸、硅胶、纤维素、氧化铝等)处理,改变pH,溶剂萃取法(如用常规溶剂如醇、乙酸乙酯、己烷等),蒸馏,透析,过滤,浓缩,结晶,再结晶,pH调整,冻干等。分离的产物的特性和纯度可通过已知技术确定,如高效液相色谱(HPLC)、气相色谱(GC)、光谱学(如IR、UV、NMR)、着色法、TLC、NIRS、酶或微生物试验。(参见例如:Patek et al.(1994)Appl.Environ.Microbiol.60:133-140;Malakhova et al.(1996)Biotekhnologiya 1127-32;und Schmidt et al.(1998)Bioprocess Engineer.19:67-70.Ullmann's Encyclopedia of IndustrialChemistry(1996)Bd.A27,VCH:Weinheim,S.89-90,S.521-540,S.540-547,S.559-566,575-581und S.581-587;Michal,G(1999)Biochemical Pathways:An Atlas of Biochemistryand Molecular Biology,John Wiley and Sons;Fallon,A.et al.(1987)Applicationsof HPLC in Biochemistry in:Laboratory Techniques in Biochemistry andMolecular Biology,Bd.17.。

在本文所要保护的方法的所有实施方案中,产物的分离或逐渐积累取决于所需产物以及除其他外反应条件,并且大部分为本领域技术人员已知。

例如,为获得式III的氧化产物具体是(S)-α-乙基-2-氧代吡咯烷乙酰胺(XIIIa),所产生的碘酸盐和高碘酸盐残留物通过沉淀移出。沉淀通过极性较小的水混溶性溶剂或通过降低温度来发生;若必要,在反应介质浓缩后。若需要,浓缩能通过常规方式完成,如蒸发部分溶剂,必要时在减压、部分冷冻干燥、部分反渗透下等。沉淀的产物能通过常规方式分离,如过滤或倾析上清。为移出催化剂或金属残留物或不需要的杂质,含产物的滤液或溶液可用木炭处理。木炭通过常规方式移出,如过滤或倾析上清。含产物的溶液的溶剂随后通过常规方式浓缩或移出,如蒸发等,并且若需要,产物进行结晶和/或再结晶。

或者,溶剂能从反应介质中移出,例如通过溶剂蒸发,必要时在减压、冷冻干燥、反渗透下等。残留物通过常规方式纯化,如再结晶、层析或萃取。

适当时,如果产物由两种或更多立体异构体构成,例如(S)-和(R)-对映体,通过应用常规制备分离方法如手性色谱或通过分解,则反应产物可通过进一步纯化特定立体异构体来进一步被加工。

本文所述任意方法生成的中间和终产物能转变成衍生物,例如但不限于酯、糖苷、醚、环氧化物、醛、酮或醇。衍生物能通过化学方法获得,例如但不限于氧化、还原、烷基化、酰化和/或重排。或者,化合物衍生物能通过使化合物接触酶用生化方法获得,例如但不限于氧化还原酶、单加氧酶、双加氧酶、转移酶。生化转化能用分离的酶、来自裂解细胞的酶体外进行,或用全细胞体内进行。

9.卤酸盐/碘酸盐的电化学再利用和高卤酸盐/高碘酸盐从卤酸盐/碘酸盐开始的重头合成

在另一个优选实施方案中,所述生成的卤酸盐优选碘酸盐回收自式I底物氧化方法的反应混合物,卤酸盐/碘酸盐或高卤酸盐/高碘酸盐的氧化通过阳极氧化电化学进行。相关方法即在硼掺杂金刚石电极处碘化物到高碘酸盐的阳极氧化,描述于PharmaZellGmbH的欧洲专利申请(EP19214206.5,申请日2019年12月6日)。

然而,应理解本发明所述的碱性碘酸盐的再利用方法不限于本文所述的关于上面式I底物氧化方法的特定方法。碱性碘酸盐通过任意类型的氧化反应形成自碱性高碘酸盐,可再利用以产生碱性高碘酸盐氧化剂。在这类反应介质中,卤酸盐,更特别是碱性碘酸盐,尤其是碘酸钠或钾的初始浓度c

用于再利用的碘酸盐的回收指,这些从基于高碘酸盐的氧化的反应介质中分离和逐渐积累,优选来自式I底物氧化的反应混合物,这取决于所需产物或除其他外反应条件并且大部分为本领域技术人员已知。

例如,为获得产生的卤酸盐,优选碘酸盐,并且特别是碘酸钠,反应介质与极性较小的水混溶性溶剂混合,优选醇、羧酸、羧酸酯、醚、酰胺、吡咯烷酮、碳酸盐、四甲脲或腈,特别是乙醇、异丙醇或甲醇乙酸、乙酸乙酯、四氢呋喃、N-甲基吡咯烷酮、N,N-二甲基甲酰胺、N,N-二甲基乙酰胺或乙腈以使沉淀发生。沉淀的卤酸盐能通过常规方式分离,如过滤或倾析上清。若需要,沉淀物能随后进行进一步纯化步骤以移出不需要的副产物等(如果有),例如通过有机溶剂(混合物)洗涤,或通过再结晶。

在其中进行阳极氧化的电解池包括一个或多个阳极室中的一个或多个阳极以及一个或多个阴极室中的一个或多个阴极,其中阳极室优选与阴极室分开。如果使用一个以上阳极,则两个或更多个阳极能排列于相同阳极室或不同室。如果两个或更多个阳极存在于相同室,其能相邻排列或在各自顶部排列。这同样适用于采用一种或多种阴极的情况。在两个或更多电解池的情况中,其能相邻排列或在各自顶部排列。阳极室与阴极室的分开能如下完成:通过使用用于阴极和阳极的不同电解池,并且通过盐桥连接这些池以用于电荷平衡。分离器(separator)分开阳极室的液体介质中的阳极液与阴极室的液体介质中的阴极液,但允许电荷平衡。隔膜是分离器,其包括氧化材料的多孔结构,如硅酸盐,例如以瓷(procelain)或陶瓷(ceramics)的形式。由于隔膜材料对严苛条件的敏感性,一般优选半透膜,尤其是当反应在碱性pH进行时,它是优选的。抵抗严苛条件尤其是碱性pH的膜材料是基于氟化聚合物。用于此类膜的合适材料的实例是基于磺化四氟乙烯的氟聚合物-共聚物,如来自DuPont de Nemours的

作为阳极(或电极,更一般而言),可使用含碳材料。含碳阳极/电极为本领域熟知且包括例如石墨电极、玻璃态石墨(玻璃碳)(vitreous carbon(glassy carbon)电极、网状玻碳电极、碳纤电极、基于碳复合材料的电极、基于碳-硅复合材料的电极、基于石墨烯的电极和基于硼金刚石的电极。

电极不必定完全由所提及的材料构成,但可由包被的载体材料组成,例如硅、自钝化金属如锗、锆、铌、钛、钽、钼和钨、金属碳化物、石墨、玻璃碳、碳纤维和其组合。

例如,合适的自钝化金属是锗、锆、铌、钛、钽、钼和钨。

合适的组合是例如在相应的金属上的金属碳化物层(如当金刚石层应用于金属支撑物时,夹层可原位形成),两种或多种上面所列支撑材料的复合材料以及碳与一种或多种上面所列其他元素的组合。复合材料的实例是硅化碳纤维碳复合材料(CFC)和部分碳化复合材料。

优选地,支撑材料选自由元素硅、锗、锆、铌、钛、钽、钼、钨、上述八种金属的碳化物、石墨、玻璃碳、碳纤维和其组合(特别是复合材料)。

更优选元素硅、锗、锆、铌、钛、钽、钼、钨以及上述七种金属之一与各自金属碳化物的组合。

阳极材料中,优选硼掺杂金刚石。硼掺杂金刚石包括相对于掺杂金刚石总重,硼含量优选为0.02-1重量%(200-10,000ppm),更优选0.04-0.2重量%,特别是0.06-0.09重量%。

如上所示,这类电极一般不由掺杂金刚石单独构成。相反,掺杂金刚石附着于底物。掺杂金刚石更常呈现为导电底物上的层,但金刚石颗粒电极也适合,其中掺杂金刚石颗粒包埋于导电或不导电底物。然而,优选阳极,其中掺杂金刚石呈现为导电底物上的层。

掺杂金刚石电极和制备它们的方法为本领域已知并描述于例如上述Janssen的论文,Electrochimica Acta 2003,48,3959,NL1013348C2和其中引用的参考文献。合适的制备方法包括例如化学气相沉积法(CVD)如灯丝CVD或微波等离子体CVD,用于制备有掺杂金刚石薄膜的电极;和高温高压(HTHP)方法,用于制备有掺杂金刚石颗粒的电极。掺杂金刚石电极市售可得。

阴极材料不是很关键,任何常用材料都合适,如不锈钢、铬镍钢、铂、镍、青铜、锡、锆或含碳的电极。在一个特定的实施方案中,所述不锈钢焊条用作阴极。

适当地,碘酸盐的电化学氧化在水介质中进行。因此,本发明方法包括使含碘酸盐特别是金属碘酸盐的水溶液经阳极氧化。

电解可在恒电流控制(即控制应用的电流;电压可测量,但不受控)或恒电位控制(即控制应用的电压;电流可测量,但不受控)下完成,优选前者。

在优选恒电流控制的情况下,观察电压一般范围是1-30V,更常是1-20V并且特别是1-10V。

在恒电位控制的情况下,应用的电压一般处于相同范围,即1-30V,优选1-20V并且具体是1-10V。

阳极氧化优选在电流密度范围10-500mA/cm

为使碘酸盐至高碘酸盐的转化最大化,应用的电荷优选为至少2法拉,更优选至少2.5法拉,特别是至少2.75法拉并且具体是至少3法拉。更特别地,应用的电荷范围优选是1-10法拉,更优选2-6F,特别是2.5-4F并且具体是2.75-3.5法拉。

电解可在酸性、中性或碱性条件下进行。电解优选在碱性条件下进行。待用于本发明方法的合适的碱是在水相中形成氢氧离子的那些。优选无机碱,如金属氢氧化物、金属氧化物和金属碳酸盐,特别是碱性和碱土金属类氢氧化物。优选金属氢氧化物,其中碱金属对应于卤酸盐的金属。阳极氧化在至少8的pH下进行,优选至少10,特别是至少12并且具体是至少14。水一般用作溶剂。

碘酸盐或卤酸盐溶液的初始摩尔浓度优选是0.0001-10M,更优选0.001-5M,特别是0.01-2M并且具体是0.1-1M。碱性溶液中碱的初始摩尔浓度是0.3-5M,优选0.6-3M,特别是0.9-2M并且具体是1M。碱与卤酸盐之比优选是10:1到1:1,更优选8:1-2:1,特别是6:1-3:1并且具体是5:1-4:1。

阳极氧化优选在0-80℃的温度进行,更优选10-60℃,特别是20-30℃并且具体是20-25℃。反应压力不关键。

在碱性条件下,形成金属高碘酸盐,其是多种高碘酸的金属盐。高碘酸阴离子由+VII氧化态的碘组成并且包括多种结构例如原过碘酸盐(ortho-periodate)(IO

仲高碘酸盐形式的高碘酸盐通过过滤分离自阳极液。若需要,如下使沉淀发生:通过浓缩溶剂,通过添加极性较小的水-混溶性溶剂,通过增加pH值,或通过除其他外降低温度。若需要,浓缩能通过常规方式完成,如蒸发部分溶剂,必要时在减压、部分冷冻干燥、部分反渗透下等。对于添加水-混溶性溶剂,若需要,优选使用醇、羧酸、羧酸酯、醚、酰胺、吡咯烷酮、碳酸盐、四甲脲或腈,特别是乙醇、异丙醇或甲醇乙酸、乙酸乙酯、四氢呋喃、N-甲基吡咯烷酮、N,N-二甲基甲酰胺、N,N-二甲基乙酰胺或乙腈。对于提高阳极介质的pH值,若需要,合适的碱优选金属氢氧化物,其具有的金属对应于金属高卤酸盐中的金属。沉淀的产物能通过常规方式分离,如过滤或倾析上清。产物中的残留溶剂可通过常规方式移出,如蒸发、将其保存于干燥器等,若需要,将产物结晶和/或再结晶。

或者,溶剂能从反应介质中移出,例如通过溶剂蒸发,必要时在减压、冷冻干燥、反渗透下等。残留物能通过常规方式纯化,例如再结晶、层析或萃取。

下列实施例仅是说明性的并且不意在限制本文所述实施方案的范围。

在认为本文所提供公开内容也在本发明范围内之后,许多可能的变化对本领域技术人员立即变得明显。

实施例

除非另有说明,克隆步骤在本发明背景下完成,例如限制性酶切、琼脂糖凝胶电泳、纯化DNA片段、核酸转移到硝化纤维素和尼龙膜上、连接DNA片段、微生物转化、微生物培养、噬菌体增殖和重组DNA的序列分析,除非另有规定,通过应用熟知的技术来完成,例如描述于上述引用的Sambrook等人(1989)中。

A.生化章节

1.一般

此章节描述旨在鉴定合成靶分子(S)-2-(吡咯烷-1-基)丁酰胺的稳健的、(S)-选择性NHase的工作.(2)。在能够进行靶反应的鉴定候选物中,应选择最佳酶并进行工程化改造以提高其特性如对映选择性。

应该用这类对映选择性NHase从各种腈中转化靶分子,这是通过起始材料的动态动力学拆分(查阅上面的方案1)。

允许底物外消旋作用的反应条件在本发明前未确定,但由本发明者预测为高温度和/或pH值。

2.材料与方法

2.1菌株、载体、酶和引物

2.1.1大肠杆菌菌株

此工作的克隆部分用大肠杆菌Top10F’作为宿主完成。对于蛋白表达,使用菌株大肠杆菌BL21 Gold(DE3)。两种菌株都获自Life Technologies(Carlsbad,CA,USA)。

2.1.2载体

用于此项目的表达载体是pMS470d8[C.Reisinger,A.Kern,K.Fesko,H.Schwab,Anefficient plasmid vector for expression cloning of large numbers of PCRfragments in Escherichia coli.,Appl.Microbiol.Biotechnol.77(2007)241–4.doi:10.1007/s00253-007-1151-1]](见图1)。质粒编码细菌来源ColE1、氨苄青霉素抗性基因(ampR)和基因调节子lacI。tac启动子和rrnB终止子的系统允许诱导型表达。使用限制性位点NdeI和HindIII移出填充片段d8以产生合适载体骨架。

2.1.3酶

表1.测试的腈水合酶的基因和蛋白条目。

/>

(1)J.L.Tucker,L.Xu,W.Yu,R.W.Scott,L.Zhao,N.Ran,Chemoenzymaticprocesses for preparation of levetiracetam,WO2009009117,2009.

(2)X.Pei,Z.Yang,A.Wang,L.Yang,J.Wu,Identification and functionalanalysis of the activator gene involved in the biosynthesis of Co-typenitrile hydratase from Aurantimonas manganoxydans,J.Biotechnol.251(2017)38–46.doi:10.1016/J.JBIOTEC.2017.03.016.

(3)K.L.Petrillo,S.Wu,E.C.Hann,F.B.Cooling,A.Ben-Bassat,J.E.Gavagan,R.DiCosimo,M.S.Payne,Over-expression in Escherichia coli of a thermallystable and regio-selective nitrile hydratase from Comamonas testosteroni 5-MGAM-4D,Appl.Microbiol.Biotechnol.67(2005)664–670.doi:10.1007/s00253-004-1842-9.

2.1.4引物

表2:用于此项目的引物列表

/>

/>

/>

改变的三联密码子加下划线.N可以是A、G、T或C;M可以是A或C;K可以是G或T;Y可以是T或C;S可以是C或G;R可以是G或A;V可以是A、G或C;D可以是A、G或T;H可以是A、C或T;B可以是G、C或T。

2.2克隆

此章节总结克隆操作。

2.2.1订购基因(ordered gene)

将编码选择的NHase的α和β亚基及辅助蛋白的基因(参见下表34的SEQ ID NO)以双链DNA片段订购。用于BjNHase、CtNHase,KoNHase、MlNHase、NaNHase、PcNHase、RlNHase、RmNHase和RsNHase的基因以gBlocks购自IDT(鲁汶/比利时)。从GenScript(新泽西州/美国)获得GenParts用于AbNHase、AmNHase、BrNHase、TrNHase和VvNHase,并且CjNHase,GhNHase和PtNHase以GeneArt Strings购自ThermoFisher Scientific(沃尔瑟姆/美国)。相关序列列于下面的单独章节。

2,2.2制备载体骨架

所需质粒在大肠杆菌Top10F’中扩增并用

为制备缺乏α1、α2、β1、β2或β1-β2区域的pMS470-CtNHase/pMS470-CtNHase-βF51L骨架,5μg载体用含6μL NheI-FD或XhoI-FD的1x FD Green Buffer(ThermoFisherScientific)切割,总体积为50μL,37℃持续2小时。线性化载体用制备性琼脂糖凝胶和

2.2.3Gibson克隆

根据制造商说明,用Gibson Assembly HiFi 1-Step Kit(Synthetic Genomics)(La Jolla/USA)进行Gibson克隆。

对于克隆NHase组到pMS470d8,用1:1比例使用20-40ng载体以及10-15ng插入物。对于克隆更小片段到载体pMS470-CtNHase例如用于产生随机库,施用1当量的载体骨架与3当量的插入物。同样,在重叠延伸PCR后,每1当量的载体使用3当量的插入物(由PCR合成)。

2.2.4QuikChange PCR

在QuikChange PCR中突变单个位置以引入特定三联密码子或简并密码子NNK。

PCR反应包含10ng或116ng模板DNA(pMS470-CtNHase或其突变体),0.2μM正向和反向引物(例如Ct-aQ93X_for和Ct-aQ93X_rev,表2),0.2mM dATP、dCTP、dGTP和dTTP,1x Q5Reaction缓冲液,1x Q5 High GC Enhancer和1U Q5 High-Fidelity DNA聚合酶。PCR程序如下:98℃30s,30个循环的98℃10s,56/58℃30s和72℃3min,以及72℃6min的终延伸步骤。

PCR产物是在PCR后立即纯化(

表3:用于不同构建体的QuikChange PCR条件

模板量,退火温度以及DpnI消化时间点就不同pMS470-CtNHase构建体而改变。

2.2.5随机诱变

构建CtNHase基因中4个区域的随机诱变库,2个在α亚基以及2个在β亚基,这是通过用Mutazyme II(Agilent Technologies)(SantaClara/USA)扩增并且加入MnCl

50–70ng PCR产物克隆入pJET1.2/blunt(CloneJET PCR Cloning Kit,ThermoFisher Scientific),使用粘性末端方案。用所得质粒转化电转感受态大肠杆菌Top10F’细胞。在大肠杆菌(E.coli)扩增和分离(

2.2.6骨架菌株

载体骨架在50μL PCR反应中产生,其由1ng模板DNA (pMS470-CtNHase或pMS470-CtNHase-βF51L),0.2μM的两种引物(例如Ct-A1bb-lig_for和Ct-A1bb-lig_rev,表2),0.2mM dATP、dCTP、dGTP和dTTP,1x Q5 Reaction缓冲液,1x Q5 High GC Enhancer以及1UQ5 High-Fidelity DNA聚合酶组成。PCR程序如下:98℃30s,30个循环的98℃10s,60℃30s和72℃2min,以及72℃2min的终延伸步骤。PCR产物用10U DpnI消化2小时并纯化(

2.2.7重叠延伸PCR

为在β1区域引入多重突变,必须进行重叠延伸PCR。第一轮中,扩增正向和反向片段,其在第二轮PCR反应中用外引物连接。此策略用于同时靶向位置βL48、βF51和βG54。

总体积50μL的第一PCR反应由1ng模板DNA(pMS470-CtNHase或其突变体),0.2μM的两种引物(例如Ct-b1-focused_for和Ct-b1_rev(表2),0.2mM dATP、dCTP、dGTP和dTTP,1xQ5 Reaction缓冲液,1x Q5 High GC Enhancer以及1U Q5High-Fidelity DNA聚合酶组成。PCR程序如下:98℃30s,30个循环的98℃10s,60℃30s和72℃30s,以及72℃2min的终延伸步骤。通过添加10μL 6x上样染料并上样于制备性琼脂糖凝胶终止PCR反应。将正确大小的PCR产物切下并用

进行第二PCR以连接正向与反向片段。PCR反应总共50μL,包含2.5μL纯化的正向片段,2.5μL纯化的反向片段,0.2μM的两种外引物,0.2mM dATP、dCTP、dGTP和dTTP,1x Q5Reaction缓冲液,1x Q5 High GC Enhancer以及1U Q5 High-Fidelity DNA聚合酶。PCR程序与用于第一PCR的相同。向反应添加10μL 6x上样染料并上样于制备性琼脂糖凝胶。将所需PCR产物切下并用

2.2.8确认新构建体

用QuikChange PCR或Gibson克隆后新产生的质粒转化电转感受态大肠杆菌Top10F’细胞。

菌落PCR(2.2.9)后,插入物大小正确的菌落进行画线挑出以用于质粒分离,或如果未进行菌落PCR,则是随机菌落。质粒用

2.2.9菌落PCR

菌落PCR在Gibson克隆(2.2.3)或QuikChange PCR(2.2.4)后进行,以确认新构建质粒的插入物大小正确。

PCR反应包含0.2μM正向和反向引物(KST_foropt和KST_rev1,表2),0.2mM dATP、dCTP、dGTP和dTTP,1x DreamTaqReaction缓冲液以及0.025U DreamTaq DNA聚合酶。通过用牙签接触靶菌落,随后在反应混合物中搅动添加少量含有新产生的质粒的大肠杆菌细胞材料。PCR程序如下:95℃10min,30个循环的95℃30s,53℃30s和72℃1min,以及72℃7min的终延伸步骤。通过凝胶电泳分析产物大小。

2,3蛋白表达

2.3.1摇瓶表达

用单个菌落或来自冷冻保存样品的少量细胞材料接种含100μg/mL氨苄青霉素(LB-Amp)的10mL LB培养基。过夜培养物(ONC)在37℃振荡(约110-150rpm)下过夜生长。第二天,用4mL ONC接种400mL LB-Amp培养基,在37℃和120rpm孵育,直至达到0.8-1的OD

2.3.2深孔板培养

96孔深孔板填充有每孔含100μg/mL氨苄青霉素的750μL LB培养基,用单个菌落或冷冻保存培养物接种。过夜培养物在37℃和320rpm生长。第二天,用25μL ONC接种750μLLB-Amp培养基并在37℃和320rpm孵育6小时。用含IPTG和CoCl

优化NHase在深孔板中的表达。在改善的操作中,仅10μL ONC用于接种主要培养物且诱导在23/4小时后完成,而不是6小时。对于冷冻保存,向ONC添加300μL 50%甘油。

2.3.3细胞裂解

细胞沉淀通常是每烧瓶1-3g,重悬于25mL 50/40mM Tris-丁酸盐缓冲液,pH 7.2,并通过超声处理于冰上裂解6分钟,采用70-80%占空比(duty cycle)和7-8输出控制。通过在48,250g和4℃离心1小时并经0.45μM注射器式滤器过滤后,获得无细胞提取物。用Pierce

2.3.4SDS-PAGE

Protein Extraction Reagent(Novagen)应用于确定无细胞提取物中的NHase含量。样品经SDS-PAGE分析并用GeneTool软件评估。

13μL蛋白样品与5μL

当通过SDS-PAGE分析全细胞时,20μL样品包括约13.6mg/mL细胞,2x

2.3.5热纯化

无细胞提取物分别在40℃、50℃和60℃孵育,以900rpm在恒温混匀仪中持续10分钟。在4℃和21,13g离心10分钟后,上清经0.45μm注射器式滤器过滤。通过SDS-PAGE(2.3.4)分析热纯化的无细胞提取物(CFE)并测定甲基丙烯腈水解(2.4.1)。

2.4活性测定和分析学

2.4.1用于甲基丙烯腈水合作用活性的分光光度测定

通过监测甲基丙烯腈(MAN)的水合作用来确定NHase的物理化学特性。因此,10μLNHase CFE(稀释于Tris-丁酸盐缓冲液50/40mM pH 7.2)在96孔UV星形板中与含100μL125mM MAN的Tris-丁酸盐缓冲液50/40mM(pH 7.2)混合。通过在Synergy Mx Platereader(BioTek)上以224nm,25℃持续5分钟,来监测甲基丙烯酰胺(MAD)的形成。单位/mL的样品活性用下式计算:

平行进行合适的空白反应并且各反应至少一式三份进行。

温度和pH研究

为确定最佳pH,如上所述的标准测定使用下列缓冲液:100mM柠檬酸-磷酸盐缓冲液pH 5-6、100mM磷酸钠缓冲液pH 7-8、100mM Tris-HCl缓冲液pH 8.5、100mM碳酸盐缓冲液pH 9-10。

对于稳定性测试,NHase-CFE在不同温度和/或不同pH孵育,于振荡(300rpm)下持续多至6小时,然后测定甲基丙烯腈水合作用。

抑制研究

为测试潜在的抑制,使用的上述标准测定有轻微改变。将MAN溶于0-50mM KCN溶液或0-50mM丙醇溶液。蛋白样品也用各KCN或丙醇溶液稀释。

2.4.2靶底物的生物催化转化

rac-1通过NHase的生物催化水合作用的标准设置是500μL反应体积,包括NHase-CFE(总蛋白范围为约5-15mg/ml,NHase含量为CFE中约5-40%,通过SDS PAGE用Gene Tool软件测定,对应约0.0125-6mg/ml NHase)或细胞、底物和缓冲液。孵育在恒温混匀仪装置中25℃完成。进行多种不同实验,其中许多参数改变(一次一个)或使用添加剂。

通过添加2体积乙醇并彻底混合1分钟终止反应。反应在室温过夜以用于蛋白沉淀,然后其以最大速度在台式离心机中离心至少20-40分钟。500μL上清移至HPLC小瓶内。

筛选NHase组

为筛选用于转化rac-1的NHase组,用含10mM rac-1和50μL NHase-CFE的50mM磷酸钠缓冲液,pH 7.2建立500μL反应。反应在25℃和300rpm孵育过夜。

温度研究

就能够水合1的NHase研究不同反应温度,但反应设置相较上述筛选设置略有改变。80μL NHase-CFE用于转化10mM rac-1且孵育在37℃或50℃完成。

更高浓度的rac-1的转化

就更高底物浓度测试有希望的候选物。因此,50μL CFE应用于含500μL反应的50mM磷酸钠缓冲液,pH 7.2,有50或100mM rac-1。

时间研究

用CtNHase、KoNHase和GhNHase的CFE进行时间研究。因此,有90μL CFE和20mMrac-1的900μL反应在25℃及300rpm一式二份孵育。30min、1h、2h、4h、6h和过夜后取100μL样品。

共溶剂的影响

此外,也测试有机共溶剂。反应用含50mM rac-1,10%(v/v)NHase-CFE和5%共溶剂的50mM磷酸钠缓冲液,pH 7.2进行。样品在25℃和1000rpm下孵育过夜。

催化剂量的影响

rac-1的水合作用用不同催化剂量的CtNHase-CFE和GhNHase-CFE进行。应用50mM底物以及含0.5-20%(v/v)CFE的200mM Tris-HCl缓冲液,pH 7,在500rpm持续2小时。反应温度就CtNHase而言是5℃并且就GhNHase而言是25℃。

低转化温度的影响

在500μL规模反应中研究较低反应温度。50mM rac-1应用于50mM磷酸钠缓冲液,pH7.2,使用100μL CFE。孵育在5℃和25℃(用于对照)及300rpm过夜完成。对于时间研究,用含20mM rac-1和10%(v/v)CFE的100mM磷酸钠缓冲液,pH 8建立1mL反应。在1、2、5、10、20和30min后分别取样。另外,对5℃的反应分析60min样品。

酶进料的影响

酶进料实验在500μL反应中进行,所述反应包含50/40mM Tris-丁酸盐,pH 7.2中的50mM rac-1。在反应开始时,添加50μL CFE并在25℃和300rpm开始孵育。1小时后,应用额外50μL CFE且孵育在反应终止前又进行了一小时。在类似实验中,50mM rac-1在50mM磷酸钠(NaPi)或50/40mM Tris-丁酸盐缓冲液,pH 7.2中于5℃和300rpm过夜转化。同样,反应用50μL CFE开始并用于进料反应,1小时候再添加50μL。

rac-1通过CtNHase和GhNHase在不同pH的转化

CtNHase-CFE的反应以500μL规模一式三份完成,用含50μL CFE和50mM rac-1的200mM磷酸钠或Tris-HCl缓冲液,pH 7-8.5。GhNHase-CFE的反应略有改变。使用100μL CFE且缓冲液范围是pH 6.5-8.5。

低催化剂量的影响

用GhNHase进行时间研究。1mL反应包含200mM Tris-HCl缓冲液,pH 7中的50mMrac-1和20μL CFE。在25℃和500rpm下进行孵育。在5、10、15、30、45、60和120min后取100μL样品。

GhNHase细胞的底物进料反应

对在底物进料反应中的冻干GhNHase细胞研究rac-1转化。在摇瓶(方案2.3.1)中培养的大肠杆菌BL21 Gold(DE3)[pMS470-GhNHase]重悬于50/40mM Tris-丁酸盐缓冲液,pH 7.2,达到45.7/mL的OD

rac-1通过全细胞的转化

rac-1通过全细胞催化剂的水合作用在多个pH值测试并用于不同催化剂量。细胞重悬于50/40mM Tris-丁酸盐缓冲液,pH 7.2,并测试8.5、4.25、1.7、0.85、0.34和0.17浓度。含50mM rac-1的500μL反应在25℃和500rpm孵育2小时,分别在200mM Tris-HCl缓冲液,pH 7、7.5或8。

用全细胞的时间研究

携带[pMS470-CtNHase]或[pMS470-GhNHase]的大肠杆菌BL21 Gold(DE3)细胞重悬于50/40mM Tris-丁酸盐缓冲液,pH 7.2,达到85mg/mL,还制备1:5稀释液。1mL规模的反应用含50mM rac-1和8.5或1.7mg/mL细胞的200mM Tris-HCl缓冲液,pH 7,所述反应在25℃和500rpm孵育。在30min、1h、2h、3h、4h、6h、8h和25h后取样。

底物进料

表达大肠杆菌BL21 Gold(DE3)[pMS470-CtNHase]和[pMS470-GhNHase]的细胞重悬于50/40mM Tris-丁酸盐缓冲液,pH 7.2,达到85mg/mL,以用于底物进料反应。第一设置在10mL规模上完成,包括含1.7mg/mL细胞的200mM Tris-HCl缓冲液,pH 7。为起始反应,添加50mM rac-1并在25℃和750rpm振荡。1小时后,取100μL样品,再添加50mM rac-1以及100μL 1M HCl以维持pH。此方法在2和3小时后重复。孵育4和5小时后,取100μL样品。第二反应设置为2mL规模,用含8.5mg/mL细胞的200mM Tris-HCl缓冲液,pH 7。添加10mM rac-1以起始反应并且在25℃和1400rpm完成孵育。1、2、3和4h后,各取100μL样品用于分析并添加10mMrac-1。5小时后取最终的100μL样品。

高rac-1浓度的转化

测试CtNHase和GhNHase对rac-1的水合作用,多至200mM腈。500μL规模反应分别包含8.5mg/mL细胞和50、75、100、150或200mM rac-1,在200mM Tris-HCl缓冲液,pH 7、7.5或8中。根据底物浓度,向反应添加1M HCl以维持pH。孵育在25℃和700rpm进行1小时。

添加吡咯烷和丙醛

rac-1通过CtNHase的水合作用在额外吡咯烷或丙醛的存在下研究。500μL反应包括含8.5mg/mL细胞和150mM rac-1的500mM Tris-HCl缓冲液,pH 7.5。

位点饱和CtNHase克隆的再筛选

测定含CtNHase-βF51X克隆的筛选板的rac-1水合作用。因此,来自深孔板培养的细胞团重悬于200μL 200mM Tris-HCl缓冲液,pH 7,达到约20的OD

潜在CtNHase命中的再筛选

有希望的CtNHase克隆的再筛选以500μL规模完成。反应由含8.5mg/mL细胞和100mM rac-1的500mM Tris-HCl缓冲液,pH 7构成,在25℃和700rpm孵育2小时。反应补充有75或150mM吡咯烷或丙醛。一个反应用额外75mM吡咯烷和丙醛完成。所有反应一式三份(除了一个有额外150mM丙醛)完成并在25℃和700rpm孵育1小时。

2.4.3HPLC分析

通过Chiralpak AD-RH(150x 4.6mM,5μm)分开(R)-2和(S)-2,使用20mM Na-硼酸盐缓冲液,pH 8.5与乙腈以70:30比例作为流动相,流速为0.5mL/min,持续15分钟。化合物在210nm(DAD)检测。通过线性插值用rac-2的校准曲线定量,用峰面积计算对映体过量(ee)。(R)-和(S)-2的保留时间分别为5.8分钟和6.4分钟。系统性杂质通过缓冲液引入,其未在基线与(R)-2分开(保留时间:5.7分钟)。

2.4.4底物稳定性实验

用Feigl-Anger滤纸研究rac-1在不同pH的分解[F.Feigl,V.Anger,Replacementof benzidine by copper ethylacetoacetate and tetra base as spot-test reagentfor hydrogen cyanide and cyanogen,Analyst.91(1966)282.doi:10.1039/an9669100282]。因此,10mM的α-乙基-1-吡咯烷乙腈rac-1溶液在不同缓冲液中制备:100mM碳酸盐缓冲液,pH 9和10,100mM磷酸钠缓冲液,pH 7和8以及100mM柠檬酸磷酸盐缓冲液,pH5和6。另外,底物溶于乙醇作为对照。100μL rac-1溶液在96孔微量滴定板中移液并用Feigl-Anger滤纸覆盖。通过拍照记录显色(见图3)。

为研究rac-1在不同pH的分解速度,rac-1溶于范围为pH 5-pH 10的不同缓冲液,分别在2和60分钟后用1体积乙酸乙酯立即萃取。萃取物在Na

通过Chiralpak AD-H分离(R)-和(S)-1,使用90:10比例的正庚烷与乙醇作为流动相,流速为1mL/min,持续8分钟。化合物在210nm(DAD)检测到。(R)-和(S)-1的保留时间分别为4.2min和4.7min。

2.4.5同源建模

YASARA的同源建模实验(18.2.7.W.64版)采用下列参数:

建模速度:快

PS-BLAST迭代:4

E值:0.01

模板的最大数:8(相同序列:1)

Max OligoState:2(二聚)

每模板的最大对齐:5

每环的构象:50

添加至末端的最大残基数:10

2.5筛选试验

用于确定腈水合酶活性的高通量试验应用于CtNHase库的筛选。此偶联测定适合孔板中的菌落筛选或液体反应。第一阶段中,NHase在水性系统中将腈转化成相应的酰胺。酰胺在酰胺酶阶段中进一步转化成异羟肟酸,其中添加红平红球菌(Rhodococcuserythropolis)的部分纯化酰胺酶无细胞提取物和羟基氯化铵。在检测阶段中,异羟肟酸在铁和氢离子存在下形成有色络合物。为了用rac-1作为底物来产生可见信号,许多试验参数必须优化,特别是底物与羟基氯化铵之间的比例,ReAmidase的量,孵育时间和温度,生长条件,过滤材料和检测模式。下列段落描述最终方案。

2.5.1基于菌落的筛选试验

含pMS470-CtNHase库的大肠杆菌BL21 Gold(DE3)细胞在含100μg/mL氨苄青霉素(LB-Amp板)的LB琼脂板上室温生长72小时,或37℃生长24小时或室温生长20小时,然后其附于无菌Amersham Protran硝酸纤维素膜。将膜置于含0.5mM IPTG和1mM CoCl

滤纸(Whatman纤维素)用含100mM rac-1(α-乙基-1-吡咯烷乙腈)的200mM Tris-HCl,pH 7浸泡,将有菌落的膜置于顶部。此NHase阶段室温进行15分钟。之后,膜移至浸泡有酰胺酶反应溶液的新滤器,所述溶液包含4份含27mg/mL部分纯化的ReAmidase-CFE的100mM磷酸钠缓冲液,pH 7.5以及1份的含1M羟基氯化铵的200mM Tris-HCl pH 7。孵育在30℃进行30分钟。为了检测,膜移至新鲜滤纸,所述滤纸用含0.6M FeCl

将有希望的克隆挑到无菌96孔聚苯乙烯板,所述板填充有含2:1比例的100μg/mL氨苄青霉素和50%甘油的100μL LB培养基,用铝箔密封,室温振荡15分钟并-20℃冷冻。

2.5.2液体筛选试验

大肠杆菌BL21 Gold(DE3)[pMS470-CtNHase]细胞或其突变体培养于深孔板(方案参见2.3.2)。冷冻团块重悬于200μL 200mM Tris-HCl,pH 7,产生约20的OD

评估在计算机上完成。原则上,红色通过测量孔的灰度值来定量。照片用IrfanView(4.38版)转换成灰度。在ImageJ中,孔标注为感兴趣区域(ROI)并就这些ROI计算灰度值的中值,产生0到255,000的数值。这些值除以1,000并从255中减去。在这种情况下,深色孔(红色)比通常具有黄色对照孔的数值高。另外,灰度值通过细胞密度(OD

2,5.3制备ReAmidase-CFE用于偶联试验

用来自冷冻保存样品的少量细胞材料接种2个填充有50mL LB-Amp的烧瓶。ONC在振荡(约110-150rpm)下37℃过夜生长。第二天,用4mL ONC接种400mL LB-Amp培养基并在37℃和120rpm孵育,直至达到0.8-1的OD

800mL主培养物的细胞团(约3.5-5g)重悬于30mL 100mM磷酸钠缓冲液,pH 7.5,并通过超声处理于冰上裂解8分钟,采用70-80%占空比和7-8输出控制。通过在48,250g和4℃离心1小时获得无细胞提取物并经0.45μM注射器式滤器过滤。

ReAmidase通过硫酸铵沉淀在无细胞提取物中富集。因此,硫酸铵在4℃缓慢添加以达到35%饱和。在给定的室温的所需量的硫酸铵通过在线工具(

第二天,含蛋白团块的ReAmidase溶于100mM磷酸钠缓冲液,pH 7.5。添加约25%体积的所应用的CFE以获得4倍富集。用Pierce BCA Protein Assay Kit(ThermoFisherScientific)测定蛋白浓度。此部分纯化的ReAmidase-CFE稀释到27mg/mL并于-20℃冷冻。

实验

实施例3.11.

3.1.1选择合适的酶

NHase组由21种酶组成(表1)。从已知酶中选择热稳定、可良好表达和(S)-选择性的NHase。就PEST降解可能性或膜区域来分析预测的NHase序列。不接受临界(critical)序列。同样,倾向热稳定的生物体的NHase并拒绝嗜冷生物体的NHase。仅选择紧密相关的NHase中的一种。

表达质粒可用于4种Fe型NHase,剩余的17种NHase基因必须克隆到pMS470d8载体内。编码2个亚基(见2.2.1)以及辅助蛋白的基因以合成的DNA片段订购并经Gibson克隆(2.2.3)克隆。

3.1.2表达

腈水合酶的功能重组表达需要3条肽链(α和β亚基以及辅助蛋白),α和β亚基的正确组装以及有效金属摄取。因此,以低诱导温度应用诱导型蛋白表达以避免内涵体形成(见2.3.1)。

进行可溶和不溶部分的SDS-PAGE分析(见2.3.4)。MlNHase、PcNHase、ReNHase、CjNHase、GhNHase、BrNHase实现高表达水平。BjNHase、AmNHase和PtNHase的表达不太成功。KoNHase显示不平衡的过表达,有大量β亚基但几乎没有α亚基。NaNHase主要在我们手中的不溶部分内发现。来自豌豆根瘤菌三叶草生物型(Rhizobium leguminosarumbv.trifolii)的推定的NHase(RlNHase)在可溶部分和不溶部分内均未发现。仅AbNHase、CtNHase、RmNHase和VvNHase实现过表达。来自青枯雷尔氏菌(Ralstonia solanacearum)的推定的NHase(RsNHase)和来自Tardiphaga robiniae的推定的NHase(TrNHase)显示α亚基的表达高于β亚基。铁型PkNHase表达良好,而AcNHase在可溶部分和不溶部分内均未发现。PmNHase显示β亚基量更高的不平衡表达。(数据未显示)

3.1.3甲基丙烯脂水解中的活性

所有NHase进行针对甲基丙烯腈(MAN)活性的光度测试(见2.4.1)。第一种尝试中,所有CFE在单个测量中以1:10和1:100稀释度使用,从而发现各NHase的可应用稀释度。对于第二种测定,各NHase-CFE选择1或两种稀释度并且一式三份应用以计算活性。

21种NHase中,14种酶显示对甲基丙烯腈的适当的水解活性(图2)。CtNHase、KoNHase、NaNHase、PtNHase、PkNHase、PmNHase和ReNHase在此试验中显示高活性。发现新型腈水合酶AbNHase、AmNHase、CjNHase、MlNHase、RmNHase、VvNHase和GhNHase对甲基丙烯腈有活性。

AcNHase和RlNHase失活不令人惊讶,因为SDS-PAGE中对于这些酶没有可见的NHase带。同样,两种文献已知的NHase在我们的手中没有活性:BjNHase和BrNHase。此外,所有3种推定的酶即PcNHase、RsNHase和TrNHase能表达,但对MAN水解没有活性。

3.1.4rac-1的水合作用

为α-乙基-1-吡咯烷乙腈rac-1(2.4.2)的水解筛选所有NHase-CFE制品,独立于其对甲基丙烯腈的活性。与10mM底物的反应在25℃运行过夜并通过HPLC分析(见2.4.3)。7种腈水合酶能够转化靶底物(表4),有时对(S)-产物有高对映选择性。所有表达的铁型NHase都显示转化靶底物的能力,但仅一些钴型NHase显示。根据文献,铁型NHase更能转化脂肪腈,而钴型NHase优选芳香腈[S.Prasad,T.C.Bhalla,Nitrile hydratases(NHases):Atthe interface of academia and industry,Biotechnol.Adv.28(2010)725–741.doi:10.1016/J.BIOTECHADV.2010.05.020]。

表4为α-乙基-1-吡咯烷乙腈的水解筛选NHase-CFE

实施例3.2.

如所提及,在21种测试NHase中,仅7种酶能够形成酰胺2:CtNHase、KoNHase、NaNHase、GhNHase、PkNHase、PmNHase和ReNHase。

更详细研究这7种腈水合酶。鉴别温度和pH范围并进行稳定性研究。此外,研究金属的影响并进行抑制研究。所有这些实验后,对靶反应的限制分类并选择就靶反应而言最合适的酶。

3.2.1温度研究

rac-1的转化在37℃和50℃的过夜反应(见章节2.4.2)中平行进行,NHase-CFE在这些温度孵育以用于SDS-PAGE分析(方法2.3.4)。过夜孵育后,离心样品以移除变性蛋白并分析。

2的生成看来独立于反应温度(见表5),尽管不是所有酶都是热稳定性。结果表明当感热的NHase依然是功能性的并且反应出于一些原因在某些点终止时,大部分底物立即转化。

表5:1通过有希望的NHase在更高温度下的转化。

a

10mM rac-1在500μL反应中于pH 7.2和37或50℃和300rpm过夜转化.

3.2.2pH研究

用7种有希望的NHase进行pH研究。因此,分光光度测定(见2.4.1)在不同pH值下进行,其中跟踪224nm处的甲基丙烯酰胺的生成。NHase-CFE稀释于相同缓冲液,随着底物溶解。选择下列缓冲液:100mM柠檬酸磷酸盐,pH 5和6、100mM磷酸钠,pH 7和8、100mM Tris-HCl,pH 8.5以及100mM碳酸盐,pH 9、9.5和10。

最优pH显然为约pH 7。在pH 6和8,所有NHase仍显示可接受的活性。在pH 5,所有测试NHase都有显著活性丧失。较高pH下,特别是Fe型NHase失去活性,而Co型NHase仍显示中等活性水平。CtNHase和KoNHase是最稳定的。其在pH 10仍有活性,但活性显著低于pH 7(数据未显示)。

CtNHase和KoNHase在高pH都依然有活性,还在高pH较长时间孵育后测定(2.4.1)以测试其稳定性。样品用反应缓冲液(pH 9或9.5)1:10稀释并在25℃孵育。某些时间点后,样品进一步稀释用于测试,其在与孵育相同的pH下进行。CtNHase在25℃,在多至pH 9.5下稳定,而KoNHase在pH 9.5下随着时间失去活性(数据未显示)。

3.2.3升高的温度和pH

在甲基丙烯腈水解的光度测定中于更高pH下研究有希望NHase的热稳定性(2.4.1)。NHase-CFE在pH 8于37℃或50℃孵育1和6小时。孵育后,样品在pH 8和25℃测定甲基丙烯腈水解。

CtNHase和KoNHase看来在37℃稳定。NaNHase在孵育1小时后还显示剩余活性,但在6小时后没有活性。Fe型NHase,Gh、Pk、Pm和Re在1小时后完全失去其活性。根据文献,Co型NHase更稳定,如此实验中所确认[S.Prasad,T.C.Bhalla,Nitrile hydratases(NHases):At the interface of academia and industry,Biotechnol.Adv.28(2010)725–741.doi:10.1016/J.BIOTECHADV.2010.05.020.]。50℃下的孵育导致所有7种NHase活性丧失。仅CtNHase在1小时孵育后显示至少一些剩余活性(数据未显示)。

我们总结CtNHase是7种测试NHase中最稳定的NHase,然后是KoNHase。由于对映选择性高,最有希望的Fe型NHase是GhNHase。

3.2.4更高浓度的rac-1的转化

用7种有希望的NHase处理50mM和100mM的rac-1以评估其处理更高底物浓度的能力(见2.4.2)。底物浓度越高,转化率降低(表6)。从总量看,50mM反应生成的酰胺多于10mM反应生成的。100mM反应的转化约为50mM反应的一半,意味着总体上达到大致相同的酰胺浓度。

表6:1通过NHase-CFE的不同浓度的转化。

对50mM以及100mM的底物在25℃和pH 7.2下进行过夜反应。产物通过HPLC分析。

3.2.5时间研究

进行时间研究(见2.4.2)以在靶反应减慢或若反应极其慢时研究。因此,过夜反应在不同时间点分析:孵育0min、1、2、4、6和21h后。Ct、Ko和GhNHase用于在25℃以及pH 7.2以900μL规模转化20mM底物。

大部分产物在第一个半个小时中合成。之后,产物浓度仅略增加(对于GhNHase)或根本不增加。此时,通过GhNHase实现20%转化。产物的对映体过量在孵育时间中不改变并且对这些NHase而言和往常一样高:对于(S)-2,CtNHase有88%,KoNHase有81%以及GhNHase有79%。(数据未显示)

3.2.6金属的影响

出于不同原因,用金属预孵育或共孵育研究对甲基丙烯腈或rac-1水合作用的活性。

钴预孵育

用其金属辅因子的预孵育能增强酶活性,尤其如果酶未完全加载或金属仅松弛结合于活性位点时。因此,用CoCl

钴-预孵育不提高测试的NHase的活性。这得出结论,测试的NHase已具有高且稳定的金属含量,其无法通过预孵育进一步增加。

Fe和Mn的影响

随着靶腈在水溶液中解离,氰化物释放并且随之抑制腈水合酶。避免这种影响的一个想法是向反应溶液添加金属,其应与所释放的氰化物形成络合物。为这个原因,在Fe(III)、Mn(II)和Fe(II)存在下监测甲基丙烯腈水合作用(2.4.1)中的NHase活性(数据未显示)。

FeCl

多至2mM,FeCl

MnCl

3.2.7共溶剂的影响

共溶剂能改变生物转化的对映选择性[Y.Mine,K.Fukunaga,K.Itoh,M.Yoshimoto,K.Nakao,Y.Sugimura,Enhanced enzyme activity andenantioselectivity of lipases in organic solvents by crown ethers andcyclodextrins,J.Biosci.Bioeng.95(2003)441–447.doi:10.1016/S1389-1723(03)80042-7;K.Watanabe,S.Ueji,Dimethyl sulfoxide as aco-solvent dramaticallyenhances the enantioselectivity in lipase-catalysed resolutions of2-phenoxypropionic acyl derivatives,J.Chem.Soc.Perkin Trans.1.(2001)1386–1390.doi:10.1039/b100182p]。Ct、Ko和GhNHase测试甲醇、DMSO和乙酸乙酯。在5%共溶剂的存在下,用NHase在25℃和pH 7.2处理50mM rac-1(见2.4.2)。

相较无共溶剂的反应,生成的酰胺更少。然而,对映体过量不改变。测试的共溶剂不提高测试的浓度中的对映选择性(数据未显示)。

3.2.8催化剂量的影响

用双倍量的酶进行靶反应(2.4.2),此方法有望达到更高的转化率。如果应用更多的酶,则产生更多产物。(S)-2的对映选择性独立于催化剂量:CtNHase 86%,KoNHase 78%并且GhNHase 76%(数据未显示)。

3.2.9酰胺2的大规模生成

对于(S)对映体富集的2的合成,生物催化反应放大到20mL。20mM rac-1通过GhNHase在3小时中转化,因为此NHase在先前实验中显示最高转化水平。反应在25℃和pH7.2下进行。分批反应后,还进行底物进料反应以有望达到更高产物量。此反应起始于4mM底物,底物每30分钟增加4mM,直至结束时消耗20mM底物。转化后,各批次冷冻于-20℃并冻干。合成也用CtNHase完成。因此,2次20mL反应用50mM rac-1和20%(v/v)的CFE于5℃及pH 7.2过夜进行。

HPLC分析揭示在分批反应中获得2.7mM酰胺(13.4%转化,78%ee),而底物进料反应中仅获得1.6mM(7.9%转化,76%ee)。总之,合成约13mg 2,主要是(S)对映体。

在接下来一式两份进行的有更多底物的反应中(2.4.2),CtNHase分别达到31.3和34%的转化水平。(S)-2的ees是82%。

3.2.10底物稳定性

先前酰胺合成实验的结果提示,底物可能在反应条件下不稳定。在文献中,α-氨基氰被描述为在水溶液中不稳定[Z.-J.Lin,R.-C.Zheng,Y.-J.Wang,Y.-G.Zheng,Y.-C.Shen,Enzymatic production of 2-amino-2,3-dimethylbutyramide by cyanide-resistant nitrile hydratase,J.Ind.Microbiol.Bio-technol.39(2012)133–141.doi:10.1007/s10295-011-1008-6]。如此,α-氨基氰会解离成吡咯烷、丙醛和氰化物。α-氨基氰的解离能用Feigl-Anger纸测试[F.Feigl,V.Anger,Replacement of benzidine bycopper ethylacetoacetate and tetra base as spot-test reagent for hydrogencyanide and cyanogen,Analyst.91(1966)282.doi:10.1039/an9669100282],这是灵敏性滤纸,其检测少量蒸发成气相的氰化物(见2.4.4)。

在低pH下,腈立即分解并且在30秒后,能检测到氰化物(图3)。同样在更高pH值下,于3分钟内检测到氰化物。然而,底物在乙醇中相当稳定。

此实验证实以下假设:底物在反应条件下不稳定,因为其在水溶液中分解。然而,其在有机溶剂中稳定得多。自身分解是设想的动态动力学拆分的要求,以允许从未反应的(R)-1中重构rac-1。

在不同pH值下进一步研究rac-1的稳定性。样品在2和60分钟后立即提取。然后,其通过HPLC(方案2.4.4)分析。提取效率取决于pH,因为腈能质子化。因此,反应仅与其零值作比较。色谱图显示底物在缓冲液中迅速解离且无法恢复。pH越低,解离的rac-1越多。在低pH下,底物浓度的降低远大于较高pH(表7)。此外,在pH 9和10下,在2分钟与1小时孵育之间几乎没有什么区别,指示快速形成平衡。

表7:在不同pH下多个时间框孵育的rac-1的HPLC分析。

3.2.11抑制研究

进行抑制研究以鉴定靶反应的限制。工业底物α-乙基-1-吡咯烷乙腈在水溶液中不稳定并且解离成吡咯烷、丙醛和氰化物。腈的解离和形成是依赖于pH的平衡反应(表7)。添加3种组分之一能使平衡移向腈并因而阻遏氰化物抑制。如果丙醛或吡咯烷不损害酶,其能过量添加至反应。

氰化物的影响

从文献中已知氰化物可抑制NHase[Z.-J.Lin,R.-C.Zheng,Y.-J.Wang,Y.-G.Zheng,Y.-C.Shen,Enzymatic production of 2-amino-2,3-dimethylbutyramide bycyanide-resistant nitrile hydratase,J.Ind.Microbiol.Bio-technol.39(2012)133–141.doi:10.1007/s10295-011-1008-6]。KCN对CtNHase和GhNHase活性的影响用光度测定(2.4.1)研究,其中在224nm跟踪甲基丙烯酰胺的形成。氰化物使GhNHase活性减少约55%,但抑制效果看来独立于氰化物浓度(图4)。CtNHase显示活性随着氰化物浓度增加而降低。在50mM氰化物下,CtNHase显示仅6%的其初始活性。然而,即使在50mM氰化物下,有28U/mgNHase的CtNHase的活性高于有23U/mg NHase的GhNHase。

低转化水平的另一可能原因会是产物抑制。因此,用rac-2孵育NHase-CFE,然后其在光度测定中分析甲基丙烯腈(2.4.1)。CtNHase和GhNHase都不受多至5mM浓度的2的抑制(数据未显示)。此试验不允许使用较高浓度的rac-2。尽管产物抑制不可能在多至50mM的浓度下,如其他实验中通过HPLC测定产物浓度所判断,更高产物浓度的抑制效果可在增加量的酰胺2的存在下,仅通过基于HPLC的试验测定。

丙醛的影响

在丙醛存在下确定对甲基丙烯腈水合作用的活性(2.4.1)。丙醛降低GhNHase活性,而非CtNHase活性(图5)。在50mM丙醛存在下,GhNHase活性降低约50%,CtNHase仍显示超过80%活性。

3.2.12低转化温度的影响

rac-1在5℃的转化(见2.4.2)就CtNHase-CFE而非GhNHase而言产生更多的2(图6)。就CtNHase而言,对映体过量对两种温度几乎相同(对(S)分别为81和82%),而GhNHase在25℃显示更高对映选择性(对(S)分别为65与61%ee)。

时间研究揭示25℃的反应非常快速(数据未显示)。产物仅在前5-10分钟内合成。在5℃下,即使30分钟后,酰胺通过CtNHase形成,而GhNHase在20分钟后终止。GhNHase在25℃实现更高产物量,但CtNHase在5℃生成更多酰胺(表8)。

表8:CtNHase和GhNHase在5℃及25℃的(S)-酰胺的转化率和对映体过量。

3.2,.3低酶进料的影响

在酶进料反应中测试CtNHase和GhNHase的2的合成(2.4.2)。如果补充额外CFE,则获得更多产物(表9)并且进料反应的ee更高。结果表明酶在反应期间丧失其功能性。

表9:酶进料实验中(S)-酰胺的转化率和对映体过量。

类似实验用4种NHase和两种缓冲液在5°完成。这些反应中的最佳NHase是GhNHase,其在酶进料反应中达到超过60%转化(图7)。酶进料导致更高的产物量,指示酶稳定性或酶失活有问题。然而,66%转化用68%(S)的对映体过量实现。

3.2.14raC-l通过CtNHase和GhNHase在不同pH下的转化

pH成为生物催化(S)-2合成的关键因素。首先,腈1和酰胺2都是碱性化合物并且若缓冲能力不足则可能在添加后提高pH。第二,腈水合酶显示从pH 7到8的最高活性,第三,底物1是α-氨基腈,与其三个构造块吡咯烷、丙醛和氰化物形成平衡。pH越高,α-氨基腈越稳定。因此,rac-1的数个水合反应在不同pH值下进行(方法2.4.2)以发现最适合反应的pH。

必须牢记Tris-HCl缓冲液的pH强烈依赖于温度。在5℃下的pH比在25℃下高0.5个单位。在5℃的磷酸钠缓冲液,pH 7.5中实现最高转化(图8)。在25℃,pH 7显然更佳。Tris-HCl缓冲液还显示明显趋势:pH越低,转化率越高。对映体过量在pH 7也是最佳。低温的转化更高可由以下解释:底物解离在更高温度下更快,向混合物引入更多抑制的氰化物。

还用GhNHase进行与上面相同的实验。在先前的实验中,最佳结果在最低pH达到并且因此,此实验中也测试pH 6.5。用GhNHase-CFE的反应仅在25℃进行。

GhNHase-CFE也在pH 7下显示最高转化(图9)。与CtNHase相反,其对映选择性随着pH增加而提高,有显著差异(57.5–74.2%(S))。对此的可能解释是GhNHase确实快速转化底物并否定化学解离(一定程度上),从而更多的(R)-腈在pH 7下相比在更高pH值下转化,在更高pH值下其反应速度更慢。

3.2.15低催化剂量的影响

更多GhNHase-CFE应用于rac-1水合反应(2.4.2),获得更多产物(图10)。然而,相关性并非线性,因为底物在更高CFE浓度受限。有趣的是,对映体过量依赖于催化剂量。应用的催化剂越多,合成的(S)-2越多,但ee值更差。NHase催化的水合作用显然快于rac-1的化学解离和重新形成。

CtNHase-CFE量与产物浓度之间的相关性几乎是线性的(图11)。此时,对映体过量对全部测试的催化剂浓度而言完全一样。CtNHase显示对靶底物的活性低于GhNHase,因而,化学解离和重新形成rac-1不会限制。可能在延长反应中合成更多产物。

在2%(v/v)GhNHase-CFE的时间研究中,大部分底物在45分钟内转化(图12)。似乎转化在2小时内完成。77%的对映体过量对GhNHase-CFE而言相当高。

3.2.16用GhNHase细胞的底物进料反应

此实验内,研究GhNHase在反应条件下的稳定性(方法2.4.2)。分批反应作为对照进行。进料反应中,rac-1的浓度于2小时后翻倍。孵育在25℃和500rpm进行4小时。

一般,GhNHase细胞在2小时后仍有活性,尽管第二底物部分转化的底物更少。当进料底物至反应时,对映选择性更高(表10)。

表10:用冻干GhNHase细胞的底物进料实验的评估。

3.2.17rac-1通过全细胞的首次转化

用NHase-CFE的反应未完全令人满意,因为转化在一些点终止,尽管pH仍低到足以使酶不变性。反应停止的另一可能原因是通过氰化物的酶的失活。氰化物通过与其金属离子形成络合物抑制腈水合酶[S.van Pelt,M.Zhang,L.G.Otten,J.Holt,D.Y.Sorokin,F.van Rantwijk,G.W.Black,J.J.Perry,R.A.Sheldon,Probing the enantioselectivityof a diverse group of purified cobalt-centred nitrile hydratases,Org.Biomol.Chem.9(2011)3011.doi:10.1039/c0ob01067g;T.Gerasimova,A.Novikov,S.Osswald,A.Yanenko,Screening,Characterization and Applica-tion of Cyanide-resistant Nitrile Hydratases,Eng.Life Sci.4(2004)543-546.doi:10.1002/elsc.200402160]。使用全细胞可通过用细胞膜保护酶免于受释放的氰化物影响解决此问题。用rac-1的反应在不同pH值和催化剂量下进行(方法2.4.2)。

对GhNHase(表11)观察到下列趋势:所用催化剂越多,合成的产物越多,尽管此相关性并非线性。pH越高,产物越少。此相关性是真实的,特别是对于催化剂少的反应。然而,pH越高,对(S)-2的对映体过量越高。同样,使用的催化剂越少,ee值越高。

表11:用GhNHase的全细胞转化。

50mM rac-1的转化在不同pH和不同催化剂量于25℃及500rpm下进行2小时。

使用少量催化剂,仅实现低转化水平。也许反应时间对低催化剂量而言过短。同样,底物解离可能是低转化的原因。释放的HCN能使酶失活,醛可能蒸发并且变得不可用或还与蛋白反应。

用CtNHase进行相同实验。一般,CtNHase对rac-1的活性低于GhNHase,但显示更高对映选择性(表12)。最高的转化在pH 7下实现。使用的催化剂越少,对映体过量越高,尽管这些值应仔细处理,因为对于小产物浓度几乎没有检测到(R)-2。

催化剂与产物量的相关性是线性的。此发现假设,底物浓度未限制反应速率。

表12:用CtNHase的全细胞转化。

50mM rac-1的转化在不同pH和不同催化剂量于25℃及500rpm下进行2小时。

3.2.18用全细胞的时间研究

对全细胞催化进行rac-1水合作用的时间研究(见2.4.2)。独立于催化剂量,几乎全部产物在1小时内合成。反应条件以某种方式终止酰胺合成。通过HCN使酶失活/被抑制或者底物变得不可用,这归因于醛蒸发或副反应(数据未显示)。

3.2.19连续底物进料

进行底物进料研究以发现NHase细胞多久是活性的(见2.4.2)。在第一设置中,对高底物浓度(共200mM)仅使用少量催化剂(1.7mg/mL湿细胞重)。在第二设置中,高催化剂量(8.5mg/mL细胞)应用于50mM底物。两种设置都用全细胞以及CFE测试。

使用少量生物催化剂,大部分产物在第一进料步骤前第一个小时内合成。GhNHase在第一个小时内生成33mM产物(理论上50mM),而CtNHase仅合成7mM产物。一小时后,几乎没有生成产物。可能通过底物使酶失活或更特定地,底物的解离以及释放的HCN。在GhNHase的情况中,仍有17mM底物在一小时后未转化,在CtNHase的情况中,甚至为43mM。GhNHase总共生成42mM产物(21%转化)并且CtNHase仅生成10mM 2(5%转化)。此实验中在GhNHase全细胞与GhNHase-CFE之间几乎没有差异,而CtNHase细胞表现优于CtNHase-CFE(表13)。

表13:有1.7mg/mL细胞的底物进料研究的酰胺浓度和对映体过量的(S)-2。

有更多催化剂和更少底物的实验获得更高的转化。GhNHase总共达到34%转化并且CtNHase 43%。尽管GhNHase在前3小时内生成更多酰胺,终CtNHase显示更高的转化。然而,仍需要发现完全转化的反应条件。

此实验中,全细胞表现优于CFE。差异可见,特别是在反应后期(表14)。

表14:通过8.5mg/mL细胞的底物进料研究的酰胺浓度和对映体过量的(S)-2。

3.2.20CtNHase和GhNHase的热纯化

CtNHase描述为热稳定酶[K.L.Petrillo,S.Wu,E.C.Hann,F.B.Cooling,A.Ben-Bassat,J.E.Gavagan,R.DiCosimo,M.S.Payne,Over-expression in Escherichia coliof a thermally stable and regio-selective nitrile hydratase from Comamonastestosteroni 5-MGAM-4D,Appl.Microbiol.Biotechnol.67(2005)664–670.doi:10.1007/s00253-004-1842-9]并在先前实验中显示37℃6小时后没有活性丧失(见3.2.3)。由此,研究CtNHase和GhNHase的热纯化(方法2.3.5)。

CtNHase相当热稳定并且能在60℃很好纯化。热纯化CtNHase的特定活性与CFE中的CtNHase大致相同(数据未显示)。热纯化不作用于GhNHase,GhNHase在高于50℃的温度几乎完全变性,这由对应SDS PA凝胶电泳中2个亚基的2条蛋白带消失来反映(数据未显示)。

3.2.21高rac-l浓度的转化

CtNHase和GhNHase应用于rac-1水合反应,有多至200mM底物(2.4.2中的操作)。GhNHase能相当好地处理多至100mM底物,但150mM底物几乎没有转化(图13)。有趣的是,在更高的底物浓度,更多产物在更高pH产生。更多底物在更低pH解离,这可能解释此效果。同样,有150和200mM底物的反应在pH 7的对映体过量最低,这表明酶不再合适作用,但还可能是峰积分的效果(一些情况下峰接近检测限)。

对于GhNHase的较低与较高底物浓度之间的广泛差异,对于CtNHase未观察到(图14)。转化水平降低,但产物量本身的差异不那么大。再次,对于较高底物浓度,pH 7不是最佳选择。有50mM底物的反应显示最高对映体过量,这意味着较高的底物浓度通过影响pH和同步影响氰化物浓度损害酶。而且,在高底物浓度,CtNHase生成的所需酰胺高于GhNHase,这支持MAN试验中的观察,其中Co依赖性NHase在更高pH值下表现优于Fe-NHase。对比GhNHase与CtNHase,平均ees对于CtNHase也更高,而转化则用GhNHase更高。

3.2.22添加吡咯烷和丙醛

rac-1通过CtNHase的水合作用用额外的吡咯烷和/或丙醛测试(见2.4.2)。在150mM丙醛存在下达到最高的产物量(图15)。添加丙醛可能具有数种效果。首先,底物解离与形成之间的平衡移向腈侧。其次,丙醛可能在反应期间蒸发,从而腈底物变得不可用。额外丙醛能规避此问题。第三,丙醛可能还与细胞的蛋白和酶反应并且因此NHase可能也会失活。对于甲基丙烯腈的转化的这个影响已经被研究并且未显示其对CtNHase活性的影响大。最后,丙醛影响反应的pH(表15)。然而,添加丙醛增加了CtNHase的转化水平。有75mM丙醛的反应引起的产物多于没有丙醛时。

吡咯烷迄今未改善CtNHase的转化率,但其对pH的影响没有得到补偿,然而,这不可忽略(表15)。另一方面,低转化水平能通过pH提高来解释,但另一方面,反应4与6的比较显示更高的产物量在相同pH是可能的。此外,有吡咯烷的对映体过量反应相当低,表明对酶的条件非最优。再次,pH不是由反应4和6显示的唯一原因。添加丙醛看来显著增加产物量。

表15:2通过CtNHase在吡咯烷和丙醛存在下的合成的评估。

用8.5mg/mL细胞的反应一式三份进行并在25℃和700rpm孵育1小时。

3.2.23比较CtNHase与GhNHase

通过比较和评估上述CtNHase与GhNHase的酶特征及性能的不同结果,CtNHase选定为待工程化改造的靶蛋白。然而,考虑到GhNHase实现例如显著更高的产物浓度,GhNHase可选择为进一步有希望的靶标以用于本发明上下文内的蛋白工程化改造,其可在更详细描述的基于CtNHase的工程化改造实验中以类似方式进行。

实施例3.3

半理性工程化改造的方法应用于发现生成大量对映纯(S)-2的CtNHase突变体。

有希望的候选物应用于生物转化并且反应产物通过HPLC分析,显示改善的突变体,对(S)-2的对映选择性显著更高。来自此方法的最佳突变体CtNHase-βF51L达到50mM 1的73%转化,对于(S)-2有93%的对映体过量。

3.3.1重要氨基酸残基的鉴定

使用结构生物学方法,鉴定了对活性和对映选择性有潜在高影响的氨基酸残基。非常接近底物结合位点的氨基酸对于底物定位至关重要,因此对映选择性也至关重要。为进行对接研究,建立CtNHase的结构模型。

由于腈水合酶是异二聚体,建模调整适应(tailored)异二聚体模板。CtNHase的数个接近的同源物可用,其能用作模板。同源建模是用YASARA同源建模实验(见2.4.5)完成的。

在建模过程中,用不同模板和比对(alignment)建立了8个同源模型,其中2个基于有pdb编号3QYH和3QZ5的模板产生良好的总体模型质量,都有恶臭假单胞菌腈水合酶的晶体结构。

工作用基于pdb 3QYH的同源模型继续。在这个比对中,428个靶残基中的411个(96.0%)与模板残基对准。这些对准的残基中,序列相同性是95.4%,并且序列相似性是96.1%。

采用模型,随后用(S)-和(R)-2进行对接研究。在所述研究期间鉴定潜在的关键氨基酸残基。它们被总结于表16。在(R)产物的对接模式中,看起来似乎在旋转时α链中Trp120的氮(即W120)与(R)产物有些相互作用。这可以是突变的候选物(如对苯丙氨酸)以干扰(R)对接模型的结合。对接产物附近的所有其他残基预期会影响两种对接模式(R和S)。无论如何,除了钴结合所需的那些,对接模式附近的残基也可以更半理性的方法改变。

表16:2对接模式

由于钴离子是结合口袋的一部分,金属结合位点的残基也很接近底物结合位点。这些残基显然对钴结合重要并且进一步是酶活性的结果并且不必须改变。此外,β亚基的R52预期参与质子转移并且不是蛋白工程化改造的靶标。

3.3.2 10个NNK库的筛选

鉴定对接产物

对(S)-2增加的生成使用液体筛选系统筛选各库的约200个克隆(见章节2.5.2)。一种特定酰胺酶名为红串红球菌的酰胺酶(ReAmidase)(UniProtKB/Swiss-Prot:P22984.2)SEQ ID NO:135,将其应用于对2严格(S)-选择性的筛选试验。通过此特定酶选择,意外鉴定仅生成大量(S)-2而非(R)-2并在试验中产生强烈信号的突变体。

大部分通过眼睛鉴别所产生红色含量高于野生型酶的克隆。改变照片亮度、对比度和饱和度有助于改善色差并鉴定生成更多所需产物的克隆。

共筛选10个不同位点饱和库的1936个CtNHase克隆。选择120个假定改善的克隆并用相同试验一式三份再筛选。

采用HPLC分析,鉴定改善的CtNHase突变体。因此,120个筛选挑出的克隆也应用于生物转化(2.4.2)并通过HPLC(2.4.3)分析。

一些突变体在转化水平和对映选择性上表现优于野生型。例如,选择βF51X库中的8个并将其送去测序。所有选定的克隆具有氨基酸交换(表17)。亮氨酸突变体出现7次并且缬氨酸突变体出现2次。还发现一个异亮氨酸突变体。这三个氨基酸都是脂肪族、疏水性氨基酸残基,此事实证实了所述假设。还对于位置βM34发现了增强的突变体(表18)。

表17:βF51X库的改善的突变体和其测序结果。

显示野生型反应以更好比较。50mM rac-1通过8.5mg/mL细胞(表达于深孔板中)在25℃和500rpm于pH 7下被转化2小时。

表18:rac-1通过改善的CtNHase突变体的转化性能和其测序结果。

50mM rac-1通过8.5mg/mL细胞(表达于深孔板中)在25℃和700rpm于pH 7下被转化2小时。

位点饱和库的5种改善的突变体表达于摇瓶中(2.3.1)并用于靶腈的生物转化(2.4.2)。所有5种突变体除了βM34Q显示对映选择性高于野生型,并且所有都获得更高的转化(见图16和表19)。另外,图16显示理性设计突变体W120F,其不幸地没有活性。由于1解离的产物之一丙醛是高挥发性,我们推断它的补充可将平衡推向rac-1再形成。如图16各对柱中右侧柱所证明,转化增加。在突变体βF51V的情况中,在>90%ee的65%转化清楚显示发生了动态动力学拆分。

表19:靶反应中对单个CtNHase突变体的转化和对映选择性。

在有或没有额外150mM丙醛下,150mM的腈rac-1被水合。

3.3.3有益突变的组合

下一步是有益氨基酸交换的组合。

βF51的3种可能取代与βM34的两种突变组合,产生CtNHase的6个双突变体。它们在摇瓶中表达并在生物转化反应中对酰胺2的形成进行测试。所有双突变体显示转化低于最佳单个突变体F51L。双突变体βM34L/βF51L具有略高的对映选择性(表20)。

表20:靶反应中对CtNHase双突变体的转化率和对映选择性。

在有或没有额外150mM丙醛下,150mM的腈rac-1被水合。

3.3.4基于突变体的NNK库

为此,仅发现βM34的两种优良取代。此位置的其他残基还可以是有益的,尤其是它们与氨基酸交换βF51L组合时。因此,βM34的另一位点饱和库基于CtNHase-βF51L构建,这是在那时的最佳单个突变体。

挑出176个CtNHase-βM34X/βF51L克隆并用液体筛选试验对NHase活性进行筛选。所有110个活性克隆应用于靶腈的生物转化并通过HPLC-UV分析。测序最佳克隆(表21)。紧挨着βM34L和βM34Q,发现3个进一步的氨基酸交换:βM34I/βF51L、βM34T/βF51L和βM34V/βF51L。

表21:有希望的CtNHase-βM34X/βF51L克隆和它们在靶反应中的性能。

50mM rac-1通过8.5mg/mL细胞(表达于深孔板中)在25℃和700rpm于pH 7下被转化2小时。

用5个βM34X/βF51L突变体进行rac-1的生物转化,在摇瓶中表达。双突变体βM34V/βF51L显示最高转化。这个突变体还有第二佳的对映体过量,对于(S)-对映体为92.9%(表22)。仅M34I/F51L达到93.1%的较高ee,但其29.7%的转化低于亲本。如来自3次平行生物转化反应的标准偏差所证明,对映体过量高度可重复,同时转化显示更多变化。

表22:CtNHase-M34X/F51L双突变体的转化和对映体过量。

150mM rac-1通过8.5mg/mL细胞在25℃和700rpm于pH 7被水合2小时.

3.3.5βL48X库的再筛选

再次用优化试验(2.5.2)筛选库βL48。

挑出潜在命中并应用于生物转化反应。在HPLC和测序分析后,CtNHase-βL48P也显示对(S)-1的高选择性(表23)。

表23:CtNHase-βL48突变体的转化和对映体过量。

100mM rac-1通过8.5mg/mL细胞在25℃,700rpm和pH 7下被转化2小时。

实施例3.4

对于(S)-2通过CtNHase的合成的转化水平和对映选择性在随机方法中也被提高。NHase的催化活性依赖于金属离子并且金属结合位点不必须在筛选中靶定。我们对于更高对映选择性的酶尤其感兴趣,我们聚焦于结合口袋的区域。

3.4.1α1、α2、β1和β2区域的筛选

定义沿活性位点排列的CtNHase中的4个延伸并就各延伸构建随机库。特定地,所述区域分别是α亚基中的氨基酸70-110(α1)和120-175(α2)以及β亚基中的30-71(β1)和124-170(β2)。β1库是基于野生型CtNHase,而其他3个库在β1突变体βF51L(其位于β1延伸)上产生。在菌落水平上筛选每个库至少11,000个克隆。

在菌落水平上筛选5个不同库的约50,000个克隆(方案2.5.1)。通过眼睛鉴定了大致最佳的10%并用液体试验对腈水合酶活性再筛选(方案2.5.2)。再次,挑出约10%的这些克隆并将其应用于生物转化反应(方案24.2),其通过HPLC(2.4.3)分析。

在库CtNHase-β1中发现具有更高的转化以及也发现增加的对映选择性的最佳改善的克隆。其他三个库的克隆都基于CtNHase-βF51L,显示微增。

位置βL48对于对映选择性有最强影响。突变体βL48R对于(S)-产物达到96.1%ee。有趣的是,此位置已在位点饱和库内研究,其中没有发现改善的命中并且通过筛选随机库仅发现一个单个突变体。这能通过以下事实解释:‘仅’对映选择性被改善,但活性被保持在野生型水平。由此,信号改善不显著并且可以将其忽略。特别是在这种情况中,仅使用(S)-选择性酰胺酶可允许我们发现这个命中。

库CtNHase-β1揭示许多增强的突变体。最突出的是βF51位置处的氨基酸交换(表24),其在位点饱和诱变中已经被靶向。发现与NNK库相同的取代:Ile、Leu和Val。通过βF51L实现最高对映选择性。βG54的突变也出现多次,对于突变为Cys、Asp或Val。这三个取代的对比困难,因为没有发现单个突变体。然而,位置βG54也对活性和对映选择性有强烈影响。

延伸β2显示许多氨基酸交换并且其中一些出现多次(表25)。然而,突变体仅显示微小改善。仅有49.6%转化和94.5%ee的突变体CtNHase-βF51L/βH146L/βF167Y被称作在这个区域内的命中。显然,尽管经常发现βF51和βG54中的氨基酸交换,但其从未组合出现。仅一个氨基酸交换在区域α1中出现多次。CtNHase-αV110I-βF51L具有与其亲本CtNHase-βF51L相同的对映选择性,但达到更高的转化(表26)。一个位置在α2区域中突出:αP121。这个位置处的残基Ser、Thr和Val引起显著更高的1的转化,然而,ee降低(表27)。发现CtNHase-αP121T-βF51L是最佳的,因为它显示对映选择性丧失最少。

/>

/>

/>

3.4.2β1区域的集中库(focusedIibrary)

组合β1区域的有益氨基酸交换。由于其彼此接近,它们都能在一个寡核苷酸内呈现。在设计这个库时,对于位置βL48,仅已知Arg突变体。因此,在这个位置处允许庞大的氨基酸,如色氨酸。所需密码子是YKS以实现Leu(野生型氨基酸)、Arg或Trp(表28)。YKS密码子也能是半胱氨酸或苯丙氨酸。

表28:集中的CtNHase-β1库的密码子和它们可能的氨基酸。

改善的突变体βF51L、βF51I和βF51V也纳入集中库。不允许野生型密码子,仅Ile、Leu和Val。位置βG54还对酶活性有强影响。迄今,在这个位置上发现Cys、Asp和Val。然而,其大多与其他氨基酸交换组合并且对于这个残基未进行详细研究。因此,对于这个位置测试多种氨基酸。三联密码子NNK会产生所有典型氨基酸,但使变化性增加32。因此,反而使用密码子NDT,产生所有化学基团的示例。

通过重叠延伸PCR用简并寡核苷酸构建库(第2.2.7章)并且在基于菌落的试验中筛选(2.5.1)。潜在命中用液体试验再筛选(2.5.2),应用其有希望的突变体于生物催化反应(2.4.2)。

(S)-2的最高对映选择性通过βL48中有氨基酸交换的突变体实现,例如#76、56、90等。不幸地是,这些突变体显示低转化水平,至多17%(#57)。

鉴定最有效的突变体为βF51I/βG54R、βF51V/βG54I、βF51V/βG54R和βF51V/βG54V。它们都多次出现并且实现比CtNHase-βF51L更高的转化。此外,突变体βF51I/βG54R、βF51V/βG54I和βF51V/βG54R显示比单突变体βF51L更高的对映体过量。

表29:CtNHase-β1集中库的潜在命中的转化水平和对映选择性。

/>

取决于它们的测序结果对克隆进行分组。100mM 1通过8.5mg/mL细胞在pH 7于25℃和700rpm下被转化2小时。

3.4.3αP121的位点饱和

在CtNHase-βF51L-α2筛选中数次发现αP121的氨基酸交换。对Thr、Ser或Val的取代显著提高了转化水平,而对映体过量略有降低(表27)。这个位置对活性有强影响并且还影响对映选择性。在易错PCR中,不太可能对一个位置产生全部20个氨基酸残基并纳入库内。问题是其他氨基酸交换是否会产生更有活性和选择性的突变体。

紧挨着亲本和Thr、Ser及Val突变体,所有其他CtNHase-αP121X-βF51L通过QuikChange PCR(方法2.2.4)产生。获得所有除了Gly的剩余突变体,因为PCR反应在这个情况中不起作用。

在深孔板中表达CtNHase-αP121X-βF51L突变体(改善的方案2.3.2)并将其应用于100mM rac-1的生物转化(2.4.2)。最佳突变体仍是Thr突变体(表30)。大部分新构建突变体显示大量对映选择性的丧失。新突变体中最佳的是有89.2%ee和50.6%转化的Ile,然而,Thr突变体依然更好。

表30:CtNHase-αP121X-βF51L突变体的转化水平和对映选择性。

100mM 1通过8.5mg/mL细胞在pH 7于25℃和700rpm下被转化2小时。

3.4.4CtNHase的关键残基-总结

筛选约50,000个随机突变的CtNHase克隆,其基于野生型或单突变体βF51L,其中靶向4种延伸。7个氨基酸位置被鉴定为活性和/或对映选择性的关键残基。α亚基上的关键残基αV110和αP121可提高转化。然而,αP121交换导致对映选择性略有下降。对于延伸β2,发现导致活性和对映选择性增加的组合:βH146L/βF167Y。影响力最大的区域是β2。对于βF51和βG54,βL48、βF51和β54中的氨基酸交换产生高许多的ees以及高许多的转化水平。

实施例3.5

筛选超过50,000个CtNHase克隆和鉴定rac-1的转化的关键残基后,组合有益的氨基酸交换。如此,设计31个新CtNHase突变体(表31),其中28个能在项目时间表(projecttimeframe)内构建(克隆方案参见第2.2章)。

表31:CtNHase组合突变体和它们的氨基酸交换。

对随机诱变中靶向的各延伸显示单独列以提高可读性。

将28个终组合突变体表达于摇瓶中(2.3.1)并对rac-1水合作用进行筛选(参见章节2.4.2)。紧接着新突变体,分析一些对照突变体。对于在βL48位置处含氨基酸交换的突变体,获得最高的ee值(表32)。对照βL48R和βL48P显示(S)对映体的ee分别为98.3%或98.6%,其中如果组合βG54中的氨基酸交换(突变体V24-27),则达到99.0%以上。一般,βL48/βG54双突变体显示在可接受的转化水平的高ees(V22-30)。组合突变体中的最高转化通过V5实现,有42%的转化和98.1%的ee。所有其他突变体未显示这种对转化的强影响,对于所述其他突变体,βL48取代与αV110I或αP121T组合(V2-7)。

氨基酸交换βH146L/βF167Y与βF51L以外的组合导致大量活性的丧失(V8-14和V20)。此外,通过组合其与αV110I或αP121T(V15和V16)提高CtNHase-βF51V/βG54I活性的尝试失败。在所有靶向的延伸中有氨基酸交换的克隆(V1、V20和V31)也令人失望。显然,活性降低不是表达水平减少的结果,如通过NUPAGE所分析。实际上,我们分析的所有突变未降低可溶表达的水平(数据未显示)。

rac-1的生物催化反应用最佳组合突变体和各对照重复。此时,添加丙醛并一式三份评估(方法2.4.2)。测定的转化水平高于无补充的丙醛的反应(表32)。通过CtNHase-αP121T/βL48R(V5)在97.59%的高对映体过量下达到66.9%的转化。组合βG54C、βG54R或βG54V(V25-27)的突变体CtNHase-βL48P实现极高的ee值≥99.8%。

表32:rac-1通过CtNHase组合突变体的水合作用的转化率和ee值。

/>

100mM rac-1通过8.5mg/mL细胞在25℃和pH 7下被转化2小时。

表33:CtNHase组合突变体的转化和ee值。

实施例3.6

在制备级,将rac-1水合成(S)-2,使用CfNHase的P121T/L48R双突变体,采用全细胞生物催化剂形式。

将冷冻细胞团解冻并且将约500mg悬于50mL磷酸盐缓冲液(100mM,pH 7.1)。反应在Mettler Toledo T50 pH stat,22℃完成,使用1M磷酸滴定。通过添加200μL rac-1,100μL丙醛和100μL吡咯烷(各作为纯物质添加)起始反应。反应进程以pH增加来表示并且能基于酸消耗进行监测。每10-15分钟,酸的添加停止并添加100μL丙醛与200μLrac-1的脉冲。

添加丙醛和吡咯烷以将rac-1分解平衡趋向rac-1,从而结合游离氰化物并因而尽可能减少NHase的抑制。

为分析反应进程,重复取出250μL样品并如2.4.2(材料&方法)所述处理,然后如2.4.3(材料&方法)所述分析。图19显示典型实验的结果。

共1.3g rac-1在50mL反应体积中在80分钟内水合成(S)-2,有73.3%转化和95.2%ee。

B.化学部分

1,设备和装置

在硼掺杂金刚石(BDD)阳极进行电化学反应。BDD电极以

NMR谱在Bruker Avance III HD 300(300MHz)上记录,所述装置配有5mm BBFO探头,用z梯度和ATM,在25℃下。化学位移(δ)以百万分之(ppm)报告,这是相对于作为氘代溶剂的CDCl

用来自Shimadzu的DUGA-20A

用来自Shimadzu的GC 2010装置进行气相色谱,所述装置配有Varian毛细管柱ZB-5MSi(序列号334634),用H

用包被有二氧化硅的市售可得铝板进行薄层色谱。

在来自Metrohm AG,Herisau,Switzerland的AUTO LAB PGstat 204上进行循环伏安法。安排实验计划的设计并用来自Minitab Inc.的软件Minitab19分析。

2,化学品

/>

本文所用全部化学品除了内部合成的那些(如本文所述)具有分析级并且获自商业供应商。

每天制备含RuCl

3.方法

3.1气相色谱:

条件:150℃---5min---25℃/min---300℃---5min;T

柱:HP-5;5%甲基苯基硅氧烷;30m,0.2mm内径(ID),0.33μm

MeOH方法中的5mg/mL:进样体积=1.5μL,入口温度=200℃,初始柱温度=50℃(保持时间=1min),升温速率(ramping rate)=15℃/min(梯度时间=11.5min),终温度=220℃(维持时间(hold-up time)=12min)。系统对前体和左乙拉西坦进行校准,使用咖啡因作为内标(图17)。

3.2液相色谱-二极管阵列(LC-PDA)

使用3μL的进样体积对缓冲的和稀释的样品溶液(C=5.341mM)进行LC-PDA分析。进行分离等度。通过PDA检测器在1.58min、1.47min以及1.92min检测I

3,3手性HPLC

条件:庚烷:EtOH(90:10),25℃,λ=215nm,流出:1.0mL/min

柱:Chiralpak ADH 250x4.6mm,5u

1mg/mL庚烷:EtOH

用Waters 2695分离模块与UV检测器(Waters 996二极管阵列检测器)进行手性HPLC,用来自Daicel Chiral Technologies的CHIRALPAK IB-3柱(250x 4.6mm,粒径3μm,流速:1.0mL/min)和保护柱(10x 4.0mm)。系统用等度程序操作。进样体积是V=10μL,洗脱液由10%异丙醇与90%己烷/乙醇构成。检测由二极管阵列检测器在λ=210.1nm跟踪。

3.4TLC

使用来自Merck的包被有二氧化硅(60F

-茚三酮试剂:含0.3g茚三酮的2.0mL冰醋酸和100mL甲醇

-Dragendorff-Munier试剂:20.0g碘化钾,3.0g硝酸铋(III),40.0g(+)-酒石酸和240mL水

-KMnO

-Seebach试剂:10.0g硫酸铈(IV),25.0g磷钼酸,940mL水和60mL浓硫酸

-香草醛(vanillin)试剂:1.0g香草醛,100mL甲醇,12.0mL冰醋酸和4.0mL浓硫酸

-二硝基苯肼试剂:1.0g 2,4-二硝基苯肼,25mL无水乙醇,8.0mL水和5.0mL浓硫酸。

-对甲氧基苯甲醛试剂:4.1mL对甲氧基苯甲醛,5.6mL浓硫酸,1.7mL冰醋酸和150mL乙醇

-溴甲酚绿试剂:50mg溴甲酚绿,250mL异丙醇和0.15mL 2M氢氧化钠溶液。

4.实施例

参考实施例1:

根据Orejarena Pacheco等人(J.C.Orejarena Pacheco,T.Opatz,The Journalof Organic Chemistry 2014,79,5182-5192)的改良的方法进行制备。

将丙醛(17.97g,22.5mL,309.3mmol,1.1当量)溶于水甲醇混合物(2000mL,4:1,~7mL/mmol)并且添加一份NaHSO

Bp:95℃(23mbar).

IR(ATR):ν=2970(s),2939(m),2879(m).2810(m),2222(w),1461(m),1355(w),1151(m),1085(m),872(m)cm

1

13

ESI-MS:m/z(%)=139.1(100)[C

在后续实验章节中描述了研究不同氧化催化剂系统是否适合吡咯烷底物(S)-2-(吡咯烷-1-基)丁烷酰胺(2)在保持立体构型情况下的区域选择性化学氧化(方案2)。分析氧化的内酰胺产物(S)-和(R)-2-(2-氧代吡咯烷-1-基)丁烷酰胺(4)以及可选中间缩醛胺(6)氧化产物的形成。

方案2:(S)-2-(吡咯烷-1-基)丁烷酰胺(2)到(S)-2-(2-氧代吡咯烷-1-基)丁烷酰胺(4)的区域选择性化学氧化。

合成实施例1:

氧化钌组分原位获自RuCl

向含RuCl

这个时间后,添加2-丙醇(2mL)并且将混合物再搅拌30分钟。过滤沉淀于界面的固体并且将其弃去。水层用EtOAc萃取,将其干燥(MgSO

HPLC/MS:33%终产物(4)

GC:58%终产物(4),无起始材料(2)

手性HPLC(粗):ee 79%(4)的(S)-对映体

合成实施例2:

氧化钌组分原位获自RuCl

向含RuCl

此时间后,添加2-丙醇(2mL)并且将混合物再搅拌30分钟。过滤沉淀于界面的固体并且将其弃去。水层用EtOAc萃取,将其干燥(MgSO

HPLC/MS:46%终产物(4).

GC:75%终产物(4),无起始材料(2)。

手性HPLC(粗):ee 92%(4)的(S)-对映体。

水层用异丁醇(x3)萃取,将其干燥并浓缩获得额外22mg产物。

合成实施例3:

氧化钌组分原位获自RuCl

向含RuCl

此时间后,添加2-丙醇(2mL)并且将混合物再搅拌30分钟。过滤沉淀于界面的固体并且将其弃去。然后,将混合物浓缩至干燥。

GC:6%起始材料(2),7%中间产物(6),68%终产物(4)

手性HPLC(粗):ee 95%(4)的(S)-对映体

表34:

1)

2)

3)

合成实施例4:

氧化钌组分在改良方法中原位获自RuO

2-(吡咯烷-1-基)丁烷酰胺(2,78.1mg,0.5mmol,1.0当量)在超声处理下(5分钟)溶于乙酸乙酯(2.5mL),添加RuO

将2-(2-氧代吡咯烷-1-基)丁烷酰胺(4)分离,有76%收率(53.4mg,0.382mmol),为无色油,其形成晶体。

IR(ATR):ν=3274(mB),2969(m),2938(m),2878(m),1682(vs),1462(m),1422(m),1288(m)cm

1

13

ESI-MS:m/z(%)=193.1(100)[C

合成实施例5:

合成实施例4的实验用底物2-(吡咯烷)丁烷酰胺(2)重复,(2)主要由(S)-对映体组成((S)对映体89.34%;(R)对映体10.66%)。粗产物的手性HPLC(λ=210nm;CHIRALPAKIB-3柱(250x 4.6mm,粒径3μm,4.6x 250mm;己烷:乙醇(0.1%EDA)=90:10)显示手性完全保留,而没有外消旋化。

合成实施例6:

将0.5-1mol%RuO

TLC(SiO

合成实施例7:

对于催化剂固定,RuO

合成实施例8:

通过向反应混合物添加甲醇,从钌催化中回收碘酸钠。沉淀的细晶针滤出并在减压下干燥。碘酸盐以>95%收率分离。

在配备有Nafion膜的分离的烧杯池(beaker cell)中,2个室都填充有6mL NaOH水溶液(1.0M)。向阳极室添加NaIO

为分离仲高碘酸盐,添加氢氧化钠并且沉淀物经真空过滤而滤出。固体残留物用水洗涤并且随后在干燥器中用五氧化二磷真空干燥。转化/纯度通过LC-PDA和IR分析控制。偏高碘酸盐的分离根据Mehltretter等人和Willard等人的方法进行(H.H.Willard,R.R.Ralston,Trans.Electrochem.Soc.1932,62,239;C.L.Mehltretter,C.S.Wise,US2989371A,1961)完成。仲高碘酸盐通过硫酸或硝酸中和并且如所提及结晶或再结晶。

合成实施例9:

根据合成实施例6的方法,将RuO

合成实施例10:

将仲高碘酸钠(4.00g,13.6mmol),HNO

合成实施例11:

将来自左乙拉西坦合成中钌催化步骤的回收的碘酸钠(2.08g,10.5mmol)和氢氧化钠(2.00g,50.0mmol)溶于水(50mL)并且根据RP 3电解。应用电流密度j=50mA cm-

合成实施例12:3种前体通过Strecker反应的一锅法酶动态动力学拆分

将KCN(3.65mg/mL)溶于Tris-HCl缓冲液(300mM,pH 7.5)并且与吡咯烷(3.22mg/mL)和丙醛(分别为4.2μL/mL或12.4μL/mL)混合。用KH

表35:3个前体通过Strecker反应的一锅法酶动态动力学拆分。条件:pH 7.3,25℃,10%CFE,30分钟反应时间

1

2

可以看出,丙醛过量对于产物形成有显著影响。

表36:SEQ ID NO的分配

/>

/>

/>

/>

AA=氨基酸序列

NA=核酸序列

特别引用本文所提及文档的公开内容。

序列表

<110> 细胞制药有限公司

<120> 光学活性氨基酰胺化合物的对映选择性化学酶合成

<130> M/60205-PCT

<160> 145

<170> PatentIn version 3.5

<210> 1

<211> 657

<212> DNA

<213> Comamonas testosteroni

<220>

<221> misc_feature

<223> CtNHase beta-subunit_AAU87543.1

<220>

<221> CDS

<222> (1)..(657)

<400> 1

atg aat ggc att cac gat act ggg gga gca cat ggt tat ggg ccg gtt 48

Met Asn Gly Ile His Asp Thr Gly Gly Ala His Gly Tyr Gly Pro Val

1 5 1015

tac aga gaa ccg aac gaa ccc gtc ttt cgc tac gac tgg gaa aaa acg 96

Tyr Arg Glu Pro Asn Glu Pro Val Phe Arg Tyr Asp Trp Glu Lys Thr

202530

gtc atg tcc ctg ttc ccg gcg ctg ttc gcc aac ggc aac ttc aac ctc 144

Val Met Ser Leu Phe Pro Ala Leu Phe Ala Asn Gly Asn Phe Asn Leu

354045

gat gag ttt cga cac ggc atc gag cgc atg aac ccc atc gac tac ctg 192

Asp Glu Phe Arg His Gly Ile Glu Arg Met Asn Pro Ile Asp Tyr Leu

505560

aag gga acc tac tac gaa cac tgg atc cat tcc atc gaa acc ttg ctg 240

Lys Gly Thr Tyr Tyr Glu His Trp Ile His Ser Ile Glu Thr Leu Leu

65707580

gtc gaa aag ggt gtg ctc acg gca acg gaa ctc gcg acc ggc aag gca 288

Val Glu Lys Gly Val Leu Thr Ala Thr Glu Leu Ala Thr Gly Lys Ala

859095

tct ggc aag aca gcg aca ccg gtg ctg acg ccg gcc atc gtg gac gga 336

Ser Gly Lys Thr Ala Thr Pro Val Leu Thr Pro Ala Ile Val Asp Gly

100 105 110

ctg ctc agc acc ggg gct tct gcc gcc cgg gag gag ggt gcg cgg gcg 384

Leu Leu Ser Thr Gly Ala Ser Ala Ala Arg Glu Glu Gly Ala Arg Ala

115 120 125

cgg ttc gct gtg ggg gac aag gtt cgc gtc ctc aac aag aac ccg gtg 432

Arg Phe Ala Val Gly Asp Lys Val Arg Val Leu Asn Lys Asn Pro Val

130 135 140

ggc cat acc cgc atg ccg cgc tac acg cgg ggc aaa gtg ggg aca gtg 480

Gly His Thr Arg Met Pro Arg Tyr Thr Arg Gly Lys Val Gly Thr Val

145 150 155 160

gtc atc gac cat ggt gtg ttc gtg acg ccg gac acc gcg gca cac gga 528

Val Ile Asp His Gly Val Phe Val Thr Pro Asp Thr Ala Ala His Gly

165 170 175

aag ggc gag cac ccc cag cac gtt tac acc gtg agt ttc acg tcg gtc 576

Lys Gly Glu His Pro Gln His Val Tyr Thr Val Ser Phe Thr Ser Val

180 185 190

gaa ctg tgg ggg caa gac gcc tcc tcg ccg aag gac acg att cgc gtc 624

Glu Leu Trp Gly Gln Asp Ala Ser Ser Pro Lys Asp Thr Ile Arg Val

195 200 205

gac ttg tgg gat gac tac ctg gag cca gcg tga 657

Asp Leu Trp Asp Asp Tyr Leu Glu Pro Ala

210 215

<210> 2

<211> 218

<212> PRT

<213> Comamonas testosteroni

<400> 2

Met Asn Gly Ile His Asp Thr Gly Gly Ala His Gly Tyr Gly Pro Val

1 5 1015

Tyr Arg Glu Pro Asn Glu Pro Val Phe Arg Tyr Asp Trp Glu Lys Thr

202530

Val Met Ser Leu Phe Pro Ala Leu Phe Ala Asn Gly Asn Phe Asn Leu

354045

Asp Glu Phe Arg His Gly Ile Glu Arg Met Asn Pro Ile Asp Tyr Leu

505560

Lys Gly Thr Tyr Tyr Glu His Trp Ile His Ser Ile Glu Thr Leu Leu

65707580

Val Glu Lys Gly Val Leu Thr Ala Thr Glu Leu Ala Thr Gly Lys Ala

859095

Ser Gly Lys Thr Ala Thr Pro Val Leu Thr Pro Ala Ile Val Asp Gly

100 105 110

Leu Leu Ser Thr Gly Ala Ser Ala Ala Arg Glu Glu Gly Ala Arg Ala

115 120 125

Arg Phe Ala Val Gly Asp Lys Val Arg Val Leu Asn Lys Asn Pro Val

130 135 140

Gly His Thr Arg Met Pro Arg Tyr Thr Arg Gly Lys Val Gly Thr Val

145 150 155 160

Val Ile Asp His Gly Val Phe Val Thr Pro Asp Thr Ala Ala His Gly

165 170 175

Lys Gly Glu His Pro Gln His Val Tyr Thr Val Ser Phe Thr Ser Val

180 185 190

Glu Leu Trp Gly Gln Asp Ala Ser Ser Pro Lys Asp Thr Ile Arg Val

195 200 205

Asp Leu Trp Asp Asp Tyr Leu Glu Pro Ala

210 215

<210> 3

<211> 654

<212> DNA

<213> Klebsiella oxytoca

<220>

<221> misc_feature

<223> KoNHase beta-subunit_OSY94201.1WP

<220>

<221> CDS

<222> (1)..(654)

<400> 3

atg aac ggg ata cat gat ctg ggg ggg atg cac ggc ctt ggc ccg atc 48

Met Asn Gly Ile His Asp Leu Gly Gly Met His Gly Leu Gly Pro Ile

1 5 1015

cct acc gag gaa aac gag ccc tat ttc cat cat gag tgg gaa cgc cgg 96

Pro Thr Glu Glu Asn Glu Pro Tyr Phe His His Glu Trp Glu Arg Arg

202530

gta ttt cct ctg ttc gcc tcg ttg ttc gtc ggc gga cat ttt aac gtc 144

Val Phe Pro Leu Phe Ala Ser Leu Phe Val Gly Gly His Phe Asn Val

354045

gat gaa ttt cgc cac gcc atc gaa cgt atg gcg ccg acc gaa tat ttg 192

Asp Glu Phe Arg His Ala Ile Glu Arg Met Ala Pro Thr Glu Tyr Leu

505560

cag tcg agc tac tac gag cac tgg ctg cat gca ttc gaa acg ctg ctg 240

Gln Ser Ser Tyr Tyr Glu His Trp Leu His Ala Phe Glu Thr Leu Leu

65707580

ctg gca aag ggg gcg atc acc gtt gaa gaa ctg tgg ggt ggc gcg aag 288

Leu Ala Lys Gly Ala Ile Thr Val Glu Glu Leu Trp Gly Gly Ala Lys

859095

cct gcc cct tgc aag cct ggc aca cct gtg ctg acg cag gag atg gtg 336

Pro Ala Pro Cys Lys Pro Gly Thr Pro Val Leu Thr Gln Glu Met Val

100 105 110

tcg atg gtg gtc agc acc ggc ggg tct gct cgg gtc agt cac gat gtt 384

Ser Met Val Val Ser Thr Gly Gly Ser Ala Arg Val Ser His Asp Val

115 120 125

gcg ccc cgc ttc cgg gtg ggc gat tgg gta cga acg aaa aat ttc aac 432

Ala Pro Arg Phe Arg Val Gly Asp Trp Val Arg Thr Lys Asn Phe Asn

130 135 140

ccg acc acc cat acc cgc ctg cca cgc tac gca cgc gat aaa gtc ggt 480

Pro Thr Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Asp Lys Val Gly

145 150 155 160

cgc ata gag atc gct cac ggt gtg ttt atc acg cca gat act gcg gcg 528

Arg Ile Glu Ile Ala His Gly Val Phe Ile Thr Pro Asp Thr Ala Ala

165 170 175

cac ggg ctg ggc gaa cat ccc cag cat gtt tac agc gtc agt ttc acc 576

His Gly Leu Gly Glu His Pro Gln His Val Tyr Ser Val Ser Phe Thr

180 185 190

gcg cag gcg ctg tgg gga gag ccg cgc cct gac aaa gtg ttc atc gat 624

Ala Gln Ala Leu Trp Gly Glu Pro Arg Pro Asp Lys Val Phe Ile Asp

195 200 205

ctg tgg gac gac tat ctg gag gaa gca taa 654

Leu Trp Asp Asp Tyr Leu Glu Glu Ala

210 215

<210> 4

<211> 217

<212> PRT

<213> Klebsiella oxytoca

<400> 4

Met Asn Gly Ile His Asp Leu Gly Gly Met His Gly Leu Gly Pro Ile

1 5 1015

Pro Thr Glu Glu Asn Glu Pro Tyr Phe His His Glu Trp Glu Arg Arg

202530

Val Phe Pro Leu Phe Ala Ser Leu Phe Val Gly Gly His Phe Asn Val

354045

Asp Glu Phe Arg His Ala Ile Glu Arg Met Ala Pro Thr Glu Tyr Leu

505560

Gln Ser Ser Tyr Tyr Glu His Trp Leu His Ala Phe Glu Thr Leu Leu

65707580

Leu Ala Lys Gly Ala Ile Thr Val Glu Glu Leu Trp Gly Gly Ala Lys

859095

Pro Ala Pro Cys Lys Pro Gly Thr Pro Val Leu Thr Gln Glu Met Val

100 105 110

Ser Met Val Val Ser Thr Gly Gly Ser Ala Arg Val Ser His Asp Val

115 120 125

Ala Pro Arg Phe Arg Val Gly Asp Trp Val Arg Thr Lys Asn Phe Asn

130 135 140

Pro Thr Thr His Thr Arg Leu Pro Arg Tyr Ala Arg Asp Lys Val Gly

145 150 155 160

Arg Ile Glu Ile Ala His Gly Val Phe Ile Thr Pro Asp Thr Ala Ala

165 170 175

His Gly Leu Gly Glu His Pro Gln His Val Tyr Ser Val Ser Phe Thr

180 185 190

Ala Gln Ala Leu Trp Gly Glu Pro Arg Pro Asp Lys Val Phe Ile Asp

195 200 205

Leu Trp Asp Asp Tyr Leu Glu Glu Ala

210 215

<210> 5

<211> 684

<212> DNA

<213> Nitriliruptor alkaliphilus

<220>

<221> misc_feature

<223> NaNHase beta-subunit_WP_052668588.1

<220>

<221> CDS

<222> (1)..(684)

<400> 5

atg aac ggc gtc cat gat ctt ggc ggc acc gac ggc ctc ggc ccg gtg 48

Met Asn Gly Val His Asp Leu Gly Gly Thr Asp Gly Leu Gly Pro Val

1 5 1015

atc acc gag gag aac gag ccg gtc tgg cac agc gag tgg gag aag gcc 96

Ile Thr Glu Glu Asn Glu Pro Val Trp His Ser Glu Trp Glu Lys Ala

202530

gtc ttc acg atg ttc ccc acc aac ttc gcc aag gga cat ttc aac gtc 144

Val Phe Thr Met Phe Pro Thr Asn Phe Ala Lys Gly His Phe Asn Val

354045

gac tcg ttc cgc ttc ggg atc gag aag atc cat ccg gcg gac tac ctg 192

Asp Ser Phe Arg Phe Gly Ile Glu Lys Ile His Pro Ala Asp Tyr Leu

505560

tcg tcc cgg tac tac gag cac tgg ctg cac tcc atc gag cat gcg gtg 240

Ser Ser Arg Tyr Tyr Glu His Trp Leu His Ser Ile Glu His Ala Val

65707580

gtg gat cag ggc gtc gtc gac gcc gag gag ctg gag gcg cgc act cgt 288

Val Asp Gln Gly Val Val Asp Ala Glu Glu Leu Glu Ala Arg Thr Arg

859095

cac tac ctc gag aac ccc gac gcg ccg ttg ccg gac cgc cag gac cct 336

His Tyr Leu Glu Asn Pro Asp Ala Pro Leu Pro Asp Arg Gln Asp Pro

100 105 110

gat ctg gtg cca ctg gtg gag acg atc tcg cgg ggt ggt ggc tcc gca 384

Asp Leu Val Pro Leu Val Glu Thr Ile Ser Arg Gly Gly Gly Ser Ala

115 120 125

cgt cgc gag agc gac aag gcg ccg agg ttc gag gtc ggt gac cga gtc 432

Arg Arg Glu Ser Asp Lys Ala Pro Arg Phe Glu Val Gly Asp Arg Val

130 135 140

cgc gtc aag cgc gac gag gtg ccc cac ggc cac acg cgc cgc gcc cgc 480

Arg Val Lys Arg Asp Glu Val Pro His Gly His Thr Arg Arg Ala Arg

145 150 155 160

tac gtg cag ggg cgc gaa ggc gtg atc gtc cag gcc cac ggg gcg ttc 528

Tyr Val Gln Gly Arg Glu Gly Val Ile Val Gln Ala His Gly Ala Phe

165 170 175

atc tac ccg gac agc gca ggc aac ggc ggg ccg gag gac ccc gag cac 576

Ile Tyr Pro Asp Ser Ala Gly Asn Gly Gly Pro Glu Asp Pro Glu His

180 185 190

gtc tac acg atc ctg ttc gag gcc tcg cac ctg tgg ggc gaa cgg acg 624

Val Tyr Thr Ile Leu Phe Glu Ala Ser His Leu Trp Gly Glu Arg Thr

195 200 205

ggt gac tcc aac gga acc gtg acc ttc gac gcg tgg gag ccc tac ctc 672

Gly Asp Ser Asn Gly Thr Val Thr Phe Asp Ala Trp Glu Pro Tyr Leu

210 215 220

gag ctg gtc tga 684

Glu Leu Val

225

<210> 6

<211> 227

<212> PRT

<213> Nitriliruptor alkaliphilus

<400> 6

Met Asn Gly Val His Asp Leu Gly Gly Thr Asp Gly Leu Gly Pro Val

1 5 1015

Ile Thr Glu Glu Asn Glu Pro Val Trp His Ser Glu Trp Glu Lys Ala

202530

Val Phe Thr Met Phe Pro Thr Asn Phe Ala Lys Gly His Phe Asn Val

354045

Asp Ser Phe Arg Phe Gly Ile Glu Lys Ile His Pro Ala Asp Tyr Leu

505560

Ser Ser Arg Tyr Tyr Glu His Trp Leu His Ser Ile Glu His Ala Val

65707580

Val Asp Gln Gly Val Val Asp Ala Glu Glu Leu Glu Ala Arg Thr Arg

859095

His Tyr Leu Glu Asn Pro Asp Ala Pro Leu Pro Asp Arg Gln Asp Pro

100 105 110

Asp Leu Val Pro Leu Val Glu Thr Ile Ser Arg Gly Gly Gly Ser Ala

115 120 125

Arg Arg Glu Ser Asp Lys Ala Pro Arg Phe Glu Val Gly Asp Arg Val

130 135 140

Arg Val Lys Arg Asp Glu Val Pro His Gly His Thr Arg Arg Ala Arg

145 150 155 160

Tyr Val Gln Gly Arg Glu Gly Val Ile Val Gln Ala His Gly Ala Phe

165 170 175

Ile Tyr Pro Asp Ser Ala Gly Asn Gly Gly Pro Glu Asp Pro Glu His

180 185 190

Val Tyr Thr Ile Leu Phe Glu Ala Ser His Leu Trp Gly Glu Arg Thr

195 200 205

Gly Asp Ser Asn Gly Thr Val Thr Phe Asp Ala Trp Glu Pro Tyr Leu

210 215 220

Glu Leu Val

225

<210> 7

<211> 654

<212> DNA

<213> Gordonia hydrophobica

<220>

<221> misc_feature

<223> GhNHase beta-subunit_WP_066163466.1

<220>

<221> CDS

<222> (1)..(654)

<400> 7

atg cac gga att cac gat ctc ggc ggc gtc cag aac ttc ggg ccg gtt 48

Met His Gly Ile His Asp Leu Gly Gly Val Gln Asn Phe Gly Pro Val

1 5 1015

ccg cat cgg gtc aat gag tac ccc gac ggt ccg ttc cag acg gcc gag 96

Pro His Arg Val Asn Glu Tyr Pro Asp Gly Pro Phe Gln Thr Ala Glu

202530

tac cac gag gac tgg gag cct ctg gcc tac ggt ctg ctg ttc gcc tgc 144

Tyr His Glu Asp Trp Glu Pro Leu Ala Tyr Gly Leu Leu Phe Ala Cys

354045

gcc gac gcc gat cag ttc agc gtc gat cag cta cgg cac tcg atc gag 192

Ala Asp Ala Asp Gln Phe Ser Val Asp Gln Leu Arg His Ser Ile Glu

505560

cgt atg gag ccg cgc gac tac atg acg agc agc tac ttc gaa cgc att 240

Arg Met Glu Pro Arg Asp Tyr Met Thr Ser Ser Tyr Phe Glu Arg Ile

65707580

ctg gtc ggc acc gcc act ctg atg gtg gag aac ggc atg ctc acc cag 288

Leu Val Gly Thr Ala Thr Leu Met Val Glu Asn Gly Met Leu Thr Gln

859095

gaa gag ctc gaa gac ttg gcc ggc gga ccg ttt ccg ctc tcg aga cca 336

Glu Glu Leu Glu Asp Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro

100 105 110

gtt agc tcg gcc ggg cgg ccg gcg aat ccg aat ctg cag cag ttc gag 384

Val Ser Ser Ala Gly Arg Pro Ala Asn Pro Asn Leu Gln Gln Phe Glu

115 120 125

gtc ggc gac cgg gta cgg gtg gcg acc gaa cag gta ccc ggc cac att 432

Val Gly Asp Arg Val Arg Val Ala Thr Glu Gln Val Pro Gly His Ile

130 135 140

cgg gtg ccc gga tac tgc ttc ggc aag gag ggc gtg atc gac cac cgc 480

Arg Val Pro Gly Tyr Cys Phe Gly Lys Glu Gly Val Ile Asp His Arg

145 150 155 160

acc gca cac gag tgg cgg ttc ccc gac gcg atc gga cac ggc cgc gac 528

Thr Ala His Glu Trp Arg Phe Pro Asp Ala Ile Gly His Gly Arg Asp

165 170 175

gac ggt ggt tcc gaa ccc acc tac cac gtc cga ttc gat gcc acc gac 576

Asp Gly Gly Ser Glu Pro Thr Tyr His Val Arg Phe Asp Ala Thr Asp

180 185 190

gtc ttc ggc acc gac acc gag gcc gag tcc atc gtc gtc gac ctc ttc 624

Val Phe Gly Thr Asp Thr Glu Ala Glu Ser Ile Val Val Asp Leu Phe

195 200 205

ggc ggc tac ctg gag ccg gtg ccg gcc tga 654

Gly Gly Tyr Leu Glu Pro Val Pro Ala

210 215

<210> 8

<211> 217

<212> PRT

<213> Gordonia hydrophobica

<400> 8

Met His Gly Ile His Asp Leu Gly Gly Val Gln Asn Phe Gly Pro Val

1 5 1015

Pro His Arg Val Asn Glu Tyr Pro Asp Gly Pro Phe Gln Thr Ala Glu

202530

Tyr His Glu Asp Trp Glu Pro Leu Ala Tyr Gly Leu Leu Phe Ala Cys

354045

Ala Asp Ala Asp Gln Phe Ser Val Asp Gln Leu Arg His Ser Ile Glu

505560

Arg Met Glu Pro Arg Asp Tyr Met Thr Ser Ser Tyr Phe Glu Arg Ile

65707580

Leu Val Gly Thr Ala Thr Leu Met Val Glu Asn Gly Met Leu Thr Gln

859095

Glu Glu Leu Glu Asp Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro

100 105 110

Val Ser Ser Ala Gly Arg Pro Ala Asn Pro Asn Leu Gln Gln Phe Glu

115 120 125

Val Gly Asp Arg Val Arg Val Ala Thr Glu Gln Val Pro Gly His Ile

130 135 140

Arg Val Pro Gly Tyr Cys Phe Gly Lys Glu Gly Val Ile Asp His Arg

145 150 155 160

Thr Ala His Glu Trp Arg Phe Pro Asp Ala Ile Gly His Gly Arg Asp

165 170 175

Asp Gly Gly Ser Glu Pro Thr Tyr His Val Arg Phe Asp Ala Thr Asp

180 185 190

Val Phe Gly Thr Asp Thr Glu Ala Glu Ser Ile Val Val Asp Leu Phe

195 200 205

Gly Gly Tyr Leu Glu Pro Val Pro Ala

210 215

<210> 9

<211> 663

<212> DNA

<213> Pseudomonas marginalis

<220>

<221> misc_feature

<223> PmNHase beta-subunit_WP_074846644.1

<220>

<221> CDS

<222> (1)..(663)

<400> 9

atg gat ggc ttt cac gat ctc ggc ggt ttc caa ggc ttt gga aaa gtc 48

Met Asp Gly Phe His Asp Leu Gly Gly Phe Gln Gly Phe Gly Lys Val

1 5 1015

cct cac acc atc aac agc ctg agc tac aaa cag gtg ttc aag cag gac 96

Pro His Thr Ile Asn Ser Leu Ser Tyr Lys Gln Val Phe Lys Gln Asp

202530

tgg gag cat ctg gcc tac agc ttg atg ttc atc ggt gcc gac cac ttg 144

Trp Glu His Leu Ala Tyr Ser Leu Met Phe Ile Gly Ala Asp His Leu

354045

aaa aag ttc agc gtg gac gaa gtg cgt cac gcc gtc gaa cgc ctg gat 192

Lys Lys Phe Ser Val Asp Glu Val Arg His Ala Val Glu Arg Leu Asp

505560

gtg cgc cag cat gtc ggc acc cag tac tac gaa cgc tac gtc atc gcg 240

Val Arg Gln His Val Gly Thr Gln Tyr Tyr Glu Arg Tyr Val Ile Ala

65707580

acc gcc acc ctg ctg gtc gaa acc ggc gtg atc acc cag gcg gag ctt 288

Thr Ala Thr Leu Leu Val Glu Thr Gly Val Ile Thr Gln Ala Glu Leu

859095

gat cag gcc ttg ggc tcc cac ttc aag ctg gcg aat ccc gcc cat gcc 336

Asp Gln Ala Leu Gly Ser His Phe Lys Leu Ala Asn Pro Ala His Ala

100 105 110

gag ggc cgc ccg gcg atc acg ggg cgg ccg ccc ttc gag gtg ggg gat 384

Glu Gly Arg Pro Ala Ile Thr Gly Arg Pro Pro Phe Glu Val Gly Asp

115 120 125

cgg gtg gtg gtg cga gac gaa tat gtg gct ggg cac atc cgc atg ccc 432

Arg Val Val Val Arg Asp Glu Tyr Val Ala Gly His Ile Arg Met Pro

130 135 140

gcc tac gtg cgc ggc aag gaa ggc gtg gtc ctg cac cgc acg tca gag 480

Ala Tyr Val Arg Gly Lys Glu Gly Val Val Leu His Arg Thr Ser Glu

145 150 155 160

aaa tgg ccg ttc ccc gac gcg att ggg cat ggc gat gta agc gcc gcc 528

Lys Trp Pro Phe Pro Asp Ala Ile Gly His Gly Asp Val Ser Ala Ala

165 170 175

cat caa ccc acc tac cac gtc gag ttt tcc gtg aaa gac ctg tgg ggg 576

His Gln Pro Thr Tyr His Val Glu Phe Ser Val Lys Asp Leu Trp Gly

180 185 190

gat gcg gcc gat gag ggt ttt gtg gtg gtc gac ctg ttc gaa agc tac 624

Asp Ala Ala Asp Glu Gly Phe Val Val Val Asp Leu Phe Glu Ser Tyr

195 200 205

ctg gac aag gcc gcc ggc gcg cac gcg gtg aac cca tga 663

Leu Asp Lys Ala Ala Gly Ala His Ala Val Asn Pro

210 215 220

<210> 10

<211> 220

<212> PRT

<213> Pseudomonas marginalis

<400> 10

Met Asp Gly Phe His Asp Leu Gly Gly Phe Gln Gly Phe Gly Lys Val

1 5 1015

Pro His Thr Ile Asn Ser Leu Ser Tyr Lys Gln Val Phe Lys Gln Asp

202530

Trp Glu His Leu Ala Tyr Ser Leu Met Phe Ile Gly Ala Asp His Leu

354045

Lys Lys Phe Ser Val Asp Glu Val Arg His Ala Val Glu Arg Leu Asp

505560

Val Arg Gln His Val Gly Thr Gln Tyr Tyr Glu Arg Tyr Val Ile Ala

65707580

Thr Ala Thr Leu Leu Val Glu Thr Gly Val Ile Thr Gln Ala Glu Leu

859095

Asp Gln Ala Leu Gly Ser His Phe Lys Leu Ala Asn Pro Ala His Ala

100 105 110

Glu Gly Arg Pro Ala Ile Thr Gly Arg Pro Pro Phe Glu Val Gly Asp

115 120 125

Arg Val Val Val Arg Asp Glu Tyr Val Ala Gly His Ile Arg Met Pro

130 135 140

Ala Tyr Val Arg Gly Lys Glu Gly Val Val Leu His Arg Thr Ser Glu

145 150 155 160

Lys Trp Pro Phe Pro Asp Ala Ile Gly His Gly Asp Val Ser Ala Ala

165 170 175

His Gln Pro Thr Tyr His Val Glu Phe Ser Val Lys Asp Leu Trp Gly

180 185 190

Asp Ala Ala Asp Glu Gly Phe Val Val Val Asp Leu Phe Glu Ser Tyr

195 200 205

Leu Asp Lys Ala Ala Gly Ala His Ala Val Asn Pro

210 215 220

<210> 11

<211> 639

<212> DNA

<213> Rhodococcus erythropolis

<220>

<221> misc_feature

<223> ReHNase beta-subunit_P13449.1

<220>

<221> misc_feature

<223> ReNHase beta-subunit_P13449.1

<220>

<221> CDS

<222> (1)..(639)

<400> 11

atg gat gga gta cac gat ctt gcc gga gta caa ggc ttc ggc aaa gtc 48

Met Asp Gly Val His Asp Leu Ala Gly Val Gln Gly Phe Gly Lys Val

1 5 1015

ccg cat acc gtc aac gcc gac atc ggc ccc acc ttt cac gcc gaa tgg 96

Pro His Thr Val Asn Ala Asp Ile Gly Pro Thr Phe His Ala Glu Trp

202530

gaa cac ctg ccc tac agc ctg atg ttc gcc ggt gtc gcc gaa ctc ggg 144

Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly

354045

gcc ttc agc gtc gac gaa gtg cga tac gtc gtc gag cgg atg gag ccg 192

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro

505560

cgc cac tac atg atg acc ccg tac tac gag agg tac gtc atc ggt gtc 240

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val Ile Gly Val

65707580

gcg aca ttg atg gtc gaa aag gga atc ctg acg cag gac gaa ctc gaa 288

Ala Thr Leu Met Val Glu Lys Gly Ile Leu Thr Gln Asp Glu Leu Glu

859095

agc ctt gcg ggg gga ccg ttc cca ctg tca cgg ccc agc gaa tcc gaa 336

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu

100 105 110

ggg cgg ccg gca ccc gtc gag acg acc acc ttc gaa gtc ggg cag cga 384

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu Val Gly Gln Arg

115 120 125

gta cgc gta cgc gac gag tac gtt ccg ggg cat att cga atg cct gca 432

Val Arg Val Arg Asp Glu Tyr Val Pro Gly His Ile Arg Met Pro Ala

130 135 140

tac tgc cgt gga cga gtg gga acc atc tct cat cga act acc gag aag 480

Tyr Cys Arg Gly Arg Val Gly Thr Ile Ser His Arg Thr Thr Glu Lys

145 150 155 160

tgg ccg ttt ccc gac gca atc ggc cac ggg cgc aac gac gcc ggc gaa 528

Trp Pro Phe Pro Asp Ala Ile Gly His Gly Arg Asn Asp Ala Gly Glu

165 170 175

gaa ccg acg tac cac gtg aag ttc gcc gcc gag gaa ttg ttc ggt agc 576

Glu Pro Thr Tyr His Val Lys Phe Ala Ala Glu Glu Leu Phe Gly Ser

180 185 190

gac acc gac ggt gga agc gtc gtt gtc gac ctc ttc gag ggt tac ctc 624

Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu

195 200 205

gag cct gcg gcc tga 639

Glu Pro Ala Ala

210

<210> 12

<211> 212

<212> PRT

<213> Rhodococcus erythropolis

<400> 12

Met Asp Gly Val His Asp Leu Ala Gly Val Gln Gly Phe Gly Lys Val

1 5 1015

Pro His Thr Val Asn Ala Asp Ile Gly Pro Thr Phe His Ala Glu Trp

202530

Glu His Leu Pro Tyr Ser Leu Met Phe Ala Gly Val Ala Glu Leu Gly

354045

Ala Phe Ser Val Asp Glu Val Arg Tyr Val Val Glu Arg Met Glu Pro

505560

Arg His Tyr Met Met Thr Pro Tyr Tyr Glu Arg Tyr Val Ile Gly Val

65707580

Ala Thr Leu Met Val Glu Lys Gly Ile Leu Thr Gln Asp Glu Leu Glu

859095

Ser Leu Ala Gly Gly Pro Phe Pro Leu Ser Arg Pro Ser Glu Ser Glu

100 105 110

Gly Arg Pro Ala Pro Val Glu Thr Thr Thr Phe Glu Val Gly Gln Arg

115 120 125

Val Arg Val Arg Asp Glu Tyr Val Pro Gly His Ile Arg Met Pro Ala

130 135 140

Tyr Cys Arg Gly Arg Val Gly Thr Ile Ser His Arg Thr Thr Glu Lys

145 150 155 160

Trp Pro Phe Pro Asp Ala Ile Gly His Gly Arg Asn Asp Ala Gly Glu

165 170 175

Glu Pro Thr Tyr His Val Lys Phe Ala Ala Glu Glu Leu Phe Gly Ser

180 185 190

Asp Thr Asp Gly Gly Ser Val Val Val Asp Leu Phe Glu Gly Tyr Leu

195 200 205

Glu Pro Ala Ala

210

<210> 13

<211> 119

<212> PRT

<213> Pseudomonas kilonensis_PkNHase beta-subunit_partial sequence

<220>

<221> misc_feature

<222> (92)..(92)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (107)..(107)

<223> Xaa can be any naturally occurring amino acid

<220>

<221> misc_feature

<222> (117)..(117)

<223> Xaa can be any naturally occurring amino acid

<400> 13

Met Asp Gly Phe His Asp Leu Gly Gly Phe Gln Gly Phe Gly Lys Val

1 5 1015

Pro His Thr Ile Asn Ser Leu Ser Tyr Lys Gln Val Phe Lys Gln Asp

202530

Trp Glu His Leu Ala Tyr Ser Leu Met Phe Val Gly Val Asp Gln Leu

354045

Lys Lys Phe Ser Val Asp Glu Val Arg His Ala Val Glu Arg Leu Asp

505560

Val Arg Gln His Val Gly Thr Gln Tyr Tyr Glu Arg Tyr Val Ile Ala

65707580

Thr Ala Thr Leu Leu Val Glu Thr Gly Val Ile Xaa Gln Ala Glu Leu

859095

Asp Gln Ala Leu Gly Ser His Phe Lys Leu Xaa Lys Pro Cys Ser Cys

100 105 110

Gln Arg Ser Pro Xaa Asp His

115

<210> 14

<211> 633

<212> DNA

<213> Comamonas testosteroni

<220>

<221> misc_feature

<223> CtNHase alpha-subunit_AAU87542.1

<220>

<221> CDS

<222> (1)..(633)

<400> 14

atg ggg caa tca cac acg cat gac cac cat cac gac ggg tac cag gca 48

Met Gly Gln Ser His Thr His Asp His His His Asp Gly Tyr Gln Ala

1 5 1015

ccg ccc gaa gac atc gcg ctg cgg gtc aag gcc ttg gag tct ctg ctg 96

Pro Pro Glu Asp Ile Ala Leu Arg Val Lys Ala Leu Glu Ser Leu Leu

202530

atc gag aaa ggt ctt gtc gac cca gcg gcc atg gac ttg gtc gtc caa 144

Ile Glu Lys Gly Leu Val Asp Pro Ala Ala Met Asp Leu Val Val Gln

354045

acg tat gaa cac aag gta ggc ccc cga aac ggc gcc aaa gtc gtg gcc 192

Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala Lys Val Val Ala

505560

aag gcc tgg gtg gac cct gcc tac aag gcc cgt ctg ctg gca gac ggc 240

Lys Ala Trp Val Asp Pro Ala Tyr Lys Ala Arg Leu Leu Ala Asp Gly

65707580

act gcc ggc att gcc gag ctg ggc ttc tcc ggg gta cag ggc gag gac 288

Thr Ala Gly Ile Ala Glu Leu Gly Phe Ser Gly Val Gln Gly Glu Asp

859095

atg gtc att ctg gaa aac acc ccc gcc gtc cac aac gtc gtc gtt tgc 336

Met Val Ile Leu Glu Asn Thr Pro Ala Val His Asn Val Val Val Cys

100 105 110

acc ttg tgc tct tgc tac cca tgg ccg acg ctg ggc ttg ccc cct gcc 384

Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Ala

115 120 125

tgg tac aag gcc ccg ccc tac cgg tcc cgc atg gtg agc gac ccg cgt 432

Trp Tyr Lys Ala Pro Pro Tyr Arg Ser Arg Met Val Ser Asp Pro Arg

130 135 140

ggg gtt ctc gcg gag ttc ggc ctg gtg atc ccc gcg aag gaa atc cgc 480

Gly Val Leu Ala Glu Phe Gly Leu Val Ile Pro Ala Lys Glu Ile Arg

145 150 155 160

gtc tgg gac acc acg gcc gaa ttg cgc tac atg gtg ctg ccg gaa cgg 528

Val Trp Asp Thr Thr Ala Glu Leu Arg Tyr Met Val Leu Pro Glu Arg

165 170 175

ccc gcg gga act gaa gcc tac agc gaa gaa caa ctg gcc gaa ctc gtt 576

Pro Ala Gly Thr Glu Ala Tyr Ser Glu Glu Gln Leu Ala Glu Leu Val

180 185 190

acc cgc gat tcg atg atc ggc acc ggc ctg ccc atc caa ccc acc cca 624

Thr Arg Asp Ser Met Ile Gly Thr Gly Leu Pro Ile Gln Pro Thr Pro

195 200 205

tct cat taa 633

Ser His

210

<210> 15

<211> 210

<212> PRT

<213> Comamonas testosteroni

<400> 15

Met Gly Gln Ser His Thr His Asp His His His Asp Gly Tyr Gln Ala

1 5 1015

Pro Pro Glu Asp Ile Ala Leu Arg Val Lys Ala Leu Glu Ser Leu Leu

202530

Ile Glu Lys Gly Leu Val Asp Pro Ala Ala Met Asp Leu Val Val Gln

354045

Thr Tyr Glu His Lys Val Gly Pro Arg Asn Gly Ala Lys Val Val Ala

505560

Lys Ala Trp Val Asp Pro Ala Tyr Lys Ala Arg Leu Leu Ala Asp Gly

65707580

Thr Ala Gly Ile Ala Glu Leu Gly Phe Ser Gly Val Gln Gly Glu Asp

859095

Met Val Ile Leu Glu Asn Thr Pro Ala Val His Asn Val Val Val Cys

100 105 110

Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Ala

115 120 125

Trp Tyr Lys Ala Pro Pro Tyr Arg Ser Arg Met Val Ser Asp Pro Arg

130 135 140

Gly Val Leu Ala Glu Phe Gly Leu Val Ile Pro Ala Lys Glu Ile Arg

145 150 155 160

Val Trp Asp Thr Thr Ala Glu Leu Arg Tyr Met Val Leu Pro Glu Arg

165 170 175

Pro Ala Gly Thr Glu Ala Tyr Ser Glu Glu Gln Leu Ala Glu Leu Val

180 185 190

Thr Arg Asp Ser Met Ile Gly Thr Gly Leu Pro Ile Gln Pro Thr Pro

195 200 205

Ser His

210

<210> 16

<211> 609

<212> DNA

<213> Klebsiella oxytoca

<220>

<221> misc_feature

<223> KoNHase alpha-subunit_OSY94202.1

<220>

<221> CDS

<222> (1)..(609)

<400> 16

atg agc cat aaa cac gac cac gac cat acc cac ccc ccc gtt gat atc 48

Met Ser His Lys His Asp His Asp His Thr His Pro Pro Val Asp Ile

1 5 1015

gag cta cgc gtc cgc gca ctg gaa tcc ctg ctg cag gaa aaa ggc ctg 96

Glu Leu Arg Val Arg Ala Leu Glu Ser Leu Leu Gln Glu Lys Gly Leu

202530

atc gac ccg gct gcg ctg gat gag ctg att gac acc tac gag cac aaa 144

Ile Asp Pro Ala Ala Leu Asp Glu Leu Ile Asp Thr Tyr Glu His Lys

354045

gtc ggc ccc cga aac ggc gca cag gtt gtc gcc aga gcg tgg agc gac 192

Val Gly Pro Arg Asn Gly Ala Gln Val Val Ala Arg Ala Trp Ser Asp

505560

ccg gaa tac aaa cgt cga ctg atg gaa aac gcc act gcc gct att gct 240

Pro Glu Tyr Lys Arg Arg Leu Met Glu Asn Ala Thr Ala Ala Ile Ala

65707580

gaa ctg ggt ttc tcc gga ata cag ggc gaa gac atg ctg gtc gtg gag 288

Glu Leu Gly Phe Ser Gly Ile Gln Gly Glu Asp Met Leu Val Val Glu

859095

aac acg ccg gac gtg cat aac gtc acc gtt tgt acg ctg tgt tcc tgc 336

Asn Thr Pro Asp Val His Asn Val Thr Val Cys Thr Leu Cys Ser Cys

100 105 110

tac ccc tgg ccg gtg ctg ggt ctg ccg ccg gtg tgg tac aaa tca gcg 384

Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Val Trp Tyr Lys Ser Ala

115 120 125

ccc tat cgt tcg cgt atc gtc atc gac ccg cgc ggc gtt ctc gcc gag 432

Pro Tyr Arg Ser Arg Ile Val Ile Asp Pro Arg Gly Val Leu Ala Glu

130 135 140

ttc ggg tta cac ata cca gaa aac aaa gag att cgc gtc tgg gac agc 480

Phe Gly Leu His Ile Pro Glu Asn Lys Glu Ile Arg Val Trp Asp Ser

145 150 155 160

agc gcc gag ctg cgc tat ctg gtc ctg cct gaa cgt ccg gca ggc acg 528

Ser Ala Glu Leu Arg Tyr Leu Val Leu Pro Glu Arg Pro Ala Gly Thr

165 170 175

gaa ggc tgg agc gaa gcg cag ttg agc gaa ctc atc acg cgc gat tcg 576

Glu Gly Trp Ser Glu Ala Gln Leu Ser Glu Leu Ile Thr Arg Asp Ser

180 185 190

atg att ggc acc ggt gtg gtt agc gca cca taa 609

Met Ile Gly Thr Gly Val Val Ser Ala Pro

195 200

<210> 17

<211> 202

<212> PRT

<213> Klebsiella oxytoca

<400> 17

Met Ser His Lys His Asp His Asp His Thr His Pro Pro Val Asp Ile

1 5 1015

Glu Leu Arg Val Arg Ala Leu Glu Ser Leu Leu Gln Glu Lys Gly Leu

202530

Ile Asp Pro Ala Ala Leu Asp Glu Leu Ile Asp Thr Tyr Glu His Lys

354045

Val Gly Pro Arg Asn Gly Ala Gln Val Val Ala Arg Ala Trp Ser Asp

505560

Pro Glu Tyr Lys Arg Arg Leu Met Glu Asn Ala Thr Ala Ala Ile Ala

65707580

Glu Leu Gly Phe Ser Gly Ile Gln Gly Glu Asp Met Leu Val Val Glu

859095

Asn Thr Pro Asp Val His Asn Val Thr Val Cys Thr Leu Cys Ser Cys

100 105 110

Tyr Pro Trp Pro Val Leu Gly Leu Pro Pro Val Trp Tyr Lys Ser Ala

115 120 125

Pro Tyr Arg Ser Arg Ile Val Ile Asp Pro Arg Gly Val Leu Ala Glu

130 135 140

Phe Gly Leu His Ile Pro Glu Asn Lys Glu Ile Arg Val Trp Asp Ser

145 150 155 160

Ser Ala Glu Leu Arg Tyr Leu Val Leu Pro Glu Arg Pro Ala Gly Thr

165 170 175

Glu Gly Trp Ser Glu Ala Gln Leu Ser Glu Leu Ile Thr Arg Asp Ser

180 185 190

Met Ile Gly Thr Gly Val Val Ser Ala Pro

195 200

<210> 18

<211> 636

<212> DNA

<213> Nitriliruptor alkaliphilus

<220>

<221> misc_feature

<223> NaNHase alpha-subunit_WP_052668589.1

<220>

<221> CDS

<222> (1)..(636)

<400> 18

atg agc cag acc cag agc cca ccc ccc gtc aac ttc agc ctg ccc cgc 48

Met Ser Gln Thr Gln Ser Pro Pro Pro Val Asn Phe Ser Leu Pro Arg

1 5 1015

acg gag gag cag gtc gcg gcg cgc gtg aag gcg ctc gag tcg atc atg 96

Thr Glu Glu Gln Val Ala Ala Arg Val Lys Ala Leu Glu Ser Ile Met

202530

atc gag aag ggc atc atg acg acg gac gcc gtc gac cgc ctc gcc gag 144

Ile Glu Lys Gly Ile Met Thr Thr Asp Ala Val Asp Arg Leu Ala Glu

354045

atc tac gag aac gag gtc gga cca cag ctc ggc gca agg gtc gtg gcc 192

Ile Tyr Glu Asn Glu Val Gly Pro Gln Leu Gly Ala Arg Val Val Ala

505560

cgc gcc tgg tct gac ccc gac ttc cac gat cgg ctg ctc gcc aac gcc 240

Arg Ala Trp Ser Asp Pro Asp Phe His Asp Arg Leu Leu Ala Asn Ala

65707580

acc gag gcc tgc gag gag ctg gac atc ggc ggc ctg cag ggc gag gac 288

Thr Glu Ala Cys Glu Glu Leu Asp Ile Gly Gly Leu Gln Gly Glu Asp

859095

atg gtc gtc atc gag aac acc gac gac gtg cac aac ctc atc gtg tgc 336

Met Val Val Ile Glu Asn Thr Asp Asp Val His Asn Leu Ile Val Cys

100 105 110

acg ctc tgc tcc tgc tac ccc tgg cca acg ctc ggc ctg ccg ccc aac 384

Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Asn

115 120 125

tgg tac aag tac ccc gcc tac cgg gcc aag gcc gtg cgc gaa ccg cgg 432

Trp Tyr Lys Tyr Pro Ala Tyr Arg Ala Lys Ala Val Arg Glu Pro Arg

130 135 140

gcg atg ctg cgc gac gac ttc ggc ctc gac ctg ccc gac tcg gtt gag 480

Ala Met Leu Arg Asp Asp Phe Gly Leu Asp Leu Pro Asp Ser Val Glu

145 150 155 160

atc cgc gtc tgg gat acc agc gcc gag ctt cgg tac tgg gtc ctg ccc 528

Ile Arg Val Trp Asp Thr Ser Ala Glu Leu Arg Tyr Trp Val Leu Pro

165 170 175

aag cgc ccg gaa ggt acc gag agc atg acg gag gac gaa ttg gcc gag 576

Lys Arg Pro Glu Gly Thr Glu Ser Met Thr Glu Asp Glu Leu Ala Glu

180 185 190

ctg gtc acc cgc gac tcc atg atc ggt gtc ggc gtc gcc cgt acc ccc 624

Leu Val Thr Arg Asp Ser Met Ile Gly Val Gly Val Ala Arg Thr Pro

195 200 205

gag gcg gtc tga 636

Glu Ala Val

210

<210> 19

<211> 211

<212> PRT

<213> Nitriliruptor alkaliphilus

<400> 19

Met Ser Gln Thr Gln Ser Pro Pro Pro Val Asn Phe Ser Leu Pro Arg

1 5 1015

Thr Glu Glu Gln Val Ala Ala Arg Val Lys Ala Leu Glu Ser Ile Met

202530

Ile Glu Lys Gly Ile Met Thr Thr Asp Ala Val Asp Arg Leu Ala Glu

354045

Ile Tyr Glu Asn Glu Val Gly Pro Gln Leu Gly Ala Arg Val Val Ala

505560

Arg Ala Trp Ser Asp Pro Asp Phe His Asp Arg Leu Leu Ala Asn Ala

65707580

Thr Glu Ala Cys Glu Glu Leu Asp Ile Gly Gly Leu Gln Gly Glu Asp

859095

Met Val Val Ile Glu Asn Thr Asp Asp Val His Asn Leu Ile Val Cys

100 105 110

Thr Leu Cys Ser Cys Tyr Pro Trp Pro Thr Leu Gly Leu Pro Pro Asn

115 120 125

Trp Tyr Lys Tyr Pro Ala Tyr Arg Ala Lys Ala Val Arg Glu Pro Arg

130 135 140

Ala Met Leu Arg Asp Asp Phe Gly Leu Asp Leu Pro Asp Ser Val Glu

145 150 155 160

Ile Arg Val Trp Asp Thr Ser Ala Glu Leu Arg Tyr Trp Val Leu Pro

165 170 175

Lys Arg Pro Glu Gly Thr Glu Ser Met Thr Glu Asp Glu Leu Ala Glu

180 185 190

Leu Val Thr Arg Asp Ser Met Ile Gly Val Gly Val Ala Arg Thr Pro

195 200 205

Glu Ala Val

210

<210> 20

<211> 624

<212> DNA

<213> Gordonia hydrophobica

<220>

<221> misc_feature

<223> GhNHase alpha-subunit_WP_066163464.1

<220>

<221> CDS

<222> (1)..(624)

<400> 20

atg tct gtc acc atc gat cac gca gtc gac aac gat ctc ggc gag aag 48

Met Ser Val Thr Ile Asp His Ala Val Asp Asn Asp Leu Gly Glu Lys

1 5 1015

gct ccg cgc tcg gcg cgt ggc gaa gcg ctc cgt cgt gct ctg gag gcc 96

Ala Pro Arg Ser Ala Arg Gly Glu Ala Leu Arg Arg Ala Leu Glu Ala

202530

aag ggc ctg ctg ccc gag ggc tat ctc gac gag tgg aac aac acc gca 144

Lys Gly Leu Leu Pro Glu Gly Tyr Leu Asp Glu Trp Asn Asn Thr Ala

354045

gag aac gtc ttc agt ccg cgg cgc ggc gcc gaa ctc gtc gca cac gca 192

Glu Asn Val Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala His Ala

505560

tgg acc gac ccg gaa ttc cgc gag ctc ttg ctc act gac ggg acg gct 240

Trp Thr Asp Pro Glu Phe Arg Glu Leu Leu Leu Thr Asp Gly Thr Ala

65707580

gcg gtg ggc cag tac ggt tac ctc ggc ccg cag ggc gag tac atc gtc 288

Ala Val Gly Gln Tyr Gly Tyr Leu Gly Pro Gln Gly Glu Tyr Ile Val

859095

gcg ttg gag gac acg ccg acg ctc aag cac gtc atc gtg tgc tcg ctc 336

Ala Leu Glu Asp Thr Pro Thr Leu Lys His Val Ile Val Cys Ser Leu

100 105 110

tgc tcg tgc acg gcc tgg ccg att ctg gga ctc tcg ccg tcg tgg tac 384

Cys Ser Cys Thr Ala Trp Pro Ile Leu Gly Leu Ser Pro Ser Trp Tyr

115 120 125

aag agc ttc gag tac cgg tcc cgg gtg gtg cgt gaa ccg cgc acg gtg 432

Lys Ser Phe Glu Tyr Arg Ser Arg Val Val Arg Glu Pro Arg Thr Val

130 135 140

ctc gcc gag atg ggc acc cag att ccg gac ggc gtc gag atc cgg gtc 480

Leu Ala Glu Met Gly Thr Gln Ile Pro Asp Gly Val Glu Ile Arg Val

145 150 155 160

gtc gat gtc acc gcg gac acc cgc ttc atg gtt ctc ccg cag cgg ccg 528

Val Asp Val Thr Ala Asp Thr Arg Phe Met Val Leu Pro Gln Arg Pro

165 170 175

gcg ggc aca gag ggg tgg agc cgt gaa cag ctg gcc gag atc gtg acc 576

Ala Gly Thr Glu Gly Trp Ser Arg Glu Gln Leu Ala Glu Ile Val Thr

180 185 190

aag gac tgc ttg atc ggc gtg gcg gtc cca cag gtc gaa tcc gtc tga 624

Lys Asp Cys Leu Ile Gly Val Ala Val Pro Gln Val Glu Ser Val

195 200 205

<210> 21

<211> 207

<212> PRT

<213> Gordonia hydrophobica

<400> 21

Met Ser Val Thr Ile Asp His Ala Val Asp Asn Asp Leu Gly Glu Lys

1 5 1015

Ala Pro Arg Ser Ala Arg Gly Glu Ala Leu Arg Arg Ala Leu Glu Ala

202530

Lys Gly Leu Leu Pro Glu Gly Tyr Leu Asp Glu Trp Asn Asn Thr Ala

354045

Glu Asn Val Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala His Ala

505560

Trp Thr Asp Pro Glu Phe Arg Glu Leu Leu Leu Thr Asp Gly Thr Ala

65707580

Ala Val Gly Gln Tyr Gly Tyr Leu Gly Pro Gln Gly Glu Tyr Ile Val

859095

Ala Leu Glu Asp Thr Pro Thr Leu Lys His Val Ile Val Cys Ser Leu

100 105 110

Cys Ser Cys Thr Ala Trp Pro Ile Leu Gly Leu Ser Pro Ser Trp Tyr

115 120 125

Lys Ser Phe Glu Tyr Arg Ser Arg Val Val Arg Glu Pro Arg Thr Val

130 135 140

Leu Ala Glu Met Gly Thr Gln Ile Pro Asp Gly Val Glu Ile Arg Val

145 150 155 160

Val Asp Val Thr Ala Asp Thr Arg Phe Met Val Leu Pro Gln Arg Pro

165 170 175

Ala Gly Thr Glu Gly Trp Ser Arg Glu Gln Leu Ala Glu Ile Val Thr

180 185 190

Lys Asp Cys Leu Ile Gly Val Ala Val Pro Gln Val Glu Ser Val

195 200 205

<210> 22

<211> 585

<212> DNA

<213> Pseudomonas marginalis

<220>

<221> misc_feature

<223> PmNHase alpha-subunit_WP_074846646.1

<220>

<221> CDS

<222> (1)..(585)

<400> 22

atg aat aca gcg act tca acg ccc ggc gaa aga gcc tgg gca ttg ttt 48

Met Asn Thr Ala Thr Ser Thr Pro Gly Glu Arg Ala Trp Ala Leu Phe

1 5 1015

caa gtc ctc aag agc aag gaa ctc atc ccg gag ggc tat gtc gag cag 96

Gln Val Leu Lys Ser Lys Glu Leu Ile Pro Glu Gly Tyr Val Glu Gln

202530

ctc acg caa ttg atg gag cac ggc tgg agc ccc gag aac ggc gcc cgt 144

Leu Thr Gln Leu Met Glu His Gly Trp Ser Pro Glu Asn Gly Ala Arg

354045

gtg gtg gcc aag gca tgg gtc gat ccg cag ttc cgg gca ctg ttg ctc 192

Val Val Ala Lys Ala Trp Val Asp Pro Gln Phe Arg Ala Leu Leu Leu

505560

aag gac ggc acc gcg gcc tgc gcc cag ttc ggc tac acc ggc ccc cag 240

Lys Asp Gly Thr Ala Ala Cys Ala Gln Phe Gly Tyr Thr Gly Pro Gln

65707580

ggc gaa tac atc gtc gcc ctg gag gat acg ccg acg ctg aag aac gtg 288

Gly Glu Tyr Ile Val Ala Leu Glu Asp Thr Pro Thr Leu Lys Asn Val

859095

atc gtc tgc agc ctg tgc tcc tgc acc aac tgg ccg gtc ctc ggc ctg 336

Ile Val Cys Ser Leu Cys Ser Cys Thr Asn Trp Pro Val Leu Gly Leu

100 105 110

ccg ccg gag tgg tac aag ggt ttc gag ttc cgc gca cgc ctg gtc cgg 384

Pro Pro Glu Trp Tyr Lys Gly Phe Glu Phe Arg Ala Arg Leu Val Arg

115 120 125

gag ggg cgc acg gta ctg cgc gag ctg ggg acg gag ttg ccc cgg gac 432

Glu Gly Arg Thr Val Leu Arg Glu Leu Gly Thr Glu Leu Pro Arg Asp

130 135 140

atg gtg gtc aag gtc tgg gat acc agc gcc gaa agc cgc tac ctg gtg 480

Met Val Val Lys Val Trp Asp Thr Ser Ala Glu Ser Arg Tyr Leu Val

145 150 155 160

ctg ccg gtc agg ccg gaa ggc tca gaa cac atg agc gaa gag cag ctt 528

Leu Pro Val Arg Pro Glu Gly Ser Glu His Met Ser Glu Glu Gln Leu

165 170 175

caa gcg ctg gtg acc aaa gac gtg ctg atc ggc gtc gcc ctg ccc cgc 576

Gln Ala Leu Val Thr Lys Asp Val Leu Ile Gly Val Ala Leu Pro Arg

180 185 190

gtg ggc tga 585

Val Gly

<210> 23

<211> 194

<212> PRT

<213> Pseudomonas marginalis

<400> 23

Met Asn Thr Ala Thr Ser Thr Pro Gly Glu Arg Ala Trp Ala Leu Phe

1 5 1015

Gln Val Leu Lys Ser Lys Glu Leu Ile Pro Glu Gly Tyr Val Glu Gln

202530

Leu Thr Gln Leu Met Glu His Gly Trp Ser Pro Glu Asn Gly Ala Arg

354045

Val Val Ala Lys Ala Trp Val Asp Pro Gln Phe Arg Ala Leu Leu Leu

505560

Lys Asp Gly Thr Ala Ala Cys Ala Gln Phe Gly Tyr Thr Gly Pro Gln

65707580

Gly Glu Tyr Ile Val Ala Leu Glu Asp Thr Pro Thr Leu Lys Asn Val

859095

Ile Val Cys Ser Leu Cys Ser Cys Thr Asn Trp Pro Val Leu Gly Leu

100 105 110

Pro Pro Glu Trp Tyr Lys Gly Phe Glu Phe Arg Ala Arg Leu Val Arg

115 120 125

Glu Gly Arg Thr Val Leu Arg Glu Leu Gly Thr Glu Leu Pro Arg Asp

130 135 140

Met Val Val Lys Val Trp Asp Thr Ser Ala Glu Ser Arg Tyr Leu Val

145 150 155 160

Leu Pro Val Arg Pro Glu Gly Ser Glu His Met Ser Glu Glu Gln Leu

165 170 175

Gln Ala Leu Val Thr Lys Asp Val Leu Ile Gly Val Ala Leu Pro Arg

180 185 190

Val Gly

<210> 24

<211> 624

<212> DNA

<213> Rhodococcus erythropolis

<220>

<221> misc_feature

<223> ReNHase alpha-subunit_P13448.3

<220>

<221> CDS

<222> (1)..(624)

<400> 24

atg tca gta acg atc gac cac aca acg gag aac gcc gca ccg gcc cag 48

Met Ser Val Thr Ile Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gln

1 5 1015

gcg ccg gtc tcc gac cgg gcg tgg gca ctg ttc cgc gca ctc gac ggt 96

Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly

202530

aag gga ttg gta ccc gac ggt tac gtc gag gga tgg aag aag acc ttc 144

Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe

354045

gag gag gac ttc agt cca agg cgc gga gcg gaa ttg gta gcg cgc gca 192

Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala

505560

tgg acc gac ccc gag ttc cgg cag ctg ctt ctc acc gac ggt acc gcc 240

Trp Thr Asp Pro Glu Phe Arg Gln Leu Leu Leu Thr Asp Gly Thr Ala

65707580

gca gtt gcc cag tac gga tac ctg ggc ccc cag ggc gaa tac atc gtg 288

Ala Val Ala Gln Tyr Gly Tyr Leu Gly Pro Gln Gly Glu Tyr Ile Val

859095

gca gtc gaa gac acc ccg aca ctc aag aac gtg atc gtg tgc tcg ctg 336

Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val Ile Val Cys Ser Leu

100 105 110

tgt tca tgc acc gcg tgg ccc atc ctc ggt ctg cca ccc acc tgg tac 384

Cys Ser Cys Thr Ala Trp Pro Ile Leu Gly Leu Pro Pro Thr Trp Tyr

115 120 125

aag agc ttc gaa tac cgt gcg cgc gtg gtc cgc gaa cca cgg aag gtt 432

Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val

130 135 140

ctc tcc gag atg gga acc gag atc gcg tcg gac atc gag att cgc gtc 480

Leu Ser Glu Met Gly Thr Glu Ile Ala Ser Asp Ile Glu Ile Arg Val

145 150 155 160

tac gac acc acc gcc gaa act cgc tac atg gtc ctc ccg cag cgt ccc 528

Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gln Arg Pro

165 170 175

gcc ggc acc gaa ggc tgg agc cag gaa caa ctg cag gaa atc gtc acc 576

Ala Gly Thr Glu Gly Trp Ser Gln Glu Gln Leu Gln Glu Ile Val Thr

180 185 190

aag gac tgc ctg atc ggg gtt gca atc ccg cag gtt ccc acc gtc tga 624

Lys Asp Cys Leu Ile Gly Val Ala Ile Pro Gln Val Pro Thr Val

195 200 205

<210> 25

<211> 207

<212> PRT

<213> Rhodococcus erythropolis

<400> 25

Met Ser Val Thr Ile Asp His Thr Thr Glu Asn Ala Ala Pro Ala Gln

1 5 1015

Ala Pro Val Ser Asp Arg Ala Trp Ala Leu Phe Arg Ala Leu Asp Gly

202530

Lys Gly Leu Val Pro Asp Gly Tyr Val Glu Gly Trp Lys Lys Thr Phe

354045

Glu Glu Asp Phe Ser Pro Arg Arg Gly Ala Glu Leu Val Ala Arg Ala

505560

Trp Thr Asp Pro Glu Phe Arg Gln Leu Leu Leu Thr Asp Gly Thr Ala

65707580

Ala Val Ala Gln Tyr Gly Tyr Leu Gly Pro Gln Gly Glu Tyr Ile Val

859095

Ala Val Glu Asp Thr Pro Thr Leu Lys Asn Val Ile Val Cys Ser Leu

100 105 110

Cys Ser Cys Thr Ala Trp Pro Ile Leu Gly Leu Pro Pro Thr Trp Tyr

115 120 125

Lys Ser Phe Glu Tyr Arg Ala Arg Val Val Arg Glu Pro Arg Lys Val

130 135 140

Leu Ser Glu Met Gly Thr Glu Ile Ala Ser Asp Ile Glu Ile Arg Val

145 150 155 160

Tyr Asp Thr Thr Ala Glu Thr Arg Tyr Met Val Leu Pro Gln Arg Pro

165 170 175

Ala Gly Thr Glu Gly Trp Ser Gln Glu Gln Leu Gln Glu Ile Val Thr

180 185 190

Lys Asp Cys Leu Ile Gly Val Ala Ile Pro Gln Val Pro Thr Val

195 200 205

<210> 26

<211> 603

<212> DNA

<213> Pseudomonas kilonensis

<220>

<221> misc_feature

<223> PkNHase alpha-subunit

<220>

<221> CDS

<222> (1)..(603)

<400> 26

atg agt aca tct att tcc acg act gcg acg act tca acg ccc gga gag 48

Met Ser Thr Ser Ile Ser Thr Thr Ala Thr Thr Ser Thr Pro Gly Glu

1 5 1015

cgg gca cgg gca ctg ttt cag gtg ctc aag agc aaa gac ctc atc ccg 96

Arg Ala Arg Ala Leu Phe Gln Val Leu Lys Ser Lys Asp Leu Ile Pro

202530

cag ggc tat gtc gag caa ctg act gag ttg atg gaa cac ggc tgg agc 144

Gln Gly Tyr Val Glu Gln Leu Thr Glu Leu Met Glu His Gly Trp Ser

354045

ccg gag aac ggc gcc cga gtg gtc gcc aaa gca tgg gtc gat ccg cag 192

Pro Glu Asn Gly Ala Arg Val Val Ala Lys Ala Trp Val Asp Pro Gln

505560

ttc cgg gca ctg ttg ctc aag gac ggc acc gcc gcg tgc gcc cag ttc 240

Phe Arg Ala Leu Leu Leu Lys Asp Gly Thr Ala Ala Cys Ala Gln Phe

65707580

ggc tac acc ggt ccg cag ggc gag tac atc gtc gct ctg gag gat acg 288

Gly Tyr Thr Gly Pro Gln Gly Glu Tyr Ile Val Ala Leu Glu Asp Thr

859095

ccc gag gtg aaa aac gtc att gtc tgc agc ctt tgc tcc tgc acc aac 336

Pro Glu Val Lys Asn Val Ile Val Cys Ser Leu Cys Ser Cys Thr Asn

100 105 110

tgg ccg gtc ctc ggc ctg cca ccc gag tgg tac aag ggc ttt gag ttt 384

Trp Pro Val Leu Gly Leu Pro Pro Glu Trp Tyr Lys Gly Phe Glu Phe

115 120 125

cgt gct cgc ctg gtc cgg gaa gga cgc acc gta ctg cgt gaa ctg ggg 432

Arg Ala Arg Leu Val Arg Glu Gly Arg Thr Val Leu Arg Glu Leu Gly

130 135 140

aca gag tta ccg aac gac agg gtt gtc aag gtc tgg gac acc agc gcc 480

Thr Glu Leu Pro Asn Asp Arg Val Val Lys Val Trp Asp Thr Ser Ala

145 150 155 160

gaa acc cgc tac ctg gtg ttg ccg gta aga cca gaa ggc tgc gag cac 528

Glu Thr Arg Tyr Leu Val Leu Pro Val Arg Pro Glu Gly Cys Glu His

165 170 175

atg acc gaa gag cag ctt cgg aca ctg gtg acc aag gac gtg ctg att 576

Met Thr Glu Glu Gln Leu Arg Thr Leu Val Thr Lys Asp Val Leu Ile

180 185 190

ggc gtc gcc ctg ccc cag gtt ggc tga 603

Gly Val Ala Leu Pro Gln Val Gly

195 200

<210> 27

<211> 200

<212> PRT

<213> Pseudomonas kilonensis

<400> 27

Met Ser Thr Ser Ile Ser Thr Thr Ala Thr Thr Ser Thr Pro Gly Glu

1 5 1015

Arg Ala Arg Ala Leu Phe Gln Val Leu Lys Ser Lys Asp Leu Ile Pro

202530

Gln Gly Tyr Val Glu Gln Leu Thr Glu Leu Met Glu His Gly Trp Ser

354045

Pro Glu Asn Gly Ala Arg Val Val Ala Lys Ala Trp Val Asp Pro Gln

505560

Phe Arg Ala Leu Leu Leu Lys Asp Gly Thr Ala Ala Cys Ala Gln Phe

65707580

Gly Tyr Thr Gly Pro Gln Gly Glu Tyr Ile Val Ala Leu Glu Asp Thr

859095

Pro Glu Val Lys Asn Val Ile Val Cys Ser Leu Cys Ser Cys Thr Asn

100 105 110

Trp Pro Val Leu Gly Leu Pro Pro Glu Trp Tyr Lys Gly Phe Glu Phe

115 120 125

Arg Ala Arg Leu Val Arg Glu Gly Arg Thr Val Leu Arg Glu Leu Gly

130 135 140

Thr Glu Leu Pro Asn Asp Arg Val Val Lys Val Trp Asp Thr Ser Ala

145 150 155 160

Glu Thr Arg Tyr Leu Val Leu Pro Val Arg Pro Glu Gly Cys Glu His

165 170 175

Met Thr Glu Glu Gln Leu Arg Thr Leu Val Thr Lys Asp Val Leu Ile

180 185 190

Gly Val Ala Leu Pro Gln Val Gly

195 200

<210> 28

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aQ93X_for

<220>

<221> misc_feature

<222> (6)..(8)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 28

gggtannkgg cgaggacatg 20

<210> 29

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aQ93X_rev

<220>

<221> misc_feature

<222> (4)..(6)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 29

gccmnntacc ccggagaag 19

<210> 30

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aW120X_for

<220>

<221> misc_feature

<222> (7)..(9)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 30

tacccannkc cgacgctgg 19

<210> 31

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aW120X_rev

<220>

<221> misc_feature

<222> (10)..(12)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 31

cagcgtcggm nntgggtag 19

<210> 32

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aP126X_for

<220>

<221> misc_feature

<222> (9)..(11)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 32

tgggcttgnn kcctgcctg 19

<210> 33

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aP126X_rev

<220>

<221> misc_feature

<222> (14)..(16)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 33

gtaccaggca ggmnncaag 19

<210> 34

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aK131X_for

<220>

<221> misc_feature

<222> (5)..(7)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 34

gtacnnkgcc ccgccctac 19

<210> 35

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aK131X_rev

<220>

<221> misc_feature

<222> (5)..(7)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 35

gggcmnngta ccaggcag 18

<210> 36

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aR169X_for

<220>

<221> misc_feature

<222> (8)..(10)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 36

cgaattgnnk tacatggtgc tg 22

<210> 37

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-aR169X_rev

<220>

<221> misc_feature

<222> (14)..(16)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 37

cagcaccatg tamnncaatt cg 22

<210> 38

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bM34X_for

<220>

<221> misc_feature

<222> (6)..(8)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 38

cggtcnnktc cctgttccc 19

<210> 39

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bM34X_rev

<220>

<221> misc_feature

<222> (7)..(9)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 39

cagggamnng accgtttttt c 21

<210> 40

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bF37X_for

<220>

<221> misc_feature

<222> (6)..(8)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 40

ccctgnnkcc ggcgctgttc 20

<210> 41

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bF37X_rev

<220>

<221> misc_feature

<222> (6)..(8)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 41

gccggmnnca gggacatgac 20

<210> 42

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bL48X_for

<220>

<221> misc_feature

<222> (5)..(7)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 42

caacnnkgat gagtttcgac ac 22

<210> 43

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bL48X_rev

<220>

<221> misc_feature

<222> (15)..(17)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 43

gtcgaaactc atcmnngttg aag 23

<210> 44

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bF51X_for

<220>

<221> misc_feature

<222> (8)..(10)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 44

cgatgagnnk cgacacggc 19

<210> 45

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bF51X_rev

<220>

<221> misc_feature

<222> (10)..(12)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 45

gccgtgtcgm nnctcatcg 19

<210> 46

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bY68X-long_for

<220>

<221> misc_feature

<222> (10)..(12)

<223> N can be any nucleic acid (A, T, G, or C); K can be G or T

<400> 46

aagggaaccn nktacgaaca ctggatccat tc 32

<210> 47

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-bY68X-long_rev

<220>

<221> misc_feature

<222> (9)..(11)

<223> N can be any nucleic acid (A, T, G, or C); M can be A or C

<400> 47

tgttcgtamn nggttccctt caggtagtcg 30

<210> 48

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-aW120F_for

<400> 48

gctacccatt tccgacgctg g 21

<210> 49

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-aW120F_rev

<400> 49

gcgtcggaaa tgggtagcaa gag 23

<210> 50

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-bM34L_for

<400> 50

aaacggtctt gtccctgttc ccggcgctgt tc 32

<210> 51

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-bM34L_rev

<400> 51

aacagggaca agaccgtttt ttcccagtcg tag 33

<210> 52

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-bM34Q_for

<400> 52

aaacggtcca gtccctgttc ccggcgctgt tc 32

<210> 53

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-bM34Q_rev

<400> 53

aacagggact ggaccgtttt ttcccagtcg tag 33

<210> 54

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-alpha1_for

<400> 54

tggccaaggc ctgggtggac 20

<210> 55

<211> 21

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-alpha1_rev

<400> 55

gcaagagcac aaggtgcaaa c 21

<210> 56

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-alpha2_for

<400> 56

ccttgtgctc ttgctaccca 20

<210> 57

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-alpha2_rev

<400> 57

ttcagttccc gcgggccg 18

<210> 58

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta1_for

<400> 58

cgtctttcgc tacgactgg 19

<210> 59

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta1_rev

<400> 59

aggtttcgat ggaatggatc ca 22

<210> 60

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta2_for

<400> 60

gcttctgccg cccgggag 18

<210> 61

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta2_rev

<400> 61

tttccgtgtg ccgcggtgtc 20

<210> 62

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-A1bb-lig_for

<220>

<221> misc_feature

<222> (6)..(11)

<223> restriction site

<400> 62

aatttctcga gtttgcacct tgtgctcttg ctac 34

<210> 63

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-A1bb-lig_rev

<220>

<221> misc_feature

<222> (6)..(11)

<223> restriction site

<400> 63

aatttctcga gtccacccag gccttggcc 29

<210> 64

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-A2bb-lig_for

<220>

<221> misc_feature

<222> (6)..(11)

<223> restriction site

<400> 64

aatttctcga ggcccgcggg aactgaag 28

<210> 65

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-A2bb-lig_rev

<220>

<221> misc_feature

<222> (6)..(11)

<223> restriction site

<400> 65

aatttctcga gggtagcaag agcacaagg 29

<210> 66

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-B1bb-lig_for

<220>

<221> misc_feature

<222> (7)..(12)

<223> restriction site

<400> 66

tttaaagcta gctggatcca ttccatcgaa accttg 36

<210> 67

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-B1bb-lig_rev

<220>

<221> misc_feature

<222> (7)..(12)

<223> restriction site

<400> 67

tttaaagcta gccagtcgta gcgaaagacg 30

<210> 68

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-B2bb-lig_for

<220>

<221> misc_feature

<222> (7)..(12)

<223> restriction site

<400> 68

tttaaagcta gcaccgcggc acacggaaag g 31

<210> 69

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-B2bb-lig_rev

<220>

<221> misc_feature

<222> (7)..(12)

<223> restriction site

<400> 69

tttaaagcta gctcccgggc ggcagaagcc 30

<210> 70

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta1-focused_for

<220>

<221> misc_feature

<222> (9)..(9)

<223> Y can be T or C

<220>

<221> misc_feature

<222> (10)..(10)

<223> K can be G or T

<220>

<221> misc_feature

<222> (11)..(11)

<223> S can be C or G

<220>

<221> misc_feature

<222> (19)..(19)

<223> V can be A, G or C

<220>

<221> misc_feature

<222> (27)..(27)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (29)..(29)

<223> N can be A, G, T or C

<220>

<221> misc_feature

<222> (30)..(30)

<223> D can be A, G or T

<400> 70

acttcaacyk sgatgagvtt cgacacndta tcgagcgcat gaac 44

<210> 71

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-beta1-focused_rev

<220>

<221> misc_feature

<222> (15)..(15)

<223> H can be A, C or T

<220>

<221> misc_feature

<222> (16)..(16)

<223> N can be A, G, T or C

<220>

<221> misc_feature

<222> (26)..(26)

<223> B can be G, C or T

<220>

<221> misc_feature

<222> (34)..(34)

<223> S can be C or G

<220>

<221> misc_feature

<222> (35)..(35)

<223> M can be A or C

<220>

<221> misc_feature

<222> (36)..(36)

<223> R can be G or A

<400> 71

catgcgctcg atahngtgtc gaabctcatc smrgttgaag ttgccgttgg 50

<210> 72

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121A_for

<400> 72

atgggcgacg ctgggcttgc 20

<210> 73

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121A_rev

<400> 73

agcgtcgccc atgggtagca agag 24

<210> 74

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121R_for

<400> 74

atggcgtacg ctgggcttgc 20

<210> 75

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121R_rev

<400> 75

agcgtacgcc atgggtagca agag 24

<210> 76

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121N_for

<400> 76

atggaacacg ctgggcttgc 20

<210> 77

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121N_rev

<400> 77

agcgtgttcc atgggtagca agag 24

<210> 78

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121D_for

<400> 78

atgggatacg ctgggcttgc 20

<210> 79

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121D_rev

<400> 79

agcgtatccc atgggtagca agag 24

<210> 80

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121C_for

<400> 80

atggtgcacg ctgggcttgc 20

<210> 81

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121C_rev

<400> 81

agcgtgcacc atgggtagca agag 24

<210> 82

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121Q_for

<400> 82

atggcagacg ctgggcttgc 20

<210> 83

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121Q_rev

<400> 83

agcgtctgcc atgggtagca agag 24

<210> 84

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121E_for

<400> 84

atgggaaacg ctgggcttgc 20

<210> 85

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121E_rev

<400> 85

agcgtttccc atgggtagca agag 24

<210> 86

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121G_for

<400> 86

atggggcacg ctgggcttgc 20

<210> 87

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121G_rev

<400> 87

agcgtgcccc atgggtagca agag 24

<210> 88

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121H_for

<400> 88

atggcatacg ctgggcttgc 20

<210> 89

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121H_rev

<400> 89

agcgtatgcc atgggtagca agag 24

<210> 90

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121I_for

<400> 90

atggattacg ctgggcttgc 20

<210> 91

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121I_rev

<400> 91

agcgtaatcc atgggtagca agag 24

<210> 92

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121L_for

<400> 92

atggctgacg ctgggcttgc 20

<210> 93

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121L_rev

<400> 93

agcgtcagcc atgggtagca agag 24

<210> 94

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121K_for

<400> 94

atggaaaacg ctgggcttgc 20

<210> 95

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121K_rev

<400> 95

agcgttttcc atgggtagca agag 24

<210> 96

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121M_for

<400> 96

atggatgacg ctgggcttgc 20

<210> 97

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121M_rev

<400> 97

agcgtcatcc atgggtagca agag 24

<210> 98

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121F_for

<400> 98

atggtttacg ctgggcttgc 20

<210> 99

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121F_rev

<400> 99

agcgtaaacc atgggtagca agag 24

<210> 100

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121W_for

<400> 100

atggtggacg ctgggcttgc 20

<210> 101

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121W_rev

<400> 101

agcgtccacc atgggtagca agag 24

<210> 102

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121Y_for

<400> 102

atggtatacg ctgggcttgc 20

<210> 103

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Primer Ct-P121Y_rev

<400> 103

agcgtatacc atgggtagca agag 24

<210> 104

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-P121T_for

<400> 104

atggacgacg ctgggcttgc 20

<210> 105

<211> 24

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-P121T_rev

<400> 105

agcgtcgtcc atgggtagca agag 24

<210> 106

<211> 29

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-V110I_for

<400> 106

aacgtcatcg tttgcacctt gtgctcttg 29

<210> 107

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-V110I_rev

<400> 107

aaacgatgac gttgtggacg gc 22

<210> 108

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54C_for

<400> 108

acttcaaccg tgatgagttt cgacactgta tcgagcgcat gaac 44

<210> 109

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54C_rev

<400> 109

catgcgctcg atacagtgtc gaaactcatc acggttgaag ttgccgttgg 50

<210> 110

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54R_for

<400> 110

acttcaaccg tgatgagttt cgacaccgta tcgagcgcat gaac 44

<210> 111

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54R_rev

<400> 111

catgcgctcg atacggtgtc gaaactcatc acggttgaag ttgccgttgg 50

<210> 112

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54V_for

<400> 112

acttcaaccg tgatgagttt cgacacgtta tcgagcgcat gaac 44

<210> 113

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48R-G54V_rev

<400> 113

catgcgctcg ataacgtgtc gaaactcatc acggttgaag ttgccgttgg 50

<210> 114

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54C_for

<400> 114

acttcaaccc tgatgagttt cgacactgta tcgagcgcat gaac 44

<210> 115

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54C_rev

<400> 115

catgcgctcg atacagtgtc gaaactcatc agggttgaag ttgccgttgg 50

<210> 116

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54R_for

<400> 116

acttcaaccc tgatgagttt cgacaccgta tcgagcgcat gaac 44

<210> 117

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54R_rev

<400> 117

catgcgctcg atacggtgtc gaaactcatc agggttgaag ttgccgttgg 50

<210> 118

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54V_for

<400> 118

acttcaaccc tgatgagttt cgacacgtta tcgagcgcat gaac 44

<210> 119

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-G54V_rev

<400> 119

catgcgctcg ataacgtgtc gaaactcatc agggttgaag ttgccgttgg 50

<210> 120

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54C_for

<400> 120

acttcaactt cgatgagttt cgacactgta tcgagcgcat gaac 44

<210> 121

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54C_rev

<400> 121

catgcgctcg atacagtgtc gaaactcatc gaagttgaag ttgccgttgg 50

<210> 122

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54R_for

<400> 122

acttcaactt cgatgagttt cgacaccgta tcgagcgcat gaac 44

<210> 123

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54R_rev

<400> 123

catgcgctcg atacggtgtc gaaactcatc gaagttgaag ttgccgttgg 50

<210> 124

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54V_for

<400> 124

acttcaactt cgatgagttt cgacacgtta tcgagcgcat gaac 44

<210> 125

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F-G54V_rev

<400> 125

catgcgctcg ataacgtgtc gaaactcatc gaagttgaag ttgccgttgg 50

<210> 126

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-F51V-G54V_for

<400> 126

acttcaaccc tgatgaggtt cgacacgtta tcgagcgcat gaac 44

<210> 127

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48P-F51V-G54V_rev

<400> 127

catgcgctcg ataacgtgtc gaacctcatc agggttgaag ttgccgttgg 50

<210> 128

<211> 22

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F_for

<400> 128

caactttgat gagtttcgac ac 22

<210> 129

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-L48F_rev

<400> 129

gtcgaaactc atcaaagttg aag 23

<210> 130

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-F51L_for

<400> 130

cgatgagctt cgacacggc 19

<210> 131

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<223> Ct-F51L_rev

<400> 131

gccgtgtcga agctcatcg 19

<210> 132

<211> 1638

<212> DNA

<213> Artificial Sequence

<220>

<223> CtNHase_Insert for vector cloning

<220>

<221> misc_feature

<222> (1)..(36)

<223> Overhang for Gibson cloning

<220>

<221> misc_feature

<222> (37)..(669)

<223> alpha-subunit

<220>

<221> misc_feature

<222> (680)..(1336)

<223> beta-subunit

<220>

<221> misc_feature

<222> (1389)..(1603)

<223> accessory protein

<220>

<221> misc_feature

<222> (1604)..(1638)

<223> Overhang for Gibson cloning

<400> 132

aataattttg tttaacttta agaaggagat atacatatgg ggcaatcaca cacgcatgac 60

caccatcacg acgggtacca ggcaccgccc gaagacatcg cgctgcgggt caaggccttg 120

gagtctctgc tgatcgagaa aggtcttgtc gacccagcgg ccatggactt ggtcgtccaa 180

acgtatgaac acaaggtagg cccccgaaac ggcgccaaag tcgtggccaa ggcctgggtg 240

gaccctgcct acaaggcccg tctgctggca gacggcactg ccggcattgc cgagctgggc 300

ttctccgggg tacagggcga ggacatggtc attctggaaa acacccccgc cgtccacaac 360

gtcgtcgttt gcaccttgtg ctcttgctac ccatggccga cgctgggctt gccccctgcc 420

tggtacaagg ccccgcccta ccggtcccgc atggtgagcg acccgcgtgg ggttctcgcg 480

gagttcggcc tggtgatccc cgcgaaggaa atccgcgtct gggacaccac ggccgaattg 540

cgctacatgg tgctgccgga acggcccgcg ggaactgaag cctacagcga agaacaactg 600

gccgaactcg ttacccgcga ttcgatgatc ggcaccggcc tgcccatcca acccacccca 660

tctcattaag gagttcgtca tgaatggcat tcacgatact gggggagcac atggttatgg 720

gccggtttac agagaaccga acgaacccgt ctttcgctac gactgggaaa aaacggtcat 780

gtccctgttc ccggcgctgt tcgccaacgg caacttcaac ctcgatgagt ttcgacacgg 840

catcgagcgc atgaacccca tcgactacct gaagggaacc tactacgaac actggatcca 900

ttccatcgaa accttgctgg tcgaaaaggg tgtgctcacg gcaacggaac tcgcgaccgg 960

caaggcatct ggcaagacag cgacaccggt gctgacgccg gccatcgtgg acggactgct 1020

cagcaccggg gcttctgccg cccgggagga gggtgcgcgg gcgcggttcg ctgtggggga 1080

caaggttcgc gtcctcaaca agaacccggt gggccatacc cgcatgccgc gctacacgcg 1140

gggcaaagtg gggacagtgg tcatcgacca tggtgtgttc gtgacgccgg acaccgcggc 1200

acacggaaag ggcgagcacc cccagcacgt ttacaccgtg agtttcacgt cggtcgaact 1260

gtgggggcaa gacgcctcct cgccgaagga cacgattcgc gtcgacttgt gggatgacta 1320

cctggagcca gcgtgatcat gaaagacgaa cggtttccat tgccagaggg ttcgctgaag 1380

gacctcgatg gccctgtgtt tgacgagcct tggcagtccc aggcgtttgc cttggtggtc 1440

agcatgcaca aggccggtct ctttcagtgg aaagactggg ccgagacctt caccgccgaa 1500

atcgacgctt ccccggctct gcccggcgaa agcgtcaacg acacctacta ccggcaatgg 1560

gtgtcggcgc tggaaaagtt ggtggcgtcg ctggggcttg taagcttggc tgttttggcg 1620

gatgagagaa gattttca 1638

<210> 133

<211> 1834

<212> DNA

<213> Artificial Sequence

<220>

<223> KoNHase_Insert for vector cloning

<220>

<221> misc_feature

<222> (1)..(36)

<223> Overhang for Gibson cloning

<220>

<221> misc_feature

<222> (37)..(645)

<223> alpha-subunit

<220>

<221> misc_feature

<222> (661)..(1314)

<223> beta-subunit

<220>

<221> misc_feature

<222> (1329)..(1799)

<223> Accessory protein

<220>

<221> misc_feature

<222> (1800)..(1834)

<223> Overhang for Gibson cloning

<400> 133

aataattttg tttaacttta agaaggagat atacatatga gccataaaca cgaccacgac 60

catacccacc cccccgttga tatcgagcta cgcgtccgcg cactggaatc cctgctgcag 120

gaaaaaggcc tgatcgaccc ggctgcgctg gatgagctga ttgacaccta cgagcacaaa 180

gtcggccccc gaaacggcgc acaggttgtc gccagagcgt ggagcgaccc ggaatacaaa 240

cgtcgactga tggaaaacgc cactgccgct attgctgaac tgggtttctc cggaatacag 300

ggcgaagaca tgctggtcgt ggagaacacg ccggacgtgc ataacgtcac cgtttgtacg 360

ctgtgttcct gctacccctg gccggtgctg ggtctgccgc cggtgtggta caaatcagcg 420

ccctatcgtt cgcgtatcgt catcgacccg cgcggcgttc tcgccgagtt cgggttacac 480

ataccagaaa acaaagagat tcgcgtctgg gacagcagcg ccgagctgcg ctatctggtc 540

ctgcctgaac gtccggcagg cacggaaggc tggagcgaag cgcagttgag cgaactcatc 600

acgcgcgatt cgatgattgg caccggtgtg gttagcgcac cataacgaaa ggagaaaacc 660

atgaacggga tacatgatct gggggggatg cacggccttg gcccgatccc taccgaggaa 720

aacgagccct atttccatca tgagtgggaa cgccgggtat ttcctctgtt cgcctcgttg 780

ttcgtcggcg gacattttaa cgtcgatgaa tttcgccacg ccatcgaacg tatggcgccg 840

accgaatatt tgcagtcgag ctactacgag cactggctgc atgcattcga aacgctgctg 900

ctggcaaagg gggcgatcac cgttgaagaa ctgtggggtg gcgcgaagcc tgccccttgc 960

aagcctggca cacctgtgct gacgcaggag atggtgtcga tggtggtcag caccggcggg 1020

tctgctcggg tcagtcacga tgttgcgccc cgcttccggg tgggcgattg ggtacgaacg 1080

aaaaatttca acccgaccac ccatacccgc ctgccacgct acgcacgcga taaagtcggt 1140

cgcatagaga tcgctcacgg tgtgtttatc acgccagata ctgcggcgca cgggctgggc 1200

gaacatcccc agcatgttta cagcgtcagt ttcaccgcgc aggcgctgtg gggagagccg 1260

cgccctgaca aagtgttcat cgatctgtgg gacgactatc tggaggaagc ataaaaggag 1320

atatacatat gaataatacg gtagcacaac acgattacgc cgccctcggg ttaccgcgcg 1380

atgaggaagg gccggtgttc gataagccct ggcaggcaaa agcgttctcc ctgatagtcc 1440

atctccaccg ggccgggctg ttcccgtggg cagaatgggt acagacattc agtaaagaga 1500

tcaacgcggc gccggcgcaa ccgggtgaaa gcgcgaatga tgcctactat cgtcagtgga 1560

cggcggcgat ggaaaacatg atgacggcac tcaacctgac ggtgccggat gaaatcaacc 1620

gacggacgca ggagtggcgc aaggcgtatc tcaacacgcc ccacggccag ccgattgtac 1680

tggcgaacgc cagttgcccg ccggcacata gccatcatca cctttcgccg ggcgtgccgg 1740

tcacggtgag tccggcactc tctatcaaca gcaaaatcga taatggagtt acaccataag 1800

cttggctgtt ttggcggatg agagaagatt ttca 1834

<210> 134

<211> 1855

<212> DNA

<213> Artificial Sequence

<220>

<223> NaNHase_Insert for vector cloning

<220>

<221> misc_feature

<222> (1)..(36)

<223> Overhang for Gibson cloning

<220>

<221> misc_feature

<222> (37)..(720)

<223> alpha-subunit

<220>

<221> misc_feature

<222> (791)..(1426)

<223> beta-subunit

<220>

<221> misc_feature

<222> (1428)..(1820)

<223> accessory protein

<220>

<221> misc_feature

<222> (1821)..(1855)

<223> Overhang for Gibson cloning

<400> 134

aataattttg tttaacttta agaaggagat atacatatga acggcgtcca tgatcttggc 60

ggcaccgacg gcctcggccc ggtgatcacc gaggagaacg agccggtctg gcacagcgag 120

tgggagaagg ccgtcttcac gatgttcccc accaacttcg ccaagggaca tttcaacgtc 180

gactcgttcc gcttcgggat cgagaagatc catccggcgg actacctgtc gtcccggtac 240

tacgagcact ggctgcactc catcgagcat gcggtggtgg atcagggcgt cgtcgacgcc 300

gaggagctgg aggcgcgcac tcgtcactac ctcgagaacc ccgacgcgcc gttgccggac 360

cgccaggacc ctgatctggt gccactggtg gagacgatct cgcggggtgg tggctccgca 420

cgtcgcgaga gcgacaaggc gccgaggttc gaggtcggtg accgagtccg cgtcaagcgc 480

gacgaggtgc cccacggcca cacgcgccgc gcccgctacg tgcaggggcg cgaaggcgtg 540

atcgtccagg cccacggggc gttcatctac ccggacagcg caggcaacgg cgggccggag 600

gaccccgagc acgtctacac gatcctgttc gaggcctcgc acctgtgggg cgaacggacg 660

ggtgactcca acggaaccgt gaccttcgac gcgtgggagc cctacctcga gctggtctga 720

cggccagcgt cgtgccgtgt cgcgcactca gccacaacgg ccagcgatca cacatcaggg 780

agaagaaccg atgagccaga cccagagccc accccccgtc aacttcagcc tgccccgcac 840

ggaggagcag gtcgcggcgc gcgtgaaggc gctcgagtcg atcatgatcg agaagggcat 900

catgacgacg gacgccgtcg accgcctcgc cgagatctac gagaacgagg tcggaccaca 960

gctcggcgca agggtcgtgg cccgcgcctg gtctgacccc gacttccacg atcggctgct 1020

cgccaacgcc accgaggcct gcgaggagct ggacatcggc ggcctgcagg gcgaggacat 1080

ggtcgtcatc gagaacaccg acgacgtgca caacctcatc gtgtgcacgc tctgctcctg 1140

ctacccctgg ccaacgctcg gcctgccgcc caactggtac aagtaccccg cctaccgggc 1200

caaggccgtg cgcgaaccgc gggcgatgct gcgcgacgac ttcggcctcg acctgcccga 1260

ctcggttgag atccgcgtct gggataccag cgccgagctt cggtactggg tcctgcccaa 1320

gcgcccggaa ggtaccgaga gcatgacgga ggacgaattg gccgagctgg tcacccgcga 1380

ctccatgatc ggtgtcggcg tcgcccgtac ccccgaggcg gtctgacatg ccgacagcca 1440

cgacccccgt cggggatgcc ctgcggcacg tgcaggacct cctcgagcag ctgcccgagc 1500

gcgacaagtc cttcgacaag ccatgggagc ttcgagcctt cgccctggct gtcgcggcac 1560

acgacaacgg ccagtacgac tggagcgagt tccagcgctc gctcatcagc tccatcaagg 1620

cgtgggagca gggtggatcg ccagtgccgt ggcagtacta cgaccactgg ctgcaggccc 1680

tcgagaacgt gctggccgag accggcgccc tgaccgccga tgagctcgac gcccgcatgc 1740

acaccgtgct ctgtacgccc gtcaacagag accaccacga ggcgcgccac gacccagtgg 1800

ccatcgaccc cgcgcgctaa gcttggctgt tttggcggat gagagaagat tttca 1855

<210> 135

<211> 521

<212> PRT

<213> Rhodococcus erythropolis

<400> 135

Met Ala Thr Ile Arg Pro Asp Asp Lys Ala Ile Asp Ala Ala Ala Arg

1 5 1015

His Tyr Gly Ile Thr Leu Asp Lys Thr Ala Arg Leu Glu Trp Pro Ala

202530

Leu Ile Asp Gly Ala Leu Gly Ser Tyr Asp Val Val Asp Gln Leu Tyr

354045

Ala Asp Glu Ala Thr Pro Pro Thr Thr Ser Arg Glu His Ala Val Pro

505560

Ser Ala Ser Glu Asn Pro Leu Ser Ala Trp Tyr Val Thr Thr Ser Ile

65707580

Pro Pro Thr Ser Asp Gly Val Leu Thr Gly Arg Arg Val Ala Ile Lys

859095

Asp Asn Val Thr Val Ala Gly Val Pro Met Met Asn Gly Ser Arg Thr

100 105 110

Val Glu Gly Phe Thr Pro Ser Arg Asp Ala Thr Val Val Thr Arg Leu

115 120 125

Leu Ala Ala Gly Ala Thr Val Ala Gly Lys Ala Val Cys Glu Asp Leu

130 135 140

Cys Phe Ser Gly Ser Ser Phe Thr Pro Ala Ser Gly Pro Val Arg Asn

145 150 155 160

Pro Trp Asp Arg Gln Arg Glu Ala Gly Gly Ser Ser Gly Gly Ser Ala

165 170 175

Ala Leu Val Ala Asn Gly Asp Val Asp Phe Ala Ile Gly Gly Asp Gln

180 185 190

Gly Gly Ser Ile Arg Ile Pro Ala Ala Phe Cys Gly Val Val Gly His

195 200 205

Lys Pro Thr Phe Gly Leu Val Pro Tyr Thr Gly Ala Phe Pro Ile Glu

210 215 220

Arg Thr Ile Asp His Leu Gly Pro Ile Thr Arg Thr Val His Asp Ala

225 230 235 240

Ala Leu Met Leu Ser Val Ile Ala Gly Arg Asp Gly Asn Asp Pro Arg

245 250 255

Gln Ala Asp Ser Val Glu Ala Gly Asp Tyr Leu Ser Thr Leu Asp Ser

260 265 270

Asp Val Asp Gly Leu Arg Ile Gly Ile Val Arg Glu Gly Phe Gly His

275 280 285

Ala Val Ser Gln Pro Glu Val Asp Asp Ala Val Arg Ala Ala Ala His

290 295 300

Ser Leu Thr Glu Ile Gly Cys Thr Val Glu Glu Val Asn Ile Pro Trp

305 310 315 320

His Leu His Ala Phe His Ile Trp Asn Val Ile Ala Thr Asp Gly Gly

325 330 335

Ala Tyr Gln Met Leu Asp Gly Asn Gly Tyr Gly Met Asn Ala Glu Gly

340 345 350

Leu Tyr Asp Pro Glu Leu Met Ala His Phe Ala Ser Arg Arg Ile Gln

355 360 365

His Ala Asp Ala Leu Ser Glu Thr Val Lys Leu Val Ala Leu Thr Gly

370 375 380

His His Gly Ile Thr Thr Leu Gly Gly Ala Ser Tyr Gly Lys Ala Arg

385 390 395 400

Asn Leu Val Pro Leu Ala Arg Ala Ala Tyr Asp Thr Ala Leu Arg Gln

405 410 415

Phe Asp Val Leu Val Met Pro Thr Leu Pro Tyr Val Ala Ser Glu Leu

420 425 430

Pro Ala Lys Asp Val Asp Arg Ala Thr Phe Ile Thr Lys Ala Leu Gly

435 440 445

Met Ile Ala Asn Thr Ala Pro Phe Asp Val Thr Gly His Pro Ser Leu

450 455 460

Ser Val Pro Ala Gly Leu Val Asn Gly Leu Pro Val Gly Met Met Ile

465 470 475 480

Thr Gly Arg His Phe Asp Asp Ala Thr Val Leu Arg Val Gly Arg Ala

485 490 495

Phe Glu Lys Leu Arg Gly Ala Phe Pro Thr Pro Ala Glu Arg Ala Ser

500 505 510

Asn Ser Ala Pro Gln Leu Ser Pro Ala

515 520

<210> 136

<211> 216

<212> DNA

<213> Comamonas testosteroni

<220>

<221> CDS

<222> (1)..(216)

<400> 136

atg gcc ctg tgt ttg acg agc ctt ggc agt ccc agg cgt ttg cct tgg 48

Met Ala Leu Cys Leu Thr Ser Leu Gly Ser Pro Arg Arg Leu Pro Trp

1 5 1015

tgg tca gca tgc aca agg ccg gtc tct ttc agt gga aag act ggg ccg 96

Trp Ser Ala Cys Thr Arg Pro Val Ser Phe Ser Gly Lys Thr Gly Pro

202530

aga cct tca ccg ccg aaa tcg acg ctt ccc cgg ctc tgc ccg gcg aaa 144

Arg Pro Ser Pro Pro Lys Ser Thr Leu Pro Arg Leu Cys Pro Ala Lys

354045

gcg tca acg aca cct act acc ggc aat ggg tgt cgg cgc tgg aaa agt 192

Ala Ser Thr Thr Pro Thr Thr Gly Asn Gly Cys Arg Arg Trp Lys Ser

505560

tgg tgg cgt cgc tgg ggc ttg taa 216

Trp Trp Arg Arg Trp Gly Leu

6570

<210> 137

<211> 71

<212> PRT

<213> Comamonas testosteroni

<400> 137

Met Ala Leu Cys Leu Thr Ser Leu Gly Ser Pro Arg Arg Leu Pro Trp

1 5 1015

Trp Ser Ala Cys Thr Arg Pro Val Ser Phe Ser Gly Lys Thr Gly Pro

202530

Arg Pro Ser Pro Pro Lys Ser Thr Leu Pro Arg Leu Cys Pro Ala Lys

354045

Ala Ser Thr Thr Pro Thr Thr Gly Asn Gly Cys Arg Arg Trp Lys Ser

505560

Trp Trp Arg Arg Trp Gly Leu

6570

<210> 138

<211> 471

<212> DNA

<213> Klebsiella oxytoca

<220>

<221> CDS

<222> (1)..(471)

<400> 138

atg aat aat acg gta gca caa cac gat tac gcc gcc ctc ggg tta ccg 48

Met Asn Asn Thr Val Ala Gln His Asp Tyr Ala Ala Leu Gly Leu Pro

1 5 1015

cgc gat gag gaa ggg ccg gtg ttc gat aag ccc tgg cag gca aaa gcg 96

Arg Asp Glu Glu Gly Pro Val Phe Asp Lys Pro Trp Gln Ala Lys Ala

202530

ttc tcc ctg ata gtc cat ctc cac cgg gcc ggg ctg ttc ccg tgg gca 144

Phe Ser Leu Ile Val His Leu His Arg Ala Gly Leu Phe Pro Trp Ala

354045

gaa tgg gta cag aca ttc agt aaa gag atc aac gcg gcg ccg gcg caa 192

Glu Trp Val Gln Thr Phe Ser Lys Glu Ile Asn Ala Ala Pro Ala Gln

505560

ccg ggt gaa agc gcg aat gat gcc tac tat cgt cag tgg acg gcg gcg 240

Pro Gly Glu Ser Ala Asn Asp Ala Tyr Tyr Arg Gln Trp Thr Ala Ala

65707580

atg gaa aac atg atg acg gca ctc aac ctg acg gtg ccg gat gaa atc 288

Met Glu Asn Met Met Thr Ala Leu Asn Leu Thr Val Pro Asp Glu Ile

859095

aac cga cgg acg cag gag tgg cgc aag gcg tat ctc aac acg ccc cac 336

Asn Arg Arg Thr Gln Glu Trp Arg Lys Ala Tyr Leu Asn Thr Pro His

100 105 110

ggc cag ccg att gta ctg gcg aac gcc agt tgc ccg ccg gca cat agc 384

Gly Gln Pro Ile Val Leu Ala Asn Ala Ser Cys Pro Pro Ala His Ser

115 120 125

cat cat cac ctt tcg ccg ggc gtg ccg gtc acg gtg agt ccg gca ctc 432

His His His Leu Ser Pro Gly Val Pro Val Thr Val Ser Pro Ala Leu

130 135 140

tct atc aac agc aaa atc gat aat gga gtt aca cca taa 471

Ser Ile Asn Ser Lys Ile Asp Asn Gly Val Thr Pro

145 150 155

<210> 139

<211> 156

<212> PRT

<213> Klebsiella oxytoca

<400> 139

Met Asn Asn Thr Val Ala Gln His Asp Tyr Ala Ala Leu Gly Leu Pro

1 5 1015

Arg Asp Glu Glu Gly Pro Val Phe Asp Lys Pro Trp Gln Ala Lys Ala

202530

Phe Ser Leu Ile Val His Leu His Arg Ala Gly Leu Phe Pro Trp Ala

354045

Glu Trp Val Gln Thr Phe Ser Lys Glu Ile Asn Ala Ala Pro Ala Gln

505560

Pro Gly Glu Ser Ala Asn Asp Ala Tyr Tyr Arg Gln Trp Thr Ala Ala

65707580

Met Glu Asn Met Met Thr Ala Leu Asn Leu Thr Val Pro Asp Glu Ile

859095

Asn Arg Arg Thr Gln Glu Trp Arg Lys Ala Tyr Leu Asn Thr Pro His

100 105 110

Gly Gln Pro Ile Val Leu Ala Asn Ala Ser Cys Pro Pro Ala His Ser

115 120 125

His His His Leu Ser Pro Gly Val Pro Val Thr Val Ser Pro Ala Leu

130 135 140

Ser Ile Asn Ser Lys Ile Asp Asn Gly Val Thr Pro

145 150 155

<210> 140

<211> 393

<212> DNA

<213> Nitriliruptor alkaliphilus

<220>

<221> CDS

<222> (1)..(393)

<400> 140

atg ccg aca gcc acg acc ccc gtc ggg gat gcc ctg cgg cac gtg cag 48

Met Pro Thr Ala Thr Thr Pro Val Gly Asp Ala Leu Arg His Val Gln

1 5 1015

gac ctc ctc gag cag ctg ccc gag cgc gac aag tcc ttc gac aag cca 96

Asp Leu Leu Glu Gln Leu Pro Glu Arg Asp Lys Ser Phe Asp Lys Pro

202530

tgg gag ctt cga gcc ttc gcc ctg gct gtc gcg gca cac gac aac ggc 144

Trp Glu Leu Arg Ala Phe Ala Leu Ala Val Ala Ala His Asp Asn Gly

354045

cag tac gac tgg agc gag ttc cag cgc tcg ctc atc agc tcc atc aag 192

Gln Tyr Asp Trp Ser Glu Phe Gln Arg Ser Leu Ile Ser Ser Ile Lys

505560

gcg tgg gag cag ggt gga tcg cca gtg ccg tgg cag tac tac gac cac 240

Ala Trp Glu Gln Gly Gly Ser Pro Val Pro Trp Gln Tyr Tyr Asp His

65707580

tgg ctg cag gcc ctc gag aac gtg ctg gcc gag acc ggc gcc ctg acc 288

Trp Leu Gln Ala Leu Glu Asn Val Leu Ala Glu Thr Gly Ala Leu Thr

859095

gcc gat gag ctc gac gcc cgc atg cac acc gtg ctc tgt acg ccc gtc 336

Ala Asp Glu Leu Asp Ala Arg Met His Thr Val Leu Cys Thr Pro Val

100 105 110

aac aga gac cac cac gag gcg cgc cac gac cca gtg gcc atc gac ccc 384

Asn Arg Asp His His Glu Ala Arg His Asp Pro Val Ala Ile Asp Pro

115 120 125

gcg cgc taa 393

Ala Arg

130

<210> 141

<211> 130

<212> PRT

<213> Nitriliruptor alkaliphilus

<400> 141

Met Pro Thr Ala Thr Thr Pro Val Gly Asp Ala Leu Arg His Val Gln

1 5 1015

Asp Leu Leu Glu Gln Leu Pro Glu Arg Asp Lys Ser Phe Asp Lys Pro

202530

Trp Glu Leu Arg Ala Phe Ala Leu Ala Val Ala Ala His Asp Asn Gly

354045

Gln Tyr Asp Trp Ser Glu Phe Gln Arg Ser Leu Ile Ser Ser Ile Lys

505560

Ala Trp Glu Gln Gly Gly Ser Pro Val Pro Trp Gln Tyr Tyr Asp His

65707580

Trp Leu Gln Ala Leu Glu Asn Val Leu Ala Glu Thr Gly Ala Leu Thr

859095

Ala Asp Glu Leu Asp Ala Arg Met His Thr Val Leu Cys Thr Pro Val

100 105 110

Asn Arg Asp His His Glu Ala Arg His Asp Pro Val Ala Ile Asp Pro

115 120 125

Ala Arg

130

<210> 142

<211> 1218

<212> DNA

<213> Gordona hydrophobica

<220>

<221> CDS

<222> (1)..(1218)

<400> 142

atg acc gac aac cgg ctt ccc gtc acc gtg ctc tcc ggc ttc ctc ggc 48

Met Thr Asp Asn Arg Leu Pro Val Thr Val Leu Ser Gly Phe Leu Gly

1 5 1015

gcc ggt aag acg acc ctg ctc aac cga gtg ctt cac aac cgc gac ggc 96

Ala Gly Lys Thr Thr Leu Leu Asn Arg Val Leu His Asn Arg Asp Gly

202530

cgc cgg atc gcc gtc gtc gtc aac gac atg agc gag gtg aac atc gac 144

Arg Arg Ile Ala Val Val Val Asn Asp Met Ser Glu Val Asn Ile Asp

354045

agc gcc gag atc gag cgc gag gtg acg ttg agc cgg tcc cag gag aag 192

Ser Ala Glu Ile Glu Arg Glu Val Thr Leu Ser Arg Ser Gln Glu Lys

505560

atc gtc gag atg tcc aac ggg tgc atc tgt tgc acc ctg cga gaa gac 240

Ile Val Glu Met Ser Asn Gly Cys Ile Cys Cys Thr Leu Arg Glu Asp

65707580

ctg ctc gtg gag atc acc gaa ctc gca gcg aag ggg tcc ttc gac tac 288

Leu Leu Val Glu Ile Thr Glu Leu Ala Ala Lys Gly Ser Phe Asp Tyr

859095

ctc ctc atc gag tcg tcc ggc atc tcc gaa cca ctg ccg gtg gcc gag 336

Leu Leu Ile Glu Ser Ser Gly Ile Ser Glu Pro Leu Pro Val Ala Glu

100 105 110

acg ttc acg ttc gtc gac acc gac ggc aac gca ttg tcg gat gtg gca 384

Thr Phe Thr Phe Val Asp Thr Asp Gly Asn Ala Leu Ser Asp Val Ala

115 120 125

cgg ctg gac acc atg gtc acc gtt gtg gac ggc tac agc ttc ctc cgc 432

Arg Leu Asp Thr Met Val Thr Val Val Asp Gly Tyr Ser Phe Leu Arg

130 135 140

gat ttc cga tct ggc ggc gac atc gtg gcc gag gcg ccg gag gat cag 480

Asp Phe Arg Ser Gly Gly Asp Ile Val Ala Glu Ala Pro Glu Asp Gln

145 150 155 160

cgc gac ttg tcg gat ctg ctc gtc gat cag gtc gag ttc gcc gac gtc 528

Arg Asp Leu Ser Asp Leu Leu Val Asp Gln Val Glu Phe Ala Asp Val

165 170 175

atc ctg gtc agc aag gcc gac ttg atc aac gca gcc gag ctg gcc gag 576

Ile Leu Val Ser Lys Ala Asp Leu Ile Asn Ala Ala Glu Leu Ala Glu

180 185 190

ctg acg gcg gtg ctg cgt tcg ctc aac gcc acg gcc cgg atc gag ccg 624

Leu Thr Ala Val Leu Arg Ser Leu Asn Ala Thr Ala Arg Ile Glu Pro

195 200 205

atg atc gac ggc gac gtc ccc ctc gac acc atc atg gac acc ggg agg 672

Met Ile Asp Gly Asp Val Pro Leu Asp Thr Ile Met Asp Thr Gly Arg

210 215 220

ttc tcc ctg gtg aag gcc gca cag gcg ccc ggc tgg ctg cag gag ttg 720

Phe Ser Leu Val Lys Ala Ala Gln Ala Pro Gly Trp Leu Gln Glu Leu

225 230 235 240

cgg ggc acc cat ata ccc gag acg ttg gag tac gga gtc agc tcg gcg 768

Arg Gly Thr His Ile Pro Glu Thr Leu Glu Tyr Gly Val Ser Ser Ala

245 250 255

gtg tat cgg gag cgc gcg ccg ttc cac ccg gtc agg ttc cac gac ttc 816

Val Tyr Arg Glu Arg Ala Pro Phe His Pro Val Arg Phe His Asp Phe

260 265 270

ctc acc gcg gag tgg acg aac ggt gtg ctg ctg cgc gcc aag ggc tat 864

Leu Thr Ala Glu Trp Thr Asn Gly Val Leu Leu Arg Ala Lys Gly Tyr

275 280 285

ttc tgg aat gcg gct cgg atg act gag atc ggc agt gtc tcg cag gcc 912

Phe Trp Asn Ala Ala Arg Met Thr Glu Ile Gly Ser Val Ser Gln Ala

290 295 300

ggg cat ctc atc cgc cac ggc tac atc ggg cga tgg tgg cag ttc ctg 960

Gly His Leu Ile Arg His Gly Tyr Ile Gly Arg Trp Trp Gln Phe Leu

305 310 315 320

ccg ccg agc tac tgg ccc gac gac gag gag cgg cgc acc gcg att ctc 1008

Pro Pro Ser Tyr Trp Pro Asp Asp Glu Glu Arg Arg Thr Ala Ile Leu

325 330 335

gag aag tgg gaa gat ccc gtc ggt gac tgc cgc cag gag atc gtg ttc 1056

Glu Lys Trp Glu Asp Pro Val Gly Asp Cys Arg Gln Glu Ile Val Phe

340 345 350

atc gga cag gga atc gac tgg gac gtc ctg ttc gcc gct cta gac gcc 1104

Ile Gly Gln Gly Ile Asp Trp Asp Val Leu Phe Ala Ala Leu Asp Ala

355 360 365

tgt ctg ctg acc cag gag gag atc gaa ctc ggc ccg gac gcg tgg gaa 1152

Cys Leu Leu Thr Gln Glu Glu Ile Glu Leu Gly Pro Asp Ala Trp Glu

370 375 380

cag tgg ccg gac cca ctc ggc gac ggc gac gcc gcc ggt gtc aca tcg 1200

Gln Trp Pro Asp Pro Leu Gly Asp Gly Asp Ala Ala Gly Val Thr Ser

385 390 395 400

aag atc gca cag gca taa 1218

Lys Ile Ala Gln Ala

405

<210> 143

<211> 405

<212> PRT

<213> Gordona hydrophobica

<400> 143

Met Thr Asp Asn Arg Leu Pro Val Thr Val Leu Ser Gly Phe Leu Gly

1 5 1015

Ala Gly Lys Thr Thr Leu Leu Asn Arg Val Leu His Asn Arg Asp Gly

202530

Arg Arg Ile Ala Val Val Val Asn Asp Met Ser Glu Val Asn Ile Asp

354045

Ser Ala Glu Ile Glu Arg Glu Val Thr Leu Ser Arg Ser Gln Glu Lys

505560

Ile Val Glu Met Ser Asn Gly Cys Ile Cys Cys Thr Leu Arg Glu Asp

65707580

Leu Leu Val Glu Ile Thr Glu Leu Ala Ala Lys Gly Ser Phe Asp Tyr

859095

Leu Leu Ile Glu Ser Ser Gly Ile Ser Glu Pro Leu Pro Val Ala Glu

100 105 110

Thr Phe Thr Phe Val Asp Thr Asp Gly Asn Ala Leu Ser Asp Val Ala

115 120 125

Arg Leu Asp Thr Met Val Thr Val Val Asp Gly Tyr Ser Phe Leu Arg

130 135 140

Asp Phe Arg Ser Gly Gly Asp Ile Val Ala Glu Ala Pro Glu Asp Gln

145 150 155 160

Arg Asp Leu Ser Asp Leu Leu Val Asp Gln Val Glu Phe Ala Asp Val

165 170 175

Ile Leu Val Ser Lys Ala Asp Leu Ile Asn Ala Ala Glu Leu Ala Glu

180 185 190

Leu Thr Ala Val Leu Arg Ser Leu Asn Ala Thr Ala Arg Ile Glu Pro

195 200 205

Met Ile Asp Gly Asp Val Pro Leu Asp Thr Ile Met Asp Thr Gly Arg

210 215 220

Phe Ser Leu Val Lys Ala Ala Gln Ala Pro Gly Trp Leu Gln Glu Leu

225 230 235 240

Arg Gly Thr His Ile Pro Glu Thr Leu Glu Tyr Gly Val Ser Ser Ala

245 250 255

Val Tyr Arg Glu Arg Ala Pro Phe His Pro Val Arg Phe His Asp Phe

260 265 270

Leu Thr Ala Glu Trp Thr Asn Gly Val Leu Leu Arg Ala Lys Gly Tyr

275 280 285

Phe Trp Asn Ala Ala Arg Met Thr Glu Ile Gly Ser Val Ser Gln Ala

290 295 300

Gly His Leu Ile Arg His Gly Tyr Ile Gly Arg Trp Trp Gln Phe Leu

305 310 315 320

Pro Pro Ser Tyr Trp Pro Asp Asp Glu Glu Arg Arg Thr Ala Ile Leu

325 330 335

Glu Lys Trp Glu Asp Pro Val Gly Asp Cys Arg Gln Glu Ile Val Phe

340 345 350

Ile Gly Gln Gly Ile Asp Trp Asp Val Leu Phe Ala Ala Leu Asp Ala

355 360 365

Cys Leu Leu Thr Gln Glu Glu Ile Glu Leu Gly Pro Asp Ala Trp Glu

370 375 380

Gln Trp Pro Asp Pro Leu Gly Asp Gly Asp Ala Ala Gly Val Thr Ser

385 390 395 400

Lys Ile Ala Gln Ala

405

<210> 144

<211> 146

<212> PRT

<213> Pseudomonas marginalis

<400> 144

Met Asn Thr Ser Met Arg His Asp Tyr Lys Ala Val Gly Leu Pro Leu

1 5 1015

Asp Asp Glu Gly Pro Val Phe Asp Lys Pro Trp Gln Ala Gln Ala Phe

202530

Ser Leu Leu Val His Leu His Gln Ala Gly Val Phe Pro Trp Lys Asp

354045

Trp Val Gln Val Phe Ser Glu Glu Ile Lys Ala Ala Pro Ala Gln Pro

505560

Gly Glu Gly Val Asn Asp Ala Tyr Tyr Arg Gln Trp Ile Thr Ala Met

65707580

Glu Arg Met Val Thr Thr Leu Gly Leu Thr Gly Met Glu Asp Ile Val

859095

Gln Arg Gly Glu Glu Trp Arg Gln Ala Tyr Leu Asn Thr Pro His Gly

100 105 110

Gln Pro Val Val Leu Leu Asn Ala Ser Cys Pro Pro Ala His Gly His

115 120 125

Thr Gly Glu His Leu Pro His Arg Glu Pro Val Ala Ile Ser Arg Ala

130 135 140

Ser Asn

145

<210> 145

<211> 399

<212> PRT

<213> Rhodococcus erythropolis

<400> 145

Met Val Asp Thr Arg Leu Pro Val Thr Val Leu Ser Gly Phe Leu Gly

1 5 1015

Ala Gly Lys Thr Thr Leu Leu Asn Glu Ile Leu Arg Asn Arg Glu Gly

202530

Arg Arg Val Ala Val Ile Val Asn Asp Met Ser Glu Ile Asn Ile Asp

354045

Ser Ala Glu Val Glu Arg Glu Ile Ser Leu Ser Arg Ser Glu Glu Lys

505560

Leu Val Glu Met Thr Asn Gly Cys Ile Cys Cys Thr Leu Arg Glu Asp

65707580

Leu Leu Ser Glu Ile Ser Ala Leu Ala Ala Asp Gly Arg Phe Asp Tyr

859095

Leu Leu Ile Glu Ser Ser Gly Ile Ser Glu Pro Leu Pro Val Ala Glu

100 105 110

Thr Phe Thr Phe Ile Asp Thr Asp Gly His Ala Leu Ala Asp Val Ala

115 120 125

Arg Leu Asp Thr Met Val Thr Val Val Asp Gly His Ser Phe Leu Arg

130 135 140

Asp Tyr Thr Ala Gly Gly Arg Val Glu Ala Asp Ala Pro Glu Asp Glu

145 150 155 160

Arg Asp Ile Ala Asp Leu Leu Val Asp Gln Ile Glu Phe Ala Asp Val

165 170 175

Ile Leu Val Ser Lys Ala Asp Leu Val Ser His Gln His Leu Val Glu

180 185 190

Leu Thr Ala Val Leu Arg Ser Leu Asn Ala Ser Ala Ala Ile Val Pro

195 200 205

Met Thr Leu Gly Arg Ile Pro Leu Asp Thr Ile Leu Asp Thr Gly Leu

210 215 220

Phe Ser Leu Glu Lys Ala Ala Gln Ala Pro Gly Trp Leu Gln Glu Leu

225 230 235 240

Gln Gly Glu His Ile Pro Glu Thr Glu Glu Tyr Gly Ile Gly Ser Val

245 250 255

Val Tyr Arg Glu Arg Ala Pro Phe His Pro Gln Arg Leu His Asp Phe

260 265 270

Leu Ser Ser Glu Trp Thr Asn Gly Lys Leu Leu Arg Ala Lys Gly Tyr

275 280 285

Tyr Trp Asn Ala Gly Arg Phe Thr Glu Ile Gly Ser Ile Ser Gln Ala

290 295 300

Gly His Leu Ile Arg His Gly Tyr Val Gly Arg Trp Trp Lys Phe Leu

305 310 315 320

Pro Arg Asp Glu Trp Pro Ala Asp Asp Tyr Arg Arg Asp Gly Ile Leu

325 330 335

Asp Lys Trp Glu Glu Pro Val Gly Asp Cys Arg Gln Glu Leu Val Phe

340 345 350

Ile Gly Gln Ala Ile Asp Pro Ser Arg Leu His Arg Glu Leu Asp Ala

355 360 365

Cys Leu Leu Thr Thr Ala Glu Ile Glu Leu Gly Pro Asp Val Trp Thr

370 375 380

Thr Trp Ser Asp Pro Leu Gly Val Gly Tyr Thr Asp Gln Thr Val

385 390 395

技术分类

06120115919169