掌桥专利:专业的专利平台
掌桥专利
首页

烷醇酰胺及酰胺胺的微生物生产及其用途

文献发布时间:2023-06-19 10:19:37



本申请是申请日为2013年3月12日、发明名称为“烷醇酰胺及酰胺胺的微生物生产及其用途”的中国发明专利申请No.201380026545.3的分案申请。

相关申请的交叉引用

本申请要求美国临时申请号61/623,711(提交于2012年4月13日)的权益,其全部公开内容通过引用并入本文。

序列表

本申请包含序列表,其已经通过EFS-Web以ASCII形式提交并且通过引用将其全部并入本文。所述ASCII拷贝在2013年3月11日生成,名称为LS00041PCT_SL.txt并且大小为69,769字节。

发明领域

本发明公开涉及微生物体,所述微生物体经基因工程化而表达酶,从而当在碳源存在下进行培养时产生脂肪酰胺。

发明背景

脂肪酰胺是动植物脂质中的内源组分,其具有广泛的生物化学及生理学功能(Bachur等人(1965)J.Biol.Chem.240:1019-1024)。内源脂肪酰胺如N-棕榈酸乙醇胺(PEA)、N-花生四烯乙醇胺(anandamide)、N-油酰乙醇胺(OEA)以及N-花生四烯多巴胺(NADA)在中枢及周围神经系统中起信号传导分子的作用(见例如Tan等人(2006)AAPS J.8(3):E461-E465;和Lo Verme等人(2004)Mol.Pharmacol.67(1):15-19)。有研究表明PEA发挥抗炎及抗伤害感受的活性,用来治疗疼痛的PEA药物制剂可在欧洲购得,商标名为NORMAST(Petrosino等人(2010)Biochimie 92(6):724-7;及Bacci等人(2011)ISRNSurgery,2011期,文章ID 917350,6页;doi:10.5402/2011/917350)。

脂肪酰胺如脂肪烷醇酰胺和脂肪氨基酰胺也有广泛的非药用商业用途。脂肪烷醇酰胺和脂肪氨基酰胺在个人护理产品(例如香波、沐浴露和洁面乳)、化妆品制剂(例如腮红、睫毛膏和唇膏)以及家用清洁产品(例如洗衣剂、餐具洗洁精和表面清洁组合物)的生产中用作起泡剂、表面活性剂或其中间产物。脂肪烷醇酰胺和脂肪氨基酰胺也可用作燃料添加剂。据估计,每年全球市场要消耗100,000吨的烷醇酰胺(Adlercreutz等人(2010)Industrial Biotechnology 6(4):204-211)。

用于商业用途的脂肪烷醇酰胺的经典生产方法是通过来源于原料如天然油类或脂肪及原油的脂肪酸或脂肪酸甲酯与链烷醇胺进行有机合成反应进行的,该过程成本消耗大(Adlercreutz等人,同上,以及Frost&Sullivan,“Nonionic Surfactants in theIndustrial Triad”(2002))。例如,可通过来源于椰子油的棕榈酰脂肪酸与单乙醇胺发生Schotten-Baumann反应生产PEA,如下所示:

脂肪链烷醇胺也已经可以通过生物合成而生产。例如,OEA可由磷脂酰乙醇胺(PE)和sn-1-油酰-磷脂酰胆碱(PC)前体经由两种酶过程生产,其中将PE和sn-1-油酰-PC在N-乙酰基转移酶的存在下反应形成N-乙酰磷脂酰乙醇胺(NAPE),然后将后者与溶-PC组合并与NAPE特异性的磷酸酯酶D反应形成OEA和磷脂酸(见Astarita等人(2006)Am.J.Physiol.Regul.Integr.Comp.Physiol 290:R1407-R1412)。

这些方法以及本领域其他已知的用于脂肪酰胺合成的方法常常包括效率低下的反应步骤,因此在经济和环境两个角度来看都是很昂贵的。因此,需要改进的方法和反应剂用于生产脂肪酰胺,其中脂肪链的长度和饱和度以及酰胺头部基团的类型可得到有效的控制。

发明概述

本发明公开的一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源的存在下培养。在本文中,所述微生物体经基因工程化以表达编码如下多肽的核酸序列,当所述微生物体在碳源存在下进行培养时,所述多肽催化伯胺和酰基硫酯转化为脂肪酰胺。在一个实施方式中,碳源是碳水化合物。在另一种实施方式中,所述多肽为棕榈酰腐胺合酶(PPS)多肽。在另一个实施方式中,所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。

本发明公开的另一方面提供了棕榈酰腐胺合酶(PPS)多肽,其具有SEQ ID NO:1的氨基酸序列。在一个实施方式中,PPS多肽包括与SEQ ID NO:1的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。在另一个实施方式中,PPS多肽由包含SEQ ID NO:2的核酸序列的核酸所编码。

本发明公开的另一方面提供了N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽,其具有SEQ ID NO:3的氨基酸序列。在一个实施方式中,AhtS多肽包括与SEQ ID NO:3的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。在另一个实施方式中,AhtS多肽由包含SEQID NO:22的核酸序列的核酸所编码。

另外,本发明公开的另一方面提供了重组微生物体,其中伯胺包括但不限于3-二甲氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基-1,3-丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、和丁胺、1,4-二氨基丁烷或、其组合。

此外,本发明公开的另一方面提供了重组微生物体,其中的酰基硫酯是脂肪酰基-ACP或脂肪酰基-CoA。所述脂肪酰基-ACP或脂肪酰基-CoA由所述微生物产生。

本发明公开进一步包括重组微生物,其包括编码脂肪酸生物合成多肽、硫酯酶多肽(EC 3.1.2.14或EC 3.1.1.5)和酰基-CoA合酶多肽(EC2.3.1.86)中的一种或多种的核酸序列。在一个实施方式中,编码硫酯多肽的核酸序列为tesA。在另一个实施方式中,编码酰基-CoA合酶多肽的核酸序列为fadD。在另一个实施方式中,所述微生物体包括编码脂肪酸合成多肽的核酸序列,所述多肽包括但不限于accABCD、FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI和/或FadR。

本发明公开进一步包括微生物体,其包括但不限于细菌、蓝细菌、藻类和真菌。在一个实施方式中,所述细菌为大肠杆菌(E.Coli)。在另一个实施方式中,所述真菌为酵母或丝状真菌。在另一个实施方式中,微生物体包括但不限于酿酒酵母(Saccharomycescerevisiae)、解脂假丝酵母(Candida lipolytica)、大肠埃希氏菌(Escherichia coli)、节杆菌(Arthrobacter)、红酵母(Rhodotorula glutinins)、不动杆菌(Acinetobacter)、解脂假丝酵母(Candida lipolytica)、布朗葡萄藻(Botryococcus braunii)、弗尼斯弧菌(Vibrio furnissii)、藤黄微球菌(Micrococcus leuteus)、嗜麦芽寡养单胞菌(Stenotrophomonas maltophilia)、枯草芽孢杆菌(Bacillus subtilis),地衣芽孢杆菌(Bacillus lichenoformis)、恶臭假单胞菌(Psuedomonus putida)、荧光假单胞菌(Psuedomonas florescens)、天蓝色链霉菌(Streptomyces coelicolor)、聚球藻属物种PCC7002(Synechococcus sp)、细长嗜热蓝细菌BP-1(Thermosynechococcus elongatus)、桑椹型无绿藻(Prototheca moriformis)、克鲁格尼原藻(Prototheca krugani)、大型无绿藻(Prototheca stagnora)、中型无绿藻(Prototheca zopfii)或原壳小球藻(Chorellaprotothecoide)细胞。在另一个实施方式中,所述微生物体包括但不限于节杆菌AK 19(Arthrobacter AK 19)、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。

本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是内源的。

本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。

另外,本发明的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的酶的核酸序列。在一个实施方式中,所述脂肪酰胺为脂肪烷醇酰胺和/或脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C14、C16和/或C18脂肪烷醇酰胺和/或C14、C16或C18脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺和/或C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。

另外,本发明公开的另一方面提供了重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体表达了一种丝氨酸脱羧酶多肽。

本发明公开进一步包含生产脂肪酰胺的方法,其包括:(a)提供重组微生物体,其包括编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列;以及(b)将所述重组微生物体在适合于编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列表达的条件下在存在至少一种多肽底物的培养基中培养。该方法进一步包括从培养基中分离脂肪酰胺。该方法可用于生产脂肪酰胺。在一个实施方式中,所述脂肪酰胺为脂肪烷醇酰胺和/或脂肪酰胺胺。在另一个实施方式中,所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺和/或C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。

附图简述

结合阐述了优选实施方式的附图阅读时,能最好地理解本发明。然而要理解的是,本发明公开不限于图中公开的特定实施方式。

图1是以编码棕榈酰腐胺合酶(PPS)的表达载体转化的大肠杆菌MG1655菌株DG5在乙醇胺存在下进行培养时产生的脂肪品种的代表性气象色谱-质谱(GC-MS)色谱图。上图描述了具有GC保留时间为13.1min的峰,其在下图描述的MS分析中被鉴定为N-棕榈酰乙醇胺。

图2A-2D是用N,O-双(三甲基硅烷基)-三氟乙酰胺(BSTFA)衍生化后得到的N-棕榈酰乙醇胺产物的GC-MS色谱图。图2A描述了有GC保留时间为13.3min的峰,其在图2E中描述的MS分析中被鉴定为三级甲硅基(TMS)-保护的N-棕榈酰乙醇胺。图2B-2D分别为单独BSTFA、未进行BSTFA衍生化的N-棕榈酰乙醇胺及空白反应的对照色谱图。

图3是以编码PPS的表达载体转化的大肠杆菌MG1655菌株DG5在3-二甲氨基-1-丙胺存在下进行培养时产生的脂肪N-(3-二甲氨基-1-丙胺)胺的GC-MS色谱图。

图4描述了在所示伯胺原料存在下获自以编码PPS的表达载体转化的大肠杆菌MG1655细胞的脂肪酰胺产物。

图5是以编码N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)的表达载体转化的大肠杆菌MG1655菌株在3-二甲氨基-1-丙胺存在下进行培养时产生的脂肪品种的代表性GC-MS色谱图。上图描述了具有GC保留时间为11.4min的峰,其在下图描述的MS分析中被鉴定为C14:0脂肪N-(3-二甲氨基-1-丙胺)。

图6为可根据本发明公开的方法进行遗传修饰的生物代谢途径的示意图。

发明详述

天然抗生素棕榈酰腐胺可由表达棕榈酰腐胺合酶(PPS)(GenBank登录号AAV33349.1(下文称为“AAV33349”))(SEQ ID NO:1)的细菌产生,PPS由GenBank登录号AY632377.1(后改为“AY632377”)(SEQ ID NO:2)(Brady等人(2004)J.Nat.Prod.67:1283-1286)的核酸序列所编码。证明AY632377编码的PPS在大肠杆菌中过表达时只产生一种主要的丁二胺的N-酰基衍生物(1,4-二氨基丁烷),即棕榈酰腐胺(Brady等人,同上)。编码N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)(GeneBank登录号ACX33975.1)(SEQ ID NO:3)的同源物与PPS的氨基酸序列具有38%的同一性的氨基酸序列。来自未经培养的细菌RM44的N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)基因(GenBank GQ869386)显示于(SEQ ID NO:22)。

本发明公开至少部分基于这样的发现,即表达PPS或AhtS的微生物体(例如细菌)可在碳源存在下进行培养时由酰基硫酯前体产生脂肪酰胺。不希望受到理论的限制,认为PPS直接催化酰基硫酯和伯胺之间的酰胺化。这是微生物体第一次经特异性基因工程化而表达酶如PPS或AhtS以产生脂肪酰胺。这一点是有优势的,因为由此得到的微生物体起到便捷的生物工厂的作用,生成所需链长度的脂肪酰胺,包括分支或不分支的形式。此外,出于灵活性的目的,可交换使用多种不同原料(例如,玉米、甘蔗、甘油、柳枝稷)为微生物体提供必需的碳源。这样,可将微生物体用于按需求生产脂肪酰胺,可通过发酵进行收获,由此超越了仍然依赖于昂贵的天然油类和复杂合成化学的繁琐高成本的现有技术系统。在大量产品的生产中需要脂肪酰胺,这些产品包括但不限于起泡剂、阳离子表面活性剂、用作香波和沐浴产品的中间产物、化妆品和药品中的乳化试剂、燃料添加剂,等等。

本发明公开提供了一种重组微生物体,其经基因工程化以表达编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源存在下进行培养。在一个实施方式中,碳源是碳水化合物。更具体地,微生物体经基因工程化以表达如PPS或AhtS的酶,从而催化任何伯胺(例如乙醇胺、酰胺3-二甲氨基-1-丙胺)与酰基硫酯(例如酰基-CoA或酰基-ACP)之间的酰胺化以生产脂肪酰胺如烷醇酰胺和酰胺胺。这是一个全新的过程,因为迄今为止脂肪烷醇酰胺(例如用于合成椰油酰胺丙基甜菜碱的中间产物)以及酰胺胺都是从原料如天然油类(或脂肪)以及原油通过合成而生产的,这是个效率低下的过程,因为其依赖于原始材料的提纯直至达到期望的材料。相比而言,本发明公开提供了一种生产方法,其中微生物体经基因工程化以表达酶,使得例如烷醇酰胺和脂肪N-(3-二甲氨基-1-丙胺)通过生物化学方法合成,这对于生产脂肪酰胺是非常有效的过程。可将氨基酸或碳水化合物加至微生物体的发酵基质中以提供必需的碳源(见实施例3-7)。备选地,微生物体可经基因工程化而在体内生成其自身的伯胺。例如,可通过遗传地增加丝氨酸的生物合成及丝氨酸的去羧化途径而实现乙醇胺的生物合成(见实施例8)。在酶的催化能力上,AhtS与PPS生成相同的酰胺化合物,但更优选地产生C14:0脂肪硫酯底物。两种酶都属于EC家族2.3.1.X.X。

本发明公开进一步提供了方法在重组微生物体中生产脂肪酰胺。通过此方法生成的脂肪酰胺包括但不限于脂肪烷醇酰胺和脂肪酰胺胺。在一个实施方式中,脂肪酰胺为C14、C16和/或C18脂肪烷醇酰胺。在另一个实施方式中,所述脂肪酰胺为C14、C16和/或C18脂肪酰胺胺。本方法包括步骤(a)提供重组微生物体,其经基因工程化以表达编码多肽如PPS或AhtS的核酸序列,所述多肽催化伯胺和酰基硫酯转化为脂肪酰胺的多肽;以及(b)将所述重组微生物体在适合于多肽表达并存在至少一种多肽底物的条件下培养,由此产生脂肪酰胺。微生物体在碳源存在下进行培养。所述碳源可选自广泛的不同来源,包括但不限于氨基酸、碳水化合物和脂类。在一个实施方式中,碳源为碳水化合物。由微生物体产生的脂肪酰胺可分离自培养液(例如发酵液)。在一个实施方式中,脂肪酰胺可从微生物体的外部环境中分离。在另一个实施方式中,脂肪酰胺可全部或部分地由微生物体自发分泌。在另一个实施方式中,脂肪酰胺可被运输到细胞外环境,可选地其中有一种或多种合适运输蛋白的协助。在另一个实施方式中,脂肪酰胺被动运输进入细胞外环境。

术语“脂肪酰胺”和“烷基酰胺”指的是具有式R

“酰基硫酯”指的是脂肪酸,其通过生产型宿主微生物体的脂肪酸生物合成途径而被“激活”。酰基硫酯可由微生物体内源的脂肪酸生成,或酰基硫酯可通过外源提供给微生物体的脂肪酸生成。酰基硫酯的非限制性实例是酰基-辅酶A(CoA)和酰基-酰基载体蛋白质(ACP)。

术语“酰基-CoA”指的是烷基链的羧基碳和CoA的4'-磷酸泛酰巯基乙胺部分的氢硫基基团之间形成酰基硫酯,其具有式R

术语“脂肪酸”指的是具有式R

脂肪酸的R

在特定实施方式中,支链脂肪酸为异脂肪酸或反异脂肪酸。在示例性实施方式中,支链脂肪酸选自异-C

支链或非支链脂肪酸的R

所述伯胺可以为任何能够作为PPS底物的伯胺,具有式R

R

伯胺的R

除非另有陈述,术语“烷基”自身或作为其他替代物的一部分是直链或支链,或环烃根,或其组合。该定义在“烷基”作为基团的一部分存在时也适用,例如在羟烷基、卤代烷基、氨基烷基、烷基胺、二烷基胺等等中。

除非另有陈述,术语“烷基”自身或作为其他替代物的一部分是直链或支链,或环烃根,或其组合,其包含例如约2-约12个碳原子并含有至少一个碳碳双键。

除非另有陈述,术语“杂环烷基”或“杂环烯基”指的是直链或支链或环烃根,或其组合,由所述数量的碳原子及至少一个选自O、N、Si和S的杂原子构成,其中的氮和硫原子可选地为氧化的,氮杂原子可选地是季铵化的。杂原子O、N、Si和S可处于杂环烷基或杂环烯基基团内部任何位置。R

术语烷基、杂环烷基、烯基和杂环烯基旨在包括指定的根的置换和未置换形式。R

在一些实施方式中,R

R

伯胺可在微生物体中由可发酵碳源产生。例如,单乙醇胺可在体内通过丝氨酸脱羧酶(SDC)由丝氨酸而生成(Rontein等人(2001)J.Biol.Chem.276(38):35523-35529)。在一些实施方式中,微生物体表达内源SDC多肽。在其他实施方式中,微生物体经基因工程化以过表达SDC多肽。

腐胺(1,4-丁二胺)可在体内通过精氨酸脱羧酶(ADC)和精胺脲水解酶(AUH)的作用,由精氨酸而生成,二者分别将精氨酸转化为精胺和将精胺转化为腐胺(Moore等人(1990)J.Bacteriol 172(8):4631-4640)。在一些实施方式中,微生物体表达内源ADC和AUH多肽。在其他实施方式中,微生物体经基因工程化以过表达ADC多肽、AUH多肽或ADC和AUH多肽。在特定实施方式,ADC由来自大肠杆菌MG1655的speA基因表达(GenBank登记号NC_000913)。

伯胺还可外源地提供给微生物体。

适合用于本发明公开的示例性伯胺包括但不限于乙醇胺(单乙醇胺)、3-二甲基氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基1-3丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、丁胺、1,4-二氨基丁烷及其组合。在特定实施方式中,伯胺为3-二甲基氨基-1-丙胺。

适合用于本发明公开的重组微生物体和方法的核酸可以为具有编码如下多肽的序列的任何核酸,在所述核酸得到表达且微生物体在碳源存在下进行培养时,所述多肽能够将伯胺和酰基硫酯转化为脂肪酰胺。

在一个实施方式中,所述多肽为PPS多肽。在特定实施方式中,PPS多肽包含SEQ IDNO:1的氨基酸序列、基本上由SEQ ID NO:1的氨基酸序列组成或由SEQ ID NO:1的氨基酸序列组成,所述SEQ ID NO:1的氨基酸序列即AAV33349的氨基酸序列。在一些实施方式中,PPS多肽是由包含SEQ ID NO:2的核酸序列的核酸序列所编码。在其他实施方式中,PPS多肽为具有SEQ ID NO:1的氨基酸多肽的PPS多肽的同源物。PPS多肽优选地包含如下氨基酸序列、基本上由如下氨基酸序列组成或由如下氨基酸序列组成,所述氨基酸序列与SEQ ID NO:1的氨基酸多肽由至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的同一性。

在其他实施方式中,所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。在特定实施方式中,AhtS多肽包含SEQ ID NO:3的氨基酸序列、基本上由SEQ ID NO:3的氨基酸序列组成或由SEQ ID NO:3的氨基酸序列组成,所述SEQ ID NO:3的氨基酸序列即GenBank登录号ACX33975的氨基酸序列。在一些实施方式中,AhtS多肽是由包含SEQ ID NO:22的核酸序列的核酸序列所编码。在其他实施方式中,AhtS多肽为具有SEQ ID NO:3的氨基酸序列的AhtS多肽的同源物。AhtS多肽优选地包含如下氨基酸序列、基本上由如下氨基酸序列组成或由如下氨基酸组成,所述氨基酸序列与SEQ ID NO:3的氨基酸序列有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的同一性。

在特定实施方式中,催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对于微生物体是内源的。在这些实施方式中,重组微生物体经基因工程化以过表达催化伯胺和酰基硫酯转化为脂肪酰胺的内源多肽。

在其他实施方式中,催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。在这些实施方式中,重组微生物体经基因工程化以表达催化伯胺和酰基硫酯转化为脂肪酰胺的外源多肽。例如,可将编码外源多肽的外源核酸通过标准分子生物学步骤整合入微生物体。为微生物体提供碳源可使微生物体增加脂肪酰胺的产量。

如本文所使用的,术语“同源物”、“同源”和“同源的”指的是与相应的多核苷酸或多肽具有至少约70%的同源性的多核苷酸或多肽。本领域一般技术人员熟知确定两个或更多个序列之间同源性的方法。例如,序列的比较及两条序列之间同源百分比的确定可通过使用数学算法而完成,例如通过基本局部比对搜索工具(Basic Local Alignment SearchTool,BLAST)(Altschul等人(1990)J.Mol.Biol.215(3):403-410)。

术语“多核苷酸”指的是DNA或RNA的多聚物,其可以为单链或双链的,且其能够含有非天然或经改变的核苷酸。术语“多核苷酸”、“核酸”和“核酸分子”在本文中交换使用,指的是任何长度的核苷酸的多聚物形式,可以是核糖核苷酸(RNA)或脱氧核糖核苷酸(DNA)。

术语“多肽”和“蛋白质”指氨基酸残基的多聚物。术语“重组多肽”指的是通过重组DNA技术产生的多肽,其中编码表达的蛋白质或RNA的DNA通常被插入合适的表达载体,后者进而用于转化宿主细胞以产生所述多肽或RNA。

在本发明公开的组合物和方法中,可通过改变重组微生物体中一种或多种参与脂肪酸产生、降解和/或分泌的基因表达来增强所期望的脂肪酸或其酰基硫酯衍生物的生产。

在一些实施方式中,所述重组微生物体包含编码脂肪酸生物合成多肽的核酸序列。如本文所使用的,术语“脂肪酸生物合成多肽”指的是任何参与脂肪酸生物合成的多肽。宿主细胞中的脂肪酸生物合成途径使用前体乙酰-CoA和丙二酰-CoA。该途径中的步骤是通过脂肪酸生物合成(fab)及乙酰-CoA羧化酶(acc)基因家族的酶催化完成的(见例如,Heath等人(2001)Prog.Lipid Res.40(6):467-497)。乙酰-CoA被乙酰-CoA羧化酶(EC 6.4.1.2)羧化形成丙二酰-CoA。乙酰-CoA羧化酶(EC6.4.1.2)在大多数真核细胞中是一种多亚基酶,由四个独立的基因编码(accA、accB、accC和accD)。在一些细菌如谷氨酸棒杆菌(Corynebacterium glutamicus)中,乙酰-CoA羧化酶包括两个亚基:AccDA[YP_225123.1]和AccBC[YP_224991],其分别由accDA和accBC编码。根据所期望的脂肪酸或脂肪酸衍生产物,可在基因工程化宿主细胞中对特定的fab和/或acc基因(或其组合)进行过表达、修饰、弱化或删除。

在一些实施方式中,编码脂肪酸生物合成多肽的核酸序列编码accABCD。在其他实施方式中,编码脂肪酸生物合成多肽的核酸序列编码FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI或来自另一种生物体的Fab的功能性同源物,如FabV。适合用于本发明公开组合物和方法的脂肪酸生物合成多肽的示例性GenBank登录号包括FabD(AAC74176)、FabH(AAC74175)、FabG(AAC74177)、FabB(P0A953)、FabA(ACY27485.1)、FabZ(ACY27493.1)、FabF(AAC74179)和FabI(NP_415804)。

在一些实施方式中,重组微生物体包含编码两种或更多(例如3种或更多、4种或更多)生物合成多肽(例如accABCD和FabD;FabD、FabH和FabG;或FabI、FabG,H,D、FabA,B和FabZ)的核酸序列。

FadR是参与脂肪酸降解和脂肪酸生物合成途径的转录因子(Cronan等人(1998)Mol.Microbiol.29(4):937-943)。已知FadR调制多种基因的表达和/或活性,所述基因包括fabA、fabB、iclR、fadA、fadB、fadD、fadE、fadI、fadJ、fadL、fadM、uspA、aceA、aceB以及aceK。FadR靶标基因编码的多肽的示例性GenBank登录号包括fabA(NP_415474)、fabB(BAA16180)、(NP_418442)、fadA(YP_026272.1)、fadB(NP_418288.1)、fadD(AP_002424)、fadE(NP_414756.2)、fadI(NP_416844.1)、fadJ(NP_416843.1)、fadL(AAC75404)、fadM(NP_414977.1)、uspA(AAC76520)、aceA(AAC76985.1)、aceB(AAC76984.1)和aceK(AAC76986.1)。

在一些实施方式中,重组微生物体包括编码脂肪酸生物合成多肽的核酸序列,并且所述核酸序列编码FadR。在特定实施方式中,该核酸序列编码来自大肠杆菌MG1655的FadR(NP_415705)。

硫酯酶(EC 3.1.2.14或EC 3.1.1.5)水解酰基-ACP硫酯得到脂肪酸。可通过修饰所选择的硫酯酶的表达而选择硫酯底物的链长度。在特定实施方式中,宿主细胞经基因工程化以表达、过表达、减弱表达或不表达一种或多种所选的硫酯酶以增加优选脂肪酸衍生物底物的产量。例如,可通过表达具有生产C

其表达可在本发明公开的组合物和方法中改变的硫酯酶基因(及相应GenBank登录号)的非限制性实例包括来自大肠杆菌的无前导序列的tesA(‘tesA)(AAC73596)、来自大肠杆菌的tesB(AAC73555)、来自加州月桂(Umbellularia california)的fatB(Q41635、AAA34215)、来自萼距花(Cuphea hookeriana)的fatB2(AAC49269)、来自萼距花的fatB3(Q39513;AAC72881)、来自香樟(Cinnamonum camphorum)的fatB(Q39473、AAC49151)、来自拟南芥(Arabidopsis thaliana)的fatB[M141T](CAA85388)(Mayer等人(2007)BMC PlantBiology 7:1-11)、来自拟南芥的fatA(NP 189147;NP 193041)、来自大豆根瘤菌(Bradyrhiizobium japonicum)的fatA(CAC39106)、来自萼距花的fatAAAC72883)以及来自向日葵(Helianthus annus)的fatA1(AAL79361)。

在特定实施方式中,重组微生物体包括编码硫酯酶的核酸序列,并且所述核酸序列为来自大肠杆菌MG1655的‘tesA’(AAC73596)。

酰基-CoA合酶(EC 2.3.1.86)通过催化酰基-CoA硫酯的形成而激活脂肪酸。其表达可在本发明公开的组合物和方法中改变的酰基-CoA合酶基因的非限制性实例包括fadD、fadK、BH3103、yhfL、Pfl-4354、EAV15023、fadD1、fadD2、RPC_4074、fadDD35、fadDD22、faa3p或编码蛋白质ZP_01644857的基因。酰基-CoA合酶基因的具体实例包括来自结核分枝杆菌(M.tuberculosis)H37Rv的fadDD35[NP_217021]、来自结核分枝杆菌H37Rv的fadDD22[NP_217464]、来自大肠杆菌的fadD[NP_416319]、来自大肠杆菌的fadK[YP_416216]、来自不动杆菌属物种ADP1的fadD[YP_045024]、来自流感嗜血杆菌(Haemophilus influenza)RdkW20的fadD[NP_438551]、来自沼泽红假单胞菌(Rhodopseudomonas palustris)Bis B18的fadD[YP_533919]、来自嗜碱芽孢杆菌(Bacillus halodurans)C-125的BH3101[NP_243969]、来自荧光假单胞菌Pfo-1的Pfl-4354[YP_350082]、来自睾丸酮丛毛单胞菌(Comamonastestosterone)KF-1的EAV15023[ZP_01520072]、来自枯草芽孢杆菌的yhfL[NP_388908]、来自铜绿假单胞菌(P.aeruginosa)PAO1的fadD1[NP_251989]、来自青枯雷尔氏菌(Ralstoniasolanacearum)GM1 1000的fadD1[NP_520978]、来自铜绿假单胞菌PAO1的fadD2[NP_251990]、编码来自嗜麦芽寡养单胞菌R551-3的蛋白质ZP_01644857的基因、来自酿酒酵母的faa3p[NP_012257]、来自酿酒酵母的faa1p[NP_014962]、来自枯草芽孢杆菌的lcfA[CAA99571]以及在如下文献中描述的基因:Shockey等人(2002)Plant.Physiol.129:1710-1722);Caviglia等人(2004)J.Biol.Chem.279:1163-1169);Knoll等人(1994)J.Biol.Chem.269(23):16348-56);Johnson等人(1994)J.Biol.Chem.269:18037-18046);以及Black等人(1992)J.Biol.Chem.267:25513-25520)。

在一些实施方式中,重组微生物体包含编码酰基-CoA合酶多肽的核酸序列,并且所述酰基-CoA合酶多肽为来自大肠杆菌MG1655的FadD[NP_416319]。

所述重组微生物体可包含编码脂肪酸生物合成多肽、硫酯酶多肽及酰基-CoA合酶多肽的任意组合的核酸。在特定实施方式中,微生物体包含编码硫酯酶多肽的核酸序列以及编码酰基-CoA合酶多肽的核酸序列。

本领域一般技术人员会理解,根据不同目的(例如所期望的脂肪酸或其酰基硫酯衍生物),可在经基因工程化而含有编码能够转化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的重组微生物体中过表达、修饰、弱化或删除参与脂肪酸代谢的特定基因(或基因组合)。适合用于本发明公开的参与脂肪酸代谢的其他基因的实例在例如美国专利申请出版2011/0162259中有所描述,其全文通过引用并入本文。

在一些实施方式中,所述多肽为本文描述的任意多肽的片段。术语“片段”指的是全长多肽或蛋白质中较短部分,大小范围为四个氨基酸残基到整个氨基酸序列减去一个氨基酸残基。在本发明的特定实施方式中,片段指的是多肽或蛋白质的整条氨基酸序列(例如,底物结合结构域或催化结构域)。

在一些实施方式中,多肽为本文描述的任意多肽的突变体或变体。如本文所使用的,术语“突变体”和“变体”指的是多肽具有的氨基酸序列与野生型多肽至少相差一个氨基酸。例如,突变体可包含以下保守氨基酸置换中的一种或多种:脂肪族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一种脂肪族氨基酸取代;丝氨酸被苏氨酸取代;苏氨酸被丝氨酸取代;酸性残基如天冬氨酸和谷氨酸被另一种酸性残基取代;具有酰胺基团的残基如天冬酰胺和谷氨酰胺被另一种具有酰胺基团的残基取代;碱性残基如精氨酸被另一种碱性残基交换;以及芳香族残基如苯丙氨酸和色氨酸被另一种芳香族残基取代。在一些实施方式中,突变体多肽具有约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多的氨基酸置换、添加、插入或删除。

优选的多肽的片段或突变体保留相应野生型多肽的一些或全部的生物学功能(例如酶活性)。在一些实施方式中,片段或突变体保留相应野生型多肽的至少约75%、至少约80%、至少约90%、至少约95%或至少约98%或更多的生物学功能。在其他实施方式中,片段或突变体保留相应野生型多肽的约100%的生物学功能。确定何种氨基酸可以被置换、插入或删除而不影响生物学活性的指南可使用本领域熟知的计算机程序找到,例如LASERGENE

在其他实施方式中,片段或突变体具有“增加的活性水平”。通过“增加的活性水平”指的是相同条件下,与相应野生型宿主细胞中的生物化学或生物学功能的水平相比,多肽在基因工程化的细胞中具有更高水平的生物化学或生物学功能(例如DNA结合或酶活性)。活性增强程度可以为约10%或更高、约20%或更高、约50%或更高、约75%或更高、约100%或更高、约200%或更高、约500%或更高、约1000%或更高,或为本文的任何范围。

在一些实施方式中,具有改变或修饰的表达水平的多肽或多核苷酸是“过表达的”或具有“增加的表达水平”。如本文所使用的,“过表达”或具有“增加的表达水平”指的是在相同条件下,以比相应野生型细胞中正常表达更高的浓度在基因工程化的细胞中表达或引起表达多核苷酸或多肽。例如,在相同条件下,当多肽在基因工程化的细胞中存在浓度比相同物种非工程改造宿主细胞中的浓度更高时,该多肽可在基因工程化细胞中“过表达”。

在其他实施方式中,具有改变的表达水平的多肽或多核苷酸是“弱化的”或具有“降低的表达水平”。如本文所使用的,“弱化”或“降低的表达水平”指的是在相同条件下,比相应野生型细胞中正常表达更低的浓度在基因工程化的细胞中表达或引起表达多核苷酸或多肽。

过表达或弱化的程度可为1.5-倍或更高、例如2-倍或更高、3-倍或更高、5-倍或更高、10-倍或更高、或者15-倍或更高。备选地或此外地,过表达或弱化的程度可为500-倍或更低、例如,100-倍或更低、50-倍或更低、25-倍或更低、或者20-倍或更低。因此,过表达或弱化的程度介于以上任意两个端点之内。例如,过表达或弱化的程度可以为1.5-500倍、2-50倍、10-25倍或15-20倍。

多核苷酸或多肽可使用本领域已知的方法进行弱化。在一些实施方式中,基因或由基因编码的多肽的表达通过突变控制基因表达的调节性多核苷酸序列而得到弱化。在其他实施方式中,基因或由基因编码的多肽的表达通过过表达抑制子蛋白质或通过提供激活抑制子蛋白质的外源调节元件而弱化。在其他实施方式中,基于DNA或RNA的基因沉默方法被用于弱化基因或多核苷酸的表达。在一些实施方式中,基因或多肽的表达受到完全的弱化,例如通过删除基因多核苷酸序列的全部或一部分。

多核苷酸或多肽可使用本领域已知方法进行过表达。在一些实施方式中,多肽的过表达是通过使用外源调节元件实现的。术语“外源调节元件”通常指的是源自宿主细胞以外的调节元件。然而,在特定实施方式中,术语“外源调节元件”可以指代来源于宿主细胞的调节元件,其功能可得到复制或改变以用于控制内源多肽表达的目的。例如,如果重组微生物体为大肠杆菌细胞,其包含编码脂肪酸生物合成多肽的核酸序列,且所述脂肪酸生物合成多肽是由内源fadR基因编码的FadR,则内源fadR的表达可由来源于另一种大肠杆菌基因的启动子控制。

在一些实施方式中,外源调节元件是化学化合物如小分子。如本文所使用的,术语“小分子”指的是分子量小于约1,000g/mol的物质或化合物。

在一些实施方式中,控制核酸序列表达的外源调节元件是表达控制序列,其可操作地连接于所述核酸序列。表达控制序列在本领域中已知,并且包括例如启动子、增强子、多聚腺苷酸化信号、转录终止子、内部核糖体进入位点(IRES)、核糖体结合位点(RBS)等等,其在宿主细胞中提供了核酸序列的表达。表达控制序列与参与转录的细胞蛋白质特异性地相互作用(Maniatis等人(1987)Science 236:1237-1245)。示例性表达控制序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology,Vol.185,AcademicPress,San Diego,Calif.(1990)中。

通过“可操作地连接”指的是核酸序列和表达控制序列以这样的方式相连,使得恰当的分子(例如转录激活子蛋白质)结合于表达控制序列时则允许基因表达进行。可操作地连接的启动子相对于转录和翻译的方向位于所选核酸序列上游。可操作地连接的增强子可位于所选核酸序列的上游、内部或下游。

在一些实施方式中,通过重组载体向宿主细胞提供所述核酸序列,所诉重组载体包含可操作地连接于多核苷酸序列的启动子。在特定实施方式中,启动子为可诱导的、组成型的或细胞器特异性的启动子。在特定实施方式中,使用本领域已知方法将表达控制序列用同源重组方式整合入宿主细胞基因组,而将所述表达控制序列可操作地连接于内源核酸序列(例如,Datsenko等人(2000)Proc.Natl.Acad.Sci.U.S.A.97(12):6640-6645)。

如本文所使用的,术语“载体”指的是能够转运与之相连的其他核酸序列的核酸分子。一种有用的载体类型为附加体(即,能够进行染色体外复制的核酸)。可用的载体为能够使得其连接的核酸进行自主复制和/或表达的载体。能够指导与其可操作地连接的基因表达的载体在本文称为“表达载体”。通常,在重组DNA技术中有用的表达载体常常为“质粒”形式,其通常指环状双链DNA环,其为载体形式是不结合于染色体。然而,还包括其他形式的表达载体,其起到等价的功能并随后在本领域为人所知。

在一些实施方式中,重组载体包含至少一条选自以下的序列:(a)可操作地偶联于核酸序列的表达控制序列;(b)可操作地偶联于核酸序列的选择标记物;以及(c)可操作地偶联于核酸序列的靶向序列。

本领域技术人员清楚的是,表达载体的设计可取决于这些因素,如代转化宿主细胞的选择、期望的多肽表达水平等等。本文描述的表达载体可被引入宿主细胞以产生由本文描述的多核苷酸序列编码的多肽,包括融合多肽。

用于原核和真核细胞的合适的表达系统在本领域熟知;见例如Sambrook等人,“Molecular Cloning:A Laboratory Manual,”第二版,Cold Spring Harbor Laboratory(1989)。可诱导的非融合大肠杆菌载体的实例包括pTrc(Amann等人(1988)Gene 69:301-315)和PET11d(Studier等人,Gene Expression Technology:Methods in Enzymology185,Academic Press,San Diego,CA,pp.60-89(1990))。在特定实施方式中,本发明公开的多核苷酸序列可操作地连接于来源于细菌噬菌体T5的启动子。用于在酵母中进行表达的载体的实例包括pYepSec1(Baldari等人(1987)EMBO J.6:229-234)、pMFa(Kurjan等人(1982)Cell 30:933-943)、pJRY88(Schultz等人(1987)Gene 54:113-123)、pYES2(InvitrogenCorp.,San Diego,CA)和picZ(Invitrogen Corp.,San Diego,CA)。

可经由常规转化或转染技术将载体引入原核或真核细胞中。如本文所使用的,术语“转化”和“转染”指代用于将外部核酸(例如DNA)引入宿主细胞的广泛的本领域认可的技术,包括磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂质体转染或电穿孔。用于转化或转染宿主细胞的合适方法以及筛选摄取载体的细胞的方法可见于例如Sambrook等人(同上)。

“重组微生物体”是用于生产本文描述的产物(例如脂肪酰胺)的宿主细胞。重组微生物体在本文也称为“重组宿主细胞”、“基因工程化的生物体”或“基因工程化的宿主细胞”,是这样的宿主细胞,其中在相同条件下,一种或多种核酸或多肽的表达相比于其在对应的野生型宿主细胞中的表达得到改变或修饰。在本文描述的公开的任意方面,所述宿主细胞可包括但不限于细菌细胞、蓝细菌细胞、藻类细胞和真菌细胞(包括丝状真菌细胞或酵母细胞)。

在一些实施方式中,宿主细胞为革兰氏阳性细菌细胞。在其他实施方式中,宿主细胞为革兰氏阴性细菌细胞。

在一些实施方式中、宿主细胞选自以下属:埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、曲霉属(Aspergillus)、木霉属(Trichoderma)、脉抱菌属(Neurospora)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维酵母菌属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、蚀丝霉属(Myceliophtora)、青霉属(Penicillium)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金黄孢子菌属(Chrysosporium)、酵母属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、聚球藻属(Synechococcus)、耶氏酵母属(Yarrowia)或链霉菌属(Streptomyces)。

在特定实施方式中,宿主细胞为酿酒酵母、解脂假丝酵母、大肠埃希氏菌、节杆菌、红酵母、不动杆菌、解脂假丝酵母、布朗葡萄藻、弗尼斯弧菌、藤黄微球菌、嗜麦芽寡养单胞菌、枯草芽孢杆菌,地衣芽孢杆菌、恶臭假单胞菌、荧光假单胞菌、天蓝色链霉菌、桑椹型无绿藻、克鲁格尼原藻、大型无绿藻、中型无绿藻或原壳小球藻细胞。

在一些实施方式中,宿主细胞为节杆菌AK 19、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。

在其他实施方式中,宿主细胞为迟缓芽孢杆菌(Bacillus lentus)细胞、短芽孢杆菌(Bacillus brevis)细胞、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)细胞、地衣芽孢杆菌(Bacillus lichen formis)细胞、嗜碱芽孢杆菌(Bacillus alkalophilus)细胞、凝结芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus thuringiensis)细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌(Bacillus megaterium)细胞或解淀粉芽孢杆菌(Bacillus amyloliquefaciens)细胞。

在其他实施方式中,宿主细胞为康氏木霉(Trichoderma koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉(Trichoderma reesei)细胞、长枝木霉(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillusoryzae)细胞、特异腐质霉(Humicola insolens)细胞、棉毛状腐质霉(Humicolalanuginose)细胞、混浊红球菌(Rhodococcus opacus)细胞、米黑根毛霉(Rhizomucormiehei)细胞或米黑毛霉(Mucor michei)细胞。

在其他实施方式中,宿主细胞为浅青紫链霉菌(Streptomyces lividans)细胞或鼠灰链霉菌(Streptomyces murinus)细胞。

在其他实施方式中,所述宿主细胞是放线菌属(Actinomycetes)细胞。

在其他实施方式中,宿主细胞来自真核植物、藻类、蓝细菌、绿色硫细菌、绿色非硫细菌、紫色硫细菌、紫非硫细菌、嗜极生物、酵母、真菌、以上的基因工程化的生物或合成生物体的细胞。在一些实施方式中,所述宿主细胞是光依赖性的或固定碳。在一些实施方式中,所述宿主细胞具有自养活性。在一些实施方式中,所述宿主细胞具有光合自养活性,例如在存在光的情况下。在一些实施方式中,所述宿主细胞在不存在光的情况下是异养或兼养的。在特定实施方式中,所述宿主细胞是来自拟南芥(Avabidopsis thaliana)、柳枝稷(Panicum virgatum)、巨芒(Miscanthus giganteus)、玉米(Zea mays)、莱茵衣藻(Chlamydomonas reinhardtii)、杜氏盐藻(Dunaliela salina)、聚球蓝细菌属物种(Synechococcus Sp.)PCC 7002、聚球蓝细菌属物种PCC7942、集胞藻属物种(Synechocystis Sp.)PCC 6803、长嗜热聚球蓝细菌(Thermosynechococcus elongates)BP-1、绿硫细菌(Chlorobium tapidum)、橙色绿屈挠菌(Chlorojlexus auranticus)、酒色着色菌(Chromatiumm vinosum)、深红红螺菌(Rhodospirillum rubrum)、荚膜红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌(Rhodopseudomonas palusris)、杨氏梭菌(Clostridium ljungdahlii)、热纤梭菌(Clostridiuthermocellum)、产黄青霉(Penicillium chrysogenum)、巴斯德毕赤酵母(Pichia pastoris)、粟酒裂殖酵母(Schizosaccharomyces pombe)、萤光假单孢菌(Pseudomonas fluorescens)或运动发酵单胞菌(Zymomonas mobilis)的细胞。

如本文所使用的,术语“允许生产的条件”指的是任何允许宿主细胞生产所期望产物的条件,如脂肪酰胺。类似地,术语“适合表达的条件”指的是任何允许宿主细胞合成多肽的条件。合适的条件包括例如发酵条件。发酵条件可包含很多参数,如温度范围、通风水平及基质组成。这些条件中的每项都分别或组合起来允许宿主细胞生长。示例性培养基包括培养液或凝胶。通常,基质包括能够直接被宿主细胞代谢的碳源。此外,可在基质中使用酶以促进碳源的动员(例如淀粉或纤维素解聚成可发酵糖类)及随后的代谢。

如本文所使用的,词语“碳源”指的是适合用作原核或简单真核细胞生长的碳来源的底物或化合物。碳源可以是不同形式的,包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和CO

术语“生物质”是指碳源所来源于的任何生物材料。在一些实施方式中,生物质被加工成适合于生物转化的碳源。在其它的情况下,所述生物质可以不需要被进一步加工成碳源。碳源可以被转化为生物燃料。生物质的一个示例性来源是植物物质或蔬菜,例如,玉米、甘蔗或柳枝稷可以用作生物质。生物质的另一示例性实例是代谢废物,例如动物物质(例如牛粪)。其他示例性生物质来源包括藻类或其它海洋植物。生物质还包括来自工业、农业、林业和家庭的废品,包括但不限于发酵废渣、青贮饲料、秸秆、无用杂物、污水、垃圾、含纤维素的城市废物和剩余食物和甘油。生物质还包括例如碳水化合物(例如单糖、二糖或多糖)的碳源。术语“生物质”还可指代碳的来源如碳水化合物(例如单糖、二糖或多糖)。

为确定条件是否足以允许产物的生产或多肽的表达,可将宿主细胞培养约4、8、12、24、36、48、72或更多小时。在培养中和/或培养后,可获得样品并进行分析以确定这些条件是否允许生产或表达。例如,可测试样品或宿主细胞生长的基质中的宿主细胞中是否存在期望的产物。当测试脂肪酰胺的存在情况时,可使用测定法例如但不限于,MS、薄层层析色谱(TLC)、高效液相色谱(HPLC)、液相色谱(LC)、偶联有火焰离子化检测器(FID)的GC、GC-MS及LC-MS。当测试多肽的表达情况时,可使用技术例如但不限于,Western印迹和点杂交法。

在本发明的方法中,可通过优化发酵条件增强脂肪酰胺的生产和分离。在一些实施方式中,优化发酵条件以增加被转化为烃类产物的碳源百分比。在正常的细胞生命周期中,碳被用于细胞功能如生产脂质、糖类、蛋白质、有机酸和核酸。减少生长相关的活动所需要的碳的量可以增加碳源转化为产物的效率。这一点可以通过例如先将宿主细胞培养到期望的密度(例如生长对数期峰值达到的密度)而实现。在这一点上,可以使用复制检查点基因阻止细胞生长。具体而言,群体感应机制(quorum sensing mechanisms)可以用于激活例如p53、p21的检查点基因或其他检查点基因(总数与Camilli等人(2006)Science 311:1113;Venturi(2006)FEMS Microbiol.Rev.30:274-291;及Reading等人(2006)FEMSMicrobiol.Lett.254:1-11)。

可以被激活以阻止大肠杆菌中细胞复制和生长的基因包括umuDC基因。umuDC基因的过表达阻止从静止期到指数性生长的进展(Murli等人(2000)J.Bacteriol.182:1127-1135)。UmuC是可以对非编码损伤进行跨损伤合成(translesion synthesis)的DNA聚合酶,所述非编码损伤通常是由于紫外线(UV)和化学诱变造成的。umuDC基因产物参与跨损伤合成的过程并且还作为DNA序列损伤检查点。umuDC基因产物包括UmuC、UmuD、umuD’、UmuD’

可以将宿主细胞另外地进行基因工程化以表达重组纤维小体,这些纤维小体可以允许宿主细胞使用纤维素原料作为碳源。用于本发明公开方法的示例性纤维小体包括例如在国际专利申请出版号WO2008/100251中描述的纤维小体。还可根据美国专利号5,000,000、5,028,539、5,424,202、5,482,846和5,602,030中描述方法的对宿主细胞进行基因工程化,以有效地同化碳并使用纤维素材料作为碳源。此外,宿主细胞可经基因工程化以表达转化酶,使得使用蔗糖作为碳源。

在本发明公开发酵方法的一些实施方式中,发酵室可以将正在进行连续还原的发酵封闭,由此创造稳定的还原环境。通过(气体形式的)二氧化碳的释放可以保持电子平衡。提高NAD/H和NADP/H平衡的努力也可以有利于稳定电子平衡。通过将宿主细胞进行基因工程化以表达NADH:NADPH转氢酶,也可以增强细胞内NADPH的可用性。一种或多种NADH:NADPH转氢酶的表达将糖酵解中产生的NADH转变为NADPH,后者可以增强脂肪酰胺及其中间产物的产生。

对于小规模生产,可以使基因工程化的宿主细胞以例如约100mL、500mL、1L、2L、5L或10L的规模进行批量生长;进行发酵;并诱导其表达期望的核酸序列,如编码PPS的核酸序列。对于大规模生产,可以使基因工程化的宿主细胞以约10L、100L、1000L、10,000L、100,000L、1,000,000L或更大的规模进行批量生长;进行发酵;并诱导其表达期望的核酸序列。

由本发明公开方法产生的脂肪酰胺通常被从宿主细胞中分离。如本文所使用的,术语“分离的”对于产物如脂肪酰胺而言,指的是与细胞组分、细胞培养基或化学或合成前体中分开的产物。由本文描述的方法产生的脂肪酰胺可能在发酵液和细胞质中相对不互溶。因此,可在细胞内或细胞外地在有机相中收集脂肪酰胺及其衍生物。在有机相中收集产物可减少脂肪酰胺对细胞功能的影响,因此可允许宿主细胞生产更多的产物。

在一些实施方式中,对由本发明公开的方法生产的脂肪酰胺进行纯化。如本文所使用的,术语“纯化”、“纯化的”或“进行纯化”指的是通过例如分离或分开从分子的环境中移出或分离所述分子。“基本上纯化的”分子为至少约60%(例如至少约70%、至少约75%、至少约85%、至少约90%、至少约95%、至少约97%、至少约99%)不含与其相关的其他组分。如本文所使用的,这些术语还指从样品中去除污染物。例如,污染物的去除可以导致样品中脂肪醇的百分比增加。例如,当在宿主细胞中产生脂肪酰胺时,可以通过去除宿主细胞蛋白纯化脂肪酰胺。纯化后,样品中脂肪酰胺的百分比增加。

如本文所使用的,术语“纯化”、“纯化的”或“进行纯化”不需要绝对纯。因此,例如当在宿主细胞中产生脂肪酰胺时,纯化的脂肪酰胺是基本与其他细胞组分(例如核酸、多肽、脂质、碳水化合物或其他烃类)分离的脂肪酰胺。

此外,纯化的脂肪酰胺制备物是其中脂肪酰胺基本不含污染物(例如发酵后可能存在的那些污染物)的脂肪酰胺制备物。在一些实施方式中,当样品重量的至少约50%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。在其他实施方式中,当样品重量的至少约60%,例如至少约70%、至少约80%、至少约85%、至少约90%、至少约92%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。备选地或此外地,当样品重量中低于约100%,例如低于约99%、低于约98%、低于约95%、低于约90%、低于约80%是由脂肪酰胺组成时,所述脂肪酰胺是纯化的。因此,纯化的脂肪酰胺的纯化水平介于以上任意两个端点之内。例如,当样品的至少约80%-95%、至少约85%-99%、或至少约90%-98%由脂肪酰胺组成时,所述脂肪酰胺是纯化的。

脂肪酰胺可存在于细胞外环境中,或可分离自宿主细胞的细胞外环境。在特定实施方式中,脂肪酰胺是从所述宿主细胞分泌的。在其他实施方式中,脂肪酰胺被转运入细胞外环境中。在其它的实施方式中,脂肪酰胺是被动转运入细胞外环境中。可使用本领域已知的方法从宿主细胞中分离脂肪酰胺,如在国际专利申请公开WO 2010/042664和WO2010/062480中公开的那些方法。

本文描述的方法可产生均一的化合物,其中至少约60%、至少约70%、至少约80%、至少约90%、或至少约95%的所产生的脂肪酰胺具有的脂肪链差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。备选地或此外地,本文描述的方法产生均一的化合物,其中低于约98%、低于约95%、低于约90%、低于约80%或低于约70%的所产生的脂肪酰胺具有的脂肪链差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。因此,脂肪酰胺具有均一度介于以上任意两个端点之内。例如,脂肪酰胺具有这样的均一度,其中约70%-95%、约80%-98%或约90%-95%的所产生的脂肪酰胺具有的脂肪链的差异低于6个碳、低于5个碳、低于4个碳、低于3个碳或低于2个碳。这些化合物还可在产生时具有相对统一的饱和度。

作为本发明方法的结果,基因工程化以包含编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的重组微生物体产生的脂肪酰胺的效价、产率或生产率中的一项或多项相对于对应地野生型微生物体有所提高。

术语“效价”指的是每单位体积的宿主细胞培养物产生的脂肪酰胺的量。在本文描述的组合物和方法的任何方面,脂肪酰胺以25mg/L或更多、50mg/L或更多、75mg/L或更多、100mg/L或更多、125mg/L或更多、150mg/L或更多、175mg/L或更多、200mg/L或更多、250mg/L或更多、300mg/L或更多、350mg/L或更多、400mg/L或更多、450mg/L或更多、500mg/L或更多、600mg/L或更多、700mg/L或更多、800mg/L或更多、900mg/L或更多或1000mg/L或更多的效价生产。备选地或此外地,脂肪酰胺以2000mg/L或更少、1900mg/L或更少、1800mg/L或更少、1700mg/L或更少、1600mg/L或更少、1500mg/L或更少、1400mg/L或更少、1300mg/L或更少、1200mg/L或更少、1100mg/L或更少、1000mg/L或更少、900mg/L或更少、800mg/L或更少、700mg/L或更少、600mg/L或更少、500mg/L或更少、400mg/L或更少、300mg/L或更少或200mg/L或更少的效价生产。因此,脂肪酰胺以介于以上任意两个端点之内的效价生产。例如,脂肪酰胺以150-1000mg/L、200-500mg/L、500-1500mg/L或300-1300mg/L的效价生产。在其他实施方式中,脂肪酰胺以高于2000mg/L、高于5000mg/L、高于10,000mg/L或更高,例如50g/L、70g/L、100g/L、120g/L、150g/L或200g/L的效价生产。

术语“产率”指的是宿主细胞中输入碳源转化为产品(即脂肪酰胺)的效率。对于含氧碳源(例如葡萄糖和其他碳水化合物基来源),氧必须以二氧化碳形式释放。因此,对于每两个释放的氧原子,也有一个碳原子被释放,导致最大理论代谢效率为大约34%(w/w)(对于脂肪酸衍生物产物)。然而这一数值在对于其他有机化合物和碳源会变化。文献报道的典型的产率大约低于5%。根据本发明公开的方法基因工程化以生产脂肪酰胺的宿主细胞具有的产率为约3%或更多、约5%或更多、约10%或更多、约15%或更多、约18%或更多、或约20%或更多。备选地或此外地,产率为约30%或更少、约27%或更少、约25%或更少、约22%或更少、约20%或更少、约17%或更少、约13%或更少、或者约10%或更少。因此,产率介于以上任意两个端点之内。例如,由本发明公开的重组微生物体生产的脂肪酰胺的产率可以为约5%至约25%、约10%至约25%、约10%至约22%、约15%至约27%,或约18%至约22%。在其他实施方式中,产率高于30%。

术语“生产率”指的是每单位体积的宿主细胞培养物每单位密度宿主细胞培养物生产的脂肪酰胺的量。在本文描述的组合物和方法的任何方面,由重组微生物体生产的脂肪酰胺的生产率为约3mg/L/OD

本发明公开还提供了通过本文描述的重组微生物体和方法生产的脂肪酰胺。可基于双重碳同位素指纹法或

在商业中,区别生物产品与基于石油的有机化合物的能力在追踪这些材料方面是有益的。例如,包含生物学基的和石油基的碳同位素谱二者的有机化合物或化学品可以区别于仅由石油基材料制成的有机化合物和化学品。因此,在商业中,可以基于根据本发明的方法制备的脂肪酰胺的独特的碳同位素谱来追踪它们。

可通过比较每种燃料中稳定的碳同位素比(

δ

在一些实施方式中,根据本发明公开的方法产生的脂肪酰胺的δ

也可以通过比较每种化合物中

可以通过加速器质谱(AMS)测量

在一些实施方式中,根据本发明公开产生的脂肪酰胺具有的f

已知

通过将107.5pMC指定为“100%"并且将0pMC指定为“0%”而衍生得到生物学基的碳含量。例如,测量为99pMC的样品会给出93%的等同的生物学基的碳含量。该值被称为基于生物学的平均碳结果并且假定在所分析的材料之内全部组分起源于现代的生物材料或石油基材料。

在一些实施方式中,根据本发明公开的方法产生的脂肪酰胺具有的pMC为至少约50、至少约60、至少约70、至少约75、至少约80、至少约85、至少约90、至少约95、至少约96、至少约97或至少约98。备选地或此外地,所述脂肪酰胺具有的pMC为约108或更低、约105或更低、约102或更低、约99或更低、约96或更低、约93或更低、约90或更低、约85或更低、或者约80或更低。因此,所述脂肪酰胺具有的pMC介于以上任意两个端点之内。例如,所述脂肪酰胺具有的pMC可以为约50至约100;约60至约105;约70至约100;约80至约105;约85至约100;约87至约98;或者约90至约95。在其他实施方式中,本文描述的脂肪酰胺具有的pMC为约90、约91、约92、约93、约94或约94.2。

通过本文描述的任何重组微生物体和方法产生的脂肪酰胺本身可直接用作表面活性剂或去污剂,或者所述脂肪酰胺可配制成个人、宠物或居家清洁组合物。表面活性剂、去污剂和清洁组合物及其生产方法为本领域技术人员熟知,在美国专利申请公开2011/0206630中有更详细的描述,其以全文通过引用并入本文。

因此,本发明公开提供了包含本文描述的任何方法产生的表面活性剂、去污剂和清洁组合物。本领域一般技术人员会清楚的是,取决于所述表面活性剂、去污剂和清洁组合物的预期目的,可生产并使用不同的脂肪酰胺。例如,当本文描述的脂肪酰胺被用作表面活性剂或去污剂生产的原料时,本领域一般技术人员会清楚所述脂肪酰胺原料的特性会影响所生产的表面活性剂或去污剂组合物的特性。由此,可通过生产特定的脂肪酰胺用作原料而选择所述表面活性剂或去污剂组合物的特性。

可将本发明公开的脂肪酰胺基的表面活性剂或去污剂与本领域熟知的其他表面活性剂和/或去污剂混合。混合物中脂肪酰胺的存在量可以为混合物总重量的10重量%(wt.%)或更多、15wt.%或更多、20wt.%或更多、30wt.%或更多、40wt.%或更多、50wt.%或更多、60wt.%或更多、或者70wt.%或更多。备选地或此外地,脂肪酰胺在混合物中存在量为混合物总重量的95wt.%或更少、90wt.%或更少、80wt.%或更少、70wt.%或更少、60wt.%或更少、50wt.%或更少、或者40wt.%或更少。因此,混合物中脂肪酰胺的存在量介于以上任意两个端点之内。例如,混合物中所述脂肪酰胺的存在量为15-40%、30-90%、50-95%或40-50%。

脂肪酰胺基的表面活性剂可被配制为清洁组合物,其赋予清洁组合物去垢性和清洁力。清洁组合物中脂肪酰胺的存在量可以为所述清洁组合物按总重量计的0.001wt.%或更多、0.1wt.%或更多、1wt.%或更多、10wt.%或更多、20wt.%或更多、或者40wt.%或更多。备选地或此外地,清洁组合物中脂肪酰胺的存在量为所述清洁组合物按总重量计的60wt.%或更少、50wt.%或更少、40wt.%或更少、30wt.%或更少、15wt.%或更少、或者5wt.%或更少。因此,清洁组合物中脂肪酰胺的存在量介于以上任意两个端点之内。例如,所述脂肪酰胺以0.1-10wt.%、10-15wt.%、20-40wt.%或0.001-5wt.%的量被配制成清洁组合物。

本发明公开的清洁组合物可以为固体形式如片剂、粒剂、粉末或压块。所述清洁组合物还可以是液体形式如流体、凝胶、膏状或浓缩物。

在特定实施方式中,本发明公开的清洁组合物为液体或固体的洗衣去污剂组合物。在一些实施方式中,所述清洁组合物为硬质表面的清洁组合物,其中所述硬质表面清洁组合物优选地浸透于非织造底物中。如本文所使用的,“浸透”指的是所述硬质表面清洁组合物被置于与非织造底物接触,使得所述非织造底物中至少一部分被所述硬质表面清洁组合物渗透。例如,所述硬质表面清洁组合物优选地浸透非织造底物。在其他实施方式中,本发明公开的清洁组合物为汽车护理组合物,其用于清洁多种表面如硬木、瓷砖、陶瓷、塑料、皮革、金属和/或玻璃。在一些实施方式中,所述清洁组合物为餐具洗涤组合物,例如液体手洗餐具洗涤组合物、固体自动餐具洗涤组合物、液体自动餐具洗涤组合物及按压/单位剂量形式的自动餐具洗涤组合物。

在其他实施方式中,清洁组合物可用于工业环境中以清洁多种设备和机器,以及用于石油钻井作业。例如,本发明公开的清洁组合物尤其适用于其中涉及接触游离的硬度离子(free hardness)的环境,并且适合于要求有硬水耐受的表面活性剂系统的组合物,如当其用于帮助石油钻井时。

在一些实施方式中,可将通过本文描述的任何重组微生物体和方法产生的脂肪酰胺配制成个人或宠物护理组合物,如香波、沐浴露、洁面乳、或者液体或固体皂。

含有通过本文描述的任何重组微生物体和方法产生的脂肪酰胺的清洁组合物包含本领域技术人员熟知的其他清洁添加剂。适用于大多数清洁组合物的通用清洁添加剂包括家居清洁组合物、个人护理组合物,诸如此类,包括溶剂、助溶剂、载体、整理剂、酶、多聚物、增泡剂、抑泡剂(消泡剂)、染料、填充剂、杀菌剂、助水溶剂、抗氧化剂、香水、香水前料、酶稳定剂、色素,诸如此类。在一些实施方式中,所述清洁组合物为液体清洁组合物,其中所述组合物包含选自溶剂、螯合试剂、分散剂和水中的一种或多种。在其他实施方式中,所述清洁组合物为固体,其中组合物进一步包含例如无机盐填充剂。无机盐填充剂是固体清洁组合物的常规成分,以基本的量存在,所述量可在例如约10wt.%至约35wt.%之间变动。合适的填充剂盐包括例如硫酸和氯的碱盐或碱土金属盐。一种示例性的填充剂盐为硫酸钠。

家居清洁组合物(例如洗衣去污剂和家居表面清洁剂)可包含一种或多种其他的成分,选自漂白剂、漂白激活剂、催化材料、分散剂多聚物、银护理剂、防变色和/或抗腐蚀试剂、碱性源、加工助剂、染料转移抑制试剂、增亮剂、结构弹性化剂、布料柔软剂、抗磨蚀剂及其他布料护理试剂。清洁佐剂尤其可用于居家清洁组合物,使用的水平在例如美国专利号5,576,282、6,306,812和6,326,348中描述。合适的洗衣或其他居家清洁佐剂的列表在例如国际专利申请出版公开WO 99/05245中描述。

个人护理、宠物护理或化妆品组合物(例如香波、洁面乳、消毒洗手液、腮红、古铜粉,诸如此类)可包含一种或多种其他成分,选自护发剂(例如维生素、硅、硅乳液稳定成分)、阳离子纤维素、或多聚物(例如瓜尔胶多聚物)、去头屑剂、抗菌剂、凝胶形成剂、助悬剂、粘度调节剂、染料、非挥发溶剂或稀释剂(可水溶或不溶)、泡沫增强剂、灭虱剂、pH调节剂、香水、防腐剂、螯合剂、蛋白质、皮肤活性剂、防晒剂、UV吸收剂、矿物质、草药/水果/食品提取物、鞘脂衍生物和粘土。

本发明公开还提供了燃料添加剂,其包含通过本文描述的任何重组微生物体和方法产生的脂肪酰胺。在特定实施方式中,所述燃料添加剂选自发动机性能添加剂、去污剂、分散剂、抗磨剂、粘度指数改良剂、摩擦改良剂、抗氧化剂、防锈剂、消泡剂、密封固定剂(seal fix)、润滑添加剂、降凝剂、浊点降低试剂、防烟剂、减阻添加剂、金属钝化剂、杀菌剂和破乳剂。燃料添加剂在美国专利申请公开2010/0257777中有更详细的描述,其通过引用并入本文。

在特定实施方式中,将包含通过任何重组微生物体和方法产生的脂肪酰胺的燃料添加剂混入包含有所述脂肪酰胺及一种或多种用作所述脂肪酰胺的溶剂的原油的包装中。根据级别和/或类型,所述原油可为添加剂包装提供不同程度的性能益处,包括例如极端温度的益处、抗氧化益处或合适的凝点。

本发明公开还提供了药用组合物,其包含通过本文描述的任何重组微生物体和方法产生的脂肪酰胺以及药用可接受载体。所述药用组合物可含有其他组分例如稀释剂、佐剂、赋形剂、防腐剂、pH调节剂等等,以及其他治疗剂,例如用于处理具体适应症(例如疼痛或炎症)的治疗剂。

所述药用组合物可以为固体(例如片剂、胶囊、舌下片剂、粉末、小药囊)组合物。所述药物组合物也可以是液体(例如水性液体、凝胶、洗剂、乳剂)组合物。可将所述药用组合物配制成用于合适的途径施用,例如选自以下的施用途径:口服、局部、静脉内、肌内、腹膜内、鞘内、硬膜外、经皮、皮下、经粘膜和鼻内途径。

本发明公开还提供了在对其有需要的受试者中预防或治疗疾病或病况的方法,包括向受试者施用有效量的通过任何本文描述的任何重组微生物体和方法产生的脂肪酰胺,由此在受试者中预防或治疗所述疾病或病况。

“有效量”或“治疗有效量”指的是减轻人或动物受试者中所述疾病或病况的一种或多种症状(到一定程度,由经验丰富的医务工作者判定)的量。此外,“有效量”或“治疗有效量”表示使得与疾病或病况相关或导致疾病或病况的生理或生化参数部分地或全部地回归正常。临床领域技术人员可确定当用于治疗或预防具体疾病病况或障碍而施用时,组合物的治疗有效量。达到治疗有效所需要的组合物的精确的量取决于大量因素,例如活性物质的特定活性、所采用的传递装置、所述物质的物理特性、施用目的,以及多项根据不同病人的具体考虑。确定必须以有效量或治疗有效量施用的组合物的量在本领域是常规操作,在一般临床技术人员的技术之内。

在一些实施方式中,有效量可以为每剂量单位含1ng或更多、例如10ng或更多、100ng或更多、1μg或更多、10μg或更多、100μg或更多、1mg或更多、10mg或更多、50mg或更多、或者100mg或更多的本发明公开的脂肪酰胺。备选地或此外地,有效量可以为每剂量单位含5g或更少、1g或更少、500mg或更少、250mg或更少、100mg或更少、75mg或更少、25mg或更少、10mg或更少、或者1mg或更少的本发明公开的脂肪酰胺。因此,剂量单位中脂肪酰胺的存在量介于以上任意两个端点之内。例如,剂量单位中脂肪酰胺的存在量可以为100ng-10mg、50mg-250mg、1μg-1mg或100mg-500mg。含有有效量的本发明公开的脂肪酰胺的剂量单位以单每日剂量施用,或总日剂量能根据需要被分成每日两次、三次、四次或更多次剂量进行施用。

所述疾病或病况可以为如下任何疾病或病况,其具有对以本发明的脂肪酰胺的疗法有应答的一种或多种症状和/或生理或生化参数。在一些实施方式中,所述疾病为炎性疾病,本发明公开的脂肪酰胺以足以减少炎症的量进行施用。在特定实施方式中,所述炎性障碍是自身免疫疾病、类风湿性关节炎、多发性硬化症或克罗恩病。

在特定实施方式中,所述病况为疼痛,本发明公开的脂肪酰胺以足以提供镇痛的量进行施用。

在其他实施方式中,所述病况为高血压,本发明公开的脂肪酰胺以足以引起血压下降的量进行施用。

花生四烯乙醇胺是大麻素(CB)1受体的内源性激动剂,并在较低程度上也是CB2受体与香草素受体1的内源性激动剂(Tan等人,同上)。已经证明对人类和动物对象的施用花生四烯乙醇胺有十分众多的生理作用,包括调节食物摄取和体重,降低血压,降低心脏速率,防止心肌再灌注损伤,减少通过化学、机械、或热刺激引起的急性疼痛,降低神经性或炎性起源的慢性疼痛,减少炎症、在急性神经元损伤中(例如,在创伤性脑损伤、中风和癫痫中)和在慢性神经退行性障碍(例如,多发性硬化症、帕金森氏病、亨廷顿氏病、肌萎缩性侧索硬化和阿尔茨海默氏病)提供神经保护,促进支气管舒张,降低眼内压(例如,在青光眼患者中)和促进肿瘤细胞凋亡(参见,例如Pacher等人(2006)Pharmacol.Rev.58(3):389-462)。

在一些实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的花生四烯乙醇胺,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的花生四烯乙醇胺得到治疗或预防。

PEA和OEA是过氧化物酶体的增殖物激活受体α(PPAR-α)的内源性激动剂(Fu等人(2003)Nature 425(6953):90-93;及Lo Verme等人,同上)。已经证明PEA或OEA对人类和动物对象的施用引起许多由花生四烯乙醇胺引发的相同反应,包括调节食物摄取和体重、减轻疼痛和炎症、提供神经保护及降低眼内压(见例如,Fu等人,同上,Tan等人,同上,LoVerme等人,同上,以及美国专利号6,348,498和6,656,972)。

在一些实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的PEA,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的PEA得到治疗或预防。在其他实施方式中,所述脂肪酰胺是通过本文描述的重组微生物体和方法产生的OEA,所述疾病或病况是前述疾病或病况的一种,其能够通过施用有效量的OEA得到治疗或预防。

实施例

以下具体实施例旨在阐述本发明公开且不应被理解为限制权利要求的范围。

实施例1

本实施例阐述了遗传基因工程微生物体的构建,其中酰基-CoA脱氢酶、外膜蛋白质受体、丙酮酸甲酸裂解酶、乳酸脱氢酶和转录抑制子的表达受到弱化。

大肠杆菌MG1655 DV4是经遗传基因工程化的大肠杆菌K菌株,包含fadE(酰基-CoA脱氢酶)、fhuA(外膜蛋白质受体)、pflB(丙酮酸甲酸裂解酶)和ldhA(乳酸脱氢酶)基因的删除(见美国专利申请公开2011/0072714和2011/0162259,其通过引用并入本文)。大肠杆菌MG1655的fabR基因(GenBank登录号AAC76945)编码转录抑制子,通过根据Datsenko等人(2000)Proc.Natl.Acad.Sci.USA 97:6640-6645的Lambda Red系统将该基因从大肠杆菌MG1655 DV4中删除,所述系统的修饰在本文中描述。

用于产生删除菌株的两条引物为:

fabR_del_F:

5’-ATGTTTTATTGCGTTACCGTTCATTCACAATACTGGAGCAATCCAGTATGATTCCGGGGATCCGTCGACC-3’(SEQ ID NO:4);及

fabR_del_R:

5’-CGTACCTCTATCTTGATTTGCTTGTTTCATTACTCGTCCTTCACATTTCCTGTAGGCTGGAGCTGCTTCG-3’(SEQ ID NO:5)。

fabR_del_F和fabR_del_R引物用于从质粒pKD13中通过PCR方法扩增卡那霉素抗性(Km

对fabR删除情况的确认使用以下引物进行:

fabR_3:

5’-GCGACGCGCGCACCTTGCTTAACCAGGCCC-3’(SEQ ID NO:6)

fabR_4:5’-CGCATCTTCGCGCCAATCCAGAACACC-3’(SEQ ID NO:7)。

在所述删除得到确认后,根据Datsenko等人描述的方法(见上文)使用单一菌落移除Km

此实施例显示了大肠杆菌MG1655 DG5的构建,所述菌株是经遗传基因工程化的微生物体,其中酰基-CoA脱氢酶、外膜蛋白质受体、丙酮酸甲酸裂解酶、乳酸脱氢酶和转录抑制子的表达受到弱化。

实施例2

本实施例阐述了经遗传基因工程化的微生物体的构建,其中编码硫酯酶(‘tesA)和酰基-CoA合酶(fadD)的核苷酸序列被整合入所述微生物体的染色体,并受控于可诱导启动子。

‘tesA是核苷酸序列,其包含无先导序列的大肠杆菌tesA基因(GenBank索引号AAC73596,登录号U00096.2)。‘tesA编码大肠杆菌硫酯酶(EC 3.1.1.5,3.1.2.-),其中最前端的二十五个氨基酸被删除,并且位于26号位的氨基酸——丙氨酸被甲硫氨酸取代。这样,所述甲硫氨酸便成为‘tesA的第一个氨基酸(Cho等人(1995)J.Biol.Chem.270:4216-4219)。大肠杆菌fadD(GenBank索引号AAC74875;登录号U00096.2)编码酰基-CoA合酶。

含有‘tesA或‘tesA-fadD的pACYC-Ptrc质粒的构建

‘tesA基因获自pETDuet-1-‘tesA质粒,其是通过将‘tesA基因克隆进入NdeI/AvrII消化的pETDuet-1质粒(Novagen,Madison,WI)而构建的,如先前所述的(见美国专利申请出版号2010/0242345和国际专利申请公开WO 2007/136762,其以全文通过引用并入本文)。所述fadD基因获自pHZ1.61质粒(SEQ ID NO:8),其是通过将fadD基因克隆入pCDFDuet-1质粒(Novagen,Madison,WI)而构建的,如先前所述(又见美国专利申请公开2010/0257777,其以全文通过引用并入本文)。分别从pETDuet-1-‘tesA和pHZ1.61中扩增‘tesA和fadD基因,使用高保真聚合酶PHUSION

‘tesA正向-

5’-CTCTAGAAATAATTTAACTTTAAGTAGGAGAUAGGTACCCATGGCGGACACGTTATTGAT-3’(SEQ ID NO:9)

‘tesA反向-

5’-CTTCGAATTCCATTTAAATTATTTCTAGAGTCATTATGAGTC ATGATTTACTAAAGGC-3’(SEQID NO:10)

fadD正向-

5’-CTCTAGAAATAATTTTAGTTAAGTATAAGAAGGAGATATACCATGGTGAAGAAGGTTTGGCTTAA-3’(SEQ ID NO:11)fadD反向-

5’-CTTCGAATTCCATTTAAATTATTTCTAGAGTTATCAGGCTTTA TTGTCCAC-3’(SEQ ID NO:12)。

为构建pACYC-‘tesA质粒,用NcoI和EcoRI消化‘tesA PCR产物及pACYC-Ptrc载体(SEQ ID NO:13)。在用T4 DNA连接酶(New England Biolabs,Ipswich,MA)消化过夜后,将DNA产物转化入

为构建pACYC-Ptrc-‘tesA-fadD质粒,对pACYC-Ptrc-‘tesA质粒用SwaI进行过夜限制性酶消化。扩增自pHZ1.61的fadD PCR产物被克隆至‘tesA基因下游,使用IN-FUSION

将pACYC-Ptrc-‘tesA和pACYC-Ptrc-‘tesA-fadD质粒用作模板分别生成Ptrc-‘tesA和Ptrc-‘tesA-fadD盒。下列引物被用于获得所述盒:IFF:

5’-GGGTCAATAGCGGCCGCCAATTCGCGCGCGAAGGCG-3’(SEQ ID NO:14)

IFR:

5’-TGGCGCGCCTCCTAGGGCATTACGCTGACTTGACGGG-3’(SEQ ID NO:15)。

对质粒pGRG25(GenBank登录号DQ460223)进行纯化并通过NotI和AvrII(NewEngland Biolabs,Inc.,Ipswich,MA)对其进行限制性酶消化。使用IN-FUSION

大肠杆菌MG1655 DG5 Tn7-‘tesA和大肠杆菌MG1655 DG5Tn7-‘tesA-fadD的生成

Tn7tes和Tn7tesfad质粒各自分别通过电穿孔导入大肠杆菌菌株MG1655 DG5中(描述于实施例1中),使用的是McKenzie等人,BMC Microbiology,6:39(2006)中描述的操作流程。在电穿孔后,通过在含0.1%葡萄糖和100μg/mL羧苄青霉素的LB基质中32℃生长过夜,选择氨苄青霉素抗性细胞,随后通过在含有0.1%阿拉伯糖的LB平板中32℃生长过夜,选择包含Tn7转座子部分的细胞。将单菌落画线接种于含有或不含氨苄青霉素的LB基质平板上并于42℃下培养过夜以恢复Tn7tes或Tn7tesfad质粒。因此lacI

attTn7.A:5’-GATGCTGGTGGCGAAGCTGT-3’(SEQ ID NO:18)

attTn7.C:5’-GTTGCGACGGTGGTACGCATAAC-3’(SEQ ID NO:19)。

相应地,对所得的菌株命名为大肠杆菌MG1655 DG5 Tn7-‘tesA和大肠杆菌MG1655DG5 Tn7-‘tesA-fadD。

此实施例的结果阐明了生成经遗传基因工程化的微生物体,其中编码硫酯酶(即大肠杆菌MG1655 DG5 Tn7-‘tesA)或硫酯酶及酰基-CoA合酶(即大肠杆菌MG1655 DG5 Tn7-‘tesA-fadD)的核苷酸序列被整合入宿主细胞的染色体,并受控于可诱导的启动子。

实施例3

此实施例阐述了通过在经遗传基因工程化的微生物体中表达编码棕榈酰腐胺合酶的基因而生产N-棕榈酰乙醇胺的方法。

通过DNA2.0(Menlo Park,CA)合成编码细菌棕榈酰腐胺合酶(PPS)的基因,该基因被确定为GenBank登录号AY632377(Brady,S.F.,等人(2004)J.Nat.Prod.,67:1283-1286)(SEQ ID NO:2)。所述DNA2.0质粒——称为pJ201:30127——被设计为在起始密码子邻侧含有NcoI位点,在终止密码子邻侧含有PmeI位点。pJ201:30127中的PPS编码基因未经过密码子优化。将所述PPS编码基因亚克隆至表达载体OP80,所述载体在先前有所描述(见美国专利申请公开2010/0154293,其以全文通过引用并入本文)。OP80载体基于pCL1920,后者是一种低拷贝质粒,在可由IPTG诱导的trc启动子的控制下表达可操作相连的基因。为构建表达PPS基因的OP80载体,对质粒OP80和pJ201:30127进行纯化并用NcoI/PmeI(New EnglandBiolabs,Inc.,Ipswich,MA)进行限制性酶消化。用T4 DNA连接酶将PPS编码基因连接入经NcoI/PmeI消化的OP80质粒。将连接反应物转化入

用用于分离的装配了30m x 0.25mm的0.25μm的薄膜Agilent HP-5-MS柱子的GC-MS(Agilent 6850GC,具有5975B VL MSD)对所有样品进行分析,其中质谱检测器电子电离(EI)为全扫描模式(50-500m/z)。于300℃将1μL乙酸乙酯萃取物注射入Agilent不分流进样口组。柱子的温度程序设置如下:100℃5min,以20℃/min的速度增加到320℃,并在320℃下保持5min。将载气氦的流速设为1.2mL/min。用OP80-PPS转化的大肠杆菌MG1655菌株DG5的代表性色谱图及质谱解释显示于图1。在所有以OP80-PPS转化的大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD的GC-MS跟踪中都鉴定出保留时间为13.1min的峰。该峰被鉴定为N-棕榈酰乙醇胺。而被鉴定为N-棕榈酰乙醇胺的峰不存在于任何用空载体转化的对照菌株中。

据估计,用OP80-PPS转化的大肠杆菌MG1655菌株DG5中产生了近似200mg/L的N-棕榈酰乙醇胺。大肠杆菌MG1655菌株DG5经基因工程化以生产脂肪酰基-ACP,而DG5 Tn7-‘tesA经基因工程化以生产游离的脂肪酸,并且DG5 Tn7-‘tesA-fadD菌株经基因工程化以产生脂肪酰基酰基-CoA。由于这些结果表明所有三种菌株都产生N-棕榈酰乙醇胺,因此亲本DG5菌株中产生N-棕榈酰乙醇胺表示AY632377基因编码的PPS酶在初级乙醇胺的存在下使用C16:0酰基-ACP作为底物。图1中鉴定的N-棕榈酰乙醇胺进一步通过以N,O-双(三甲基硅烷基)-三氟乙酰胺(BSTFA)衍生化得到表征,其中羟基基团是三甲基硅烷基保护的。如图2A所示,GC-MS追踪中保留时间为13.3min的峰被鉴定为三甲基甲硅烷(TMS)保护产物。

本实施例的结果显示了通过在经基因工程化以产生脂肪酰基-ACP的细菌菌株中表达AY632377基因编码的PPS酶而生产N-棕榈酰乙醇胺的方法。此外,这些结果表明单一的酶(即PPS)可以在体内直接由酰基-ACP和伯胺头基进行次级酰胺化。

实施例4

本实施例显示了通过在经遗传基因工程化的微生物体中表达编码棕榈酰腐胺合酶的基因而生产N-棕榈酰乙醇胺的方法。

将OP80空载体或OP80-PPS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD,如实施例3中描述的。将六种菌株各自在不含其它葡萄糖的LB培养液中培养。然后将每种过夜培养物接种到含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL一式三份接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%乙醇胺,并在pH受控的孵育箱中进行培养,做三个重复试样。48小时后,记录各培养物的OD

如上文指出的,大肠杆菌MG1655菌株DG5 Tn7-‘tesA-fadD经基因工程化以产生脂肪酰基-CoA。因此,DG5 Tn7-‘tesA-fadD菌株中产生N-棕榈酰乙醇胺表明AY632377基因编码的PPS酶也可在乙醇胺的存在下使用脂肪酰基-CoA作为底物。

本实施例的结果显示了通过在经基因工程化以产生脂肪酰基-CoA的细菌菌株中表达AY632377基因编码的PPS酶而生产N-棕榈酰乙醇胺的方法。此外,这些结果表明单一的酶(即PPS)可以在体内直接由脂肪酸硫酯和伯胺头基进行次级酰胺化。

实施例5

本实施例显示了通过在经遗传基因工程化微生物体中表达编码PPS的基因而生产饱和及不饱和脂肪酰胺的方法

脂肪酸3-二甲基氨基-1-丙胺作为两性去污剂椰油酰胺丙基甜菜碱(CAPB)合成中的前体。为确定脂肪酸N-(3-二甲基氨基-1-丙胺)酰胺是否可在经遗传基因工程化以表达PPS的微生物体中产生,用OP80空载体或OP80-PPS质粒转化大肠杆菌MG1655菌株DG5细胞,并将其在不含其它葡萄糖的LB培养液中培养过夜。然后将各过夜培养物接种于含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL以一式三份接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH 7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%的伯胺3-二甲基氨基-1丙胺,并在pH受控的孵育箱中进行培养,做三个重复试样。60小时后,记录各培养物的OD

本实施例的结果显示了通过在含有3-二甲基氨基-1-丙胺的基质中培养经基因工程化以产生酰基-ACP并进一步表达由基因AY632377编码的PPS酶而生产具有多种脂肪链长度的脂肪酰胺,其可具有零个或一个不饱和键。

实施例6

本实施例阐述了通过为经遗传基因工程化的微生物体提供多种伯胺而生产多种脂肪酰胺的方法。

将OP80空载体或OP80-PPS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD,如实施例3中描述的。将六种菌株各自在不含其它葡萄糖的LB培养液中培养。然后,将每种过夜培养物接种到含有葡萄糖的富营养基质中。更具体地,每种过夜培养物中取1mL接种至富营养的2N-BT(2%葡萄糖、限氮培养基、0.2M Bis-Tris、pH 7.0、0.1%Triton):LB培养基(1:10),其含有1mM IPTG、抗生素及1%的以下伯胺之一:(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基1-3丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺或丁胺。将培养物在pH受控的环境中孵育60小时。记录各培养物的OD

本实施例的结果证明了通过改变伯胺原料的类型而在经遗传基因工程化以产生脂肪硫酯并进一步表达由基因AY632377编码的PPS酶的大肠杆菌菌株内产生不同种类脂肪酰胺的方法。

实施例7

本实施例显示在经遗传基因工程化的微生物体中PPS同源物的表达与PPS表达时产生相同脂肪酰胺化合物。

使用BLAST分析确定AY632377(SEQ ID NO:2)编码的PPS不与任何已知序列有超过20%的序列同一性(见Brady等人(2004)J.Nat.Prod.,67:1283-1286)。在美国国家生物技术信息中心(NCBI)数据库中对AY632377基因编码的PPS酶的氨基酸序列(即,GenBank登录号AAV33349)(SEQ ID NO:1)进行BLAST搜索。鉴定出编码酶N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)(GenBank登录号ACX33975.1)(SEQ ID NO:3)的同源物具有的氨基酸序列与AY632377基因编码的PPS的氨基酸序列有38%的同一性。通过GENEART

3.10.10-2_InfusF:5’-GAGGAATAAACCATGCCCATTCTTGAAAGCGTGGG-3’(SEQ ID NO:20)和

3.10.10-2_InfusR:5’-AGCTGGAGACCGTTTAAACTTATAAACCGCTGTTTGTCGCAACCG-3’(SEQ ID NO:21)。

通过限制性酶消化发现有两个克隆是阳性的,具有含AhtS编码片段的质粒。通过序列分析确认该质粒含有AhtS编码基因,将其命名为“OP80-AhtS”。将OP80-AhtS质粒转化入大肠杆菌MG1655菌株DG5、DG5 Tn7-‘tesA和DG5 Tn7-‘tesA-fadD。如实施例4中所描述的方法,培养这三种菌株并进行诱导,对每种培养物以3-二甲基氨基-1-丙胺、(±)-1-氨基-2-丙醇或乙醇胺进行饲养,使其达到终浓度1%。将培养物在pH受控的环境中孵育60小时后,收获培养物并用乙酸乙酯进行萃取(2体积培养物比1体积乙酸乙酯)。收集有机部分并用于GC-MS分析,如实施例3中描述的。

从用每种伯胺饲养的每种表达AhtS的大肠杆菌菌株中获得脂肪酰胺。用OP80-AhtS转化并用3-二甲基氨基-1-丙胺饲养的大肠杆菌MG1655 DG5 Tn7-‘tesA-fadD所产生的产物的代表性GC-MS追踪在图5中提供。GC保留时间为11.4min的峰经MS分析被确认为C14:0脂肪N-(3-二甲基氨基-1-丙胺)(图5)。在用空载体转化的大肠杆菌菌株中未检测到脂肪酰胺产物。大肠杆菌MG1655菌株DG5 Tn7-‘tesA-fadD中产生的酰胺量最高,而大肠杆菌MG1655菌株DG5 Tn7-‘tesA中产生的酰胺量最低。DG5 Tn7-‘tesA-fadD菌株中酰胺的生产增加提示AhtS酶对C14:0脂肪硫酯底物有偏好。这些数据还提示AhtS和PPS二者都能在大肠杆菌中使用这两种脂肪硫酯底物(即,脂肪-ACP和脂肪-CoA)之一制造出脂肪酰胺。

本实施例的结果证明AhtS酶能与PPS酶一样催化伯胺和脂肪硫酯底之间发生相同类型的反应。此外,本实施例中显示的数据表明Ahts酶对C14:0脂肪硫酯底物有偏好。

实施例8

本实施例提供了用于体内生成伯胺的方法,所述伯胺可在根据本发明公开生成脂肪酰胺的过程中用作起始材料。

体内乙醇胺的产生可通过遗传地增加丝氨酸生物合成及丝氨酸脱羧途径而实现。为此,通过基因工程化大肠杆菌菌株MG1655以过表达磷酸甘油酸突变酶(gpm AB)以增加糖酵解中间产物3-磷酸甘油酸。通过过表达磷酸甘油酸脱氢酶(serA)、3-磷酸丝氨酸氨基转移酶(serC)和3-磷酸丝氨酸磷酸(serB)对丝氨酸产生途径进行基因工程化。在宿主中表达将丝氨酸脱羧为乙醇胺的异源丝氨酸脱羧酶(SDC)。为了防止该菌株对乙醇胺和丝氨酸进行代谢,编码降解酶乙醇胺氨裂解酶(eutABC)和丝氨酸脱氨酶(sdaAB)的基因被删除(图6)。然后脂肪酰胺可以在通过过表达多肽如PPS或AhtS(其催化乙醇胺和酰基硫酯转化为脂肪酰胺)而产生乙醇胺的重组微生物体中产生。

本发明涉及以下实施方案:

1.重组微生物体,其包含编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列,其中所述微生物体在碳源存在下进行培养。

2.实施方案1的重组微生物体,其中所述多肽为棕榈酰腐胺合酶(PPS)多肽。

3.实施方案2的重组微生物体,其中所述PPS多肽包含与SEQ ID NO:1的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。

4.实施方案2的重组微生物体,其中所述PPS多肽具有包含SEQ ID NO:1的氨基酸序列。

5.实施方案2的重组微生物体,其中所述PPS多肽由包含SEQ ID NO:2的核酸序列编码。

6.实施方案1的重组微生物体,其中所述多肽为N-(4-氨基-2-羟丁基)十四酰胺合酶(AhtS)多肽。

7.实施方案6的重组微生物体,其中所述AhtS多肽包含与SEQ ID NO:3的氨基酸序列具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性的氨基酸序列。

8.实施方案6的重组微生物体,其中所述AhtS多肽具有包含SEQ ID NO:3的氨基酸序列。

9.实施方案6的重组微生物体,其中所述AhtS多肽由包含SEQ ID NO:22的核酸序列编码。

10.实施方案1-9中任何一项的重组微生物体,其中所述碳源为碳水化合物。

11.实施方案1-10中任何一项的重组微生物体,其中所述伯胺选自:3-二甲氨基-1-丙胺、(±)-1-氨基-2-丙醇、2-甲氧基乙胺、3-氨基-1-丙醇、2-氨基-1,3-丙二醇、3-甲氧基丙胺、N-(2-羟乙基)乙二胺、丁胺、和1,4-二氨基丁烷、或其组合。

12.实施方案1-11中任何一项的重组微生物体,其中所述酰基硫酯为脂肪酰基-ACP或脂肪酰基-CoA。

13.实施方案12的重组微生物体,其中所述脂肪酰基-ACP或脂肪酰基-CoA由所述微生物体产生。

14.实施方案1-13中任何一项的重组微生物体,其中所述重组微生物体包含编码脂肪酸生物合成多肽、硫酯酶多肽(EC 3.1.2.14或EC3.1.1.5)及酰基-CoA合成多肽(EC2.3.1.86)中的一种或多种的核酸序列。

15.实施方案14的重组微生物体,其中所述微生物体包含编码硫酯酶多肽和酰基-CoA合酶多肽的核酸序列。

16.实施方案14或15的重组微生物体,其中所述编码硫酯酶多肽的核酸序列包含‘tesA的核酸序列。

17.实施方案14-16中任何一项的重组微生物体,其中所述编码酰基-CoA合酶多肽的核酸序列为fadD。

18.实施方案14-17中任何一项的重组微生物体,其中所述脂肪酸生物合成多肽选自编码accABCD、FabD、FabH、FabG、FabB、FabA、FabZ、FabF、FabI或FadR的核酸序列。

19.实施方案1-18中任何一项的重组微生物体,其中所述微生物体为细菌、蓝细菌、藻类或真菌。

20.实施方案19的重组微生物体,其中所述微生物体为真菌。

21.实施方案20的微生物体,其中所述真菌为酵母或丝状真菌。

22.实施方案1-19中任何一项的重组微生物体,其中所述微生物为酿酒酵母、解脂假丝酵母、大肠埃希氏菌、节杆菌、红酵母、不动杆菌、解脂假丝酵母、布朗葡萄藻、弗尼斯弧菌、藤黄微球菌、嗜麦芽寡养单胞菌、枯草芽孢杆菌,地衣芽孢杆菌、恶臭假单胞菌、荧光假单胞菌、天蓝色链霉菌、聚球藻属物种PCC7002、细长嗜热蓝细菌BP-1、桑椹型无绿藻、克鲁格尼原藻、大型无绿藻,中型无绿藻或原壳小球藻细胞。

23.实施方案22的重组微生物体,其中所述微生物体为节杆菌AK19、不动杆菌属物种M-1株、大肠杆菌B、大肠杆菌C、大肠杆菌K或大肠杆菌W细胞。

24.实施方案1-23中任何一项的重组微生物体,其中所述催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是内源的。

25.实施方案1-23中任何一项的重组微生物体,其中所述催化伯胺和酰基硫酯转化为脂肪酰胺的多肽对微生物体是外源的。

26.实施方案1-25中任何一项的重组微生物体,其中所述脂肪酰胺为脂肪烷醇酰胺或脂肪酰胺胺。

27.实施方案1-26中任何一项的重组微生物体,其中所述微生物体表达丝氨酸脱羧酶多肽。

28.用于产生脂肪酰胺的方法,其包括:

(a)提供根据实施方案1-27中任何一项的重组微生物体;并且

(b)将所述重组微生物体在适合于编码催化伯胺和酰基硫酯转化为脂肪酰胺的多肽的核酸序列的表达的条件下在至少一种多肽底物存在下进行培养。

29.实施方案28的方法,其进一步包括从培养基中分离脂肪酰胺。

30.实施方案28或29的方法,其中所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪烷醇酰胺。

31.实施方案28或29的方法,其中所述脂肪酰胺为C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19或C20脂肪酰胺胺。

本发明公开的多种修饰和变动对本领域技术人员是显而易见的,而不偏离本发明公开的范围和精神。尽管已经与特定优选的实施方式相联系而对本发明公开进行描述,应当理解的是这些权利要求不应当被不适当地限制于这些特定实施方式。事实上,旨在将对所描述的本发明公开的施行模式的多种修饰包含在权利要求的范围之内,这些变动能得到本领域技术人员的理解。

序列表

<110> LS9, INC.

<120> 烷醇酰胺及酰胺胺的微生物生产及其用途

<130> LS00041PCT

<140>

<141>

<150> 61/623,711

<151> 2012-04-13

<160> 22

<170> PatentIn version 3.5

<210> 1

<211> 207

<212> PRT

<213> 未知

<220>

<221> 来源

<223> /注="未知的描述: 未培养的细菌"

<400> 1

Met Glu Ser Leu Tyr Asn Gly Asp Gly Phe Val Ile Ala Arg Ala Thr

1 5 10 15

Ala Leu Glu Glu Ile Glu Glu Ser Val Thr Leu Phe Glu Ala Val Ser

20 25 30

Ala Glu Met Gly Trp Ser Pro Gly Asp Arg Leu Arg Ala Tyr Ala Ala

35 40 45

Asn Ala Glu Tyr Leu Met Ala Leu Val Gly Gly Ala Leu Ala Gly Ala

50 55 60

Val Gln Ile Val Leu Ser Asn Gly His Asp Pro Met Pro Ser Asp His

65 70 75 80

Val Trp Pro Glu Leu Ala Ala Gly Arg Arg Tyr Asp Leu Ala His Ala

85 90 95

Ser Val Met Ala Leu Ala Pro Arg Phe Arg Gly Ala Ala Gly Leu Phe

100 105 110

Gly Pro Leu Gly Val Glu Met Trp Arg Leu Cys Arg Asp Ala Gly Lys

115 120 125

Ser Glu Ile Trp Ile Glu Cys Val Pro Arg Asn Leu Ala Val Tyr Arg

130 135 140

Arg Cys Gly Trp Pro Leu Glu Val Ala Gly Glu Leu Arg Thr His Phe

145 150 155 160

Gly Glu Pro Cys Tyr Leu Ala Arg Met Gly Val Glu Ala Val Ala Glu

165 170 175

Ser Leu Arg Ala Arg Ala Gly Arg Cys Asp Gly Phe Ala Arg Leu Val

180 185 190

Ala Gln Ala Tyr Arg Asp Thr Gly Trp Arg Ser Met Gly Leu Ala

195 200 205

<210> 2

<211> 624

<212> DNA

<213> 未知

<220>

<221> 来源

<223> /注="未知的描述: 未培养的细菌"

<400> 2

atggaaagtt tgtacaatgg cgacggattc gtcatcgcaa gggcgacggc cctggaagag 60

atcgaggagt cggtcacact cttcgaggcg gtctccgccg aaatgggatg gagccctggg 120

gatcggcttc gggcatacgc agcgaacgcg gagtacctga tggcgctagt cggcggagcg 180

ctggctgggg cggtgcagat cgtgctctcc aacggtcacg atcctatgcc ttcggaccac 240

gtctggccgg aacttgcggc gggtcgacga tatgaccttg cgcacgcgtc agtgatggcg 300

cttgccccgc gcttccgggg agcggcagga ctattcgggc cgcttggcgt cgagatgtgg 360

aggctttgcc gggacgccgg gaaatccgag atatggatcg agtgcgtgcc gaggaacctt 420

gcggtgtacc gaagatgtgg ttggccgctg gaggtggcgg gcgagttgcg gacccatttc 480

ggcgagcctt gctacctggc gcgaatgggc gtggaggcgg tggcggaatc tctgagggcc 540

agagccggcc gctgcgatgg gttcgccaga ctggtcgcgc aggcttaccg agacaccgga 600

tggcggtcaa tggggcttgc gtaa 624

<210> 3

<211> 220

<212> PRT

<213> 未知

<220>

<221> 来源

<223> /注="未知的描述: 未培养的细菌RM44"

<400> 3

Met Pro Ile Leu Glu Ser Val Gly Phe Met Lys Thr Leu Trp Glu Ser

1 5 10 15

Gly Gly Ala Gln Val Ala Leu Met Glu Ser Arg Glu Glu Thr Ser His

20 25 30

Met Val Gly Ile Leu Glu Gly Ile Ala Ala Glu Leu Ser Trp Arg Pro

35 40 45

Gly Thr Gln Leu Arg Asp Tyr Gln Asp Arg Ala Ala His Leu Ala Val

50 55 60

Leu Val Gly Ser Glu Ile Val Gly Gly Leu Gln Ile Val Thr Ser Pro

65 70 75 80

Ser Ala Asp Cys Leu Pro Tyr Arg Leu Val Trp Pro Glu Val Cys Val

85 90 95

Pro Asp Gly Ala Ala Ile Ala Asp Ile Thr Ile Leu Ala Leu Arg Lys

100 105 110

Glu Tyr Arg Ala Arg Phe Asn Leu Phe Trp Pro Leu Cys Val Glu Leu

115 120 125

Trp Arg His Cys Val Ala Glu Gly Ala Thr Glu Met Arg Leu Glu Ala

130 135 140

Thr Pro Asp Thr Leu Arg Leu Tyr Arg Arg Ile Gly Trp Pro Leu Glu

145 150 155 160

Val Ile Gly Asp Leu Arg Leu His Trp Asn Glu Pro Cys Phe Leu Cys

165 170 175

Arg Met Gly Ile Val Asp Val Ala Gly Ala Met Val Val Arg Ala Leu

180 185 190

Gln Ser Ala Thr Tyr Gln Ala Val Leu Ala Gly Met Ser Arg Pro Val

195 200 205

Ala Ser Ala Ser Pro Val Ala Thr Asn Ser Gly Leu

210 215 220

<210> 4

<211> 70

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 4

atgttttatt gcgttaccgt tcattcacaa tactggagca atccagtatg attccgggga 60

tccgtcgacc 70

<210> 5

<211> 70

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 5

cgtacctcta tcttgatttg cttgtttcat tactcgtcct tcacatttcc tgtaggctgg 60

agctgcttcg 70

<210> 6

<211> 30

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 6

gcgacgcgcg caccttgctt aaccaggccc 30

<210> 7

<211> 27

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 7

cgcatcttcg cgccaatcca gaacacc 27

<210> 8

<211> 6700

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的多核苷酸"

<400> 8

ggggaattgt gagcggataa caattcccct gtagaaataa ttttgtttaa ctttaataag 60

gagatatacc atggtgaaga aggtttggct taaccgttat cccgcggacg ttccgacgga 120

gatcaaccct gaccgttatc aatctctggt agatatgttt gagcagtcgg tcgcgcgcta 180

cgccgatcaa cctgcgtttg tgaatatggg ggaggtaatg accttccgca agctggaaga 240

acgcagtcgc gcgtttgccg cttatttgca acaagggttg gggctgaaga aaggcgatcg 300

cgttgcgttg atgatgccta atttattgca atatccggtg gcgctgtttg gcattttgcg 360

tgccgggatg atcgtcgtaa acgttaaccc gttgtatacc ccgcgtgagc ttgagcatca 420

gcttaacgat agcggcgcat cggcgattgt tatcgtgtct aactttgctc acacactgga 480

aaaagtggtt gataaaaccg ccgttcagca cgtaattctg acccgtatgg gcgatcagct 540

atctacggca aaaggcacgg tagtcaattt cgttgttaaa tacatcaagc gtttggtgcc 600

gaaataccat ctgccagatg ccatttcatt tcgtagcgca ctgcataacg gctaccggat 660

gcagtacgtc aaacccgaac tggtgccgga agatttagct tttctgcaat acaccggcgg 720

caccactggt gtggcgaaag gcgcgatgct gactcaccgc aatatgctgg cgaacctgga 780

acaggttaac gcgacctatg gtccgctgtt gcatccgggc aaagagctgg tggtgacggc 840

gctgccgctg tatcacattt ttgccctgac cattaactgc ctgctgttta tcgaactggg 900

tgggcagaac ctgcttatca ctaacccgcg cgatattcca gggttggtaa aagagttagc 960

gaaatatccg tttaccgcta tcacgggcgt taacaccttg ttcaatgcgt tgctgaacaa 1020

taaagagttc cagcagctgg atttctccag tctgcatctt tccgcaggcg gagggatgcc 1080

agtgcagcaa gtggtggcag agcgttgggt gaaactgaca ggacagtatc tgctggaagg 1140

ctatggcctt accgagtgtg cgccgctggt cagcgttaac ccatatgata ttgattatca 1200

tagtggtagc atcggtttgc cggtgccgtc gacggaagcc aaactggtgg atgatgatga 1260

taatgaagta ccaccgggtc aaccgggtga gctttgtgtc aaaggaccgc aggtgatgct 1320

gggttactgg cagcgtccgg atgctacaga tgagatcatc aaaaatggct ggttacacac 1380

cggcgacatc gcggtgatgg atgaagaagg gttcctgcgc attgtcgatc gtaaaaaaga 1440

catgattctg gtttccggtt ttaacgtcta tcccaacgag attgaagatg tcgtcatgca 1500

gcatcctggc gtacaggaag tcgcggctgt tggcgtacct tccggctcca gtggtgaagc 1560

ggtgaaaatc ttcgtagtga aaaaagatcc atcgcttacc gaagagtcac tggtgacctt 1620

ttgccgccgt cagctcacgg gctacaaagt accgaagctg gtggagtttc gtgatgagtt 1680

accgaaatct aacgtcggaa aaattttgcg acgagaatta cgtgacgaag cgcgcggcaa 1740

agtggacaat aaagcctgaa agcttgcggc cgcataatgc ttaagtcgaa cagaaagtaa 1800

tcgtattgta cacggccgca taatcgaaat taatacgact cactataggg gaattgtgag 1860

cggataacaa ttccccatct tagtatatta gttaagtata agaaggagat atacatatgc 1920

gcccattaca tccgattgat tttatattcc tgtcactaga aaaaagacaa cagcctatgc 1980

atgtaggtgg tttatttttg tttcagattc ctgataacgc cccagacacc tttattcaag 2040

atctggtgaa tgatatccgg atatcaaaat caatccctgt tccaccattc aacaataaac 2100

tgaatgggct tttttgggat gaagatgaag agtttgattt agatcatcat tttcgtcata 2160

ttgcactgcc tcatcctggt cgtattcgtg aattgcttat ttatatttca caagagcaca 2220

gtacgctgct agatcgggca aagcccttgt ggacctgcaa tattattgaa ggaattgaag 2280

gcaatcgttt tgccatgtac ttcaaaattc accatgcgat ggtcgatggc gttgctggta 2340

tgcggttaat tgaaaaatca ctctcccatg atgtaacaga aaaaagtatc gtgccacctt 2400

ggtgtgttga gggaaaacgt gcaaagcgct taagagaacc taaaacaggt aaaattaaga 2460

aaatcatgtc tggtattaag agtcagcttc aggcgacacc cacagtcatt caagagcttt 2520

ctcagacagt atttaaagat attggacgta atcctgatca tgtttcaagc tttcaggcgc 2580

cttgttctat tttgaatcag cgtgtgagct catcgcgacg ttttgcagca cagtcttttg 2640

acctagatcg ttttcgtaat attgccaaat cgttgaatgt gaccattaat gatgttgtac 2700

tagcggtatg ttctggtgca ttacgtgcgt atttgatgag tcataatagt ttgccttcaa 2760

aaccattaat tgccatggtt ccagcctcta ttcgcaatga cgattcagat gtcagcaacc 2820

gtattacgat gattctggca aatttggcaa cccacaaaga tgatccttta caacgtcttg 2880

aaattatccg ccgtagtgtt caaaactcaa agcaacgctt caaacgtatg accagcgatc 2940

agattctaaa ttatagtgct gtcgtatatg gccctgcagg actcaacata atttctggca 3000

tgatgccaaa acgccaagcc ttcaatctgg ttatttccaa tgtgcctggc ccaagagagc 3060

cactttactg gaatggtgcc aaacttgatg cactctaccc agcttcaatt gtattagacg 3120

gtcaagcatt gaatattaca atgaccagtt atttagataa acttgaagtt ggtttgattg 3180

catgccgtaa tgcattgcca agaatgcaga atttactgac acatttagaa gaagaaattc 3240

aactatttga aggcgtaatt gcaaagcagg aagatattaa aacagccaat taaaaacaat 3300

aaacttgatt ttttaattta tcagataaaa ctaaagggct aaattagccc tcctaggctg 3360

ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg gtcttgaggg 3420

gttttttgct gaaacctcag gcatttgaga agcacacggt cacactgctt ccggtagtca 3480

ataaaccggt aaaccagcaa tagacataag cggctattta acgaccctgc cctgaaccga 3540

cgaccgggtc atcgtggccg gatcttgcgg cccctcggct tgaacgaatt gttagacatt 3600

atttgccgac taccttggtg atctcgcctt tcacgtagtg gacaaattct tccaactgat 3660

ctgcgcgcga ggccaagcga tcttcttctt gtccaagata agcctgtcta gcttcaagta 3720

tgacgggctg atactgggcc ggcaggcgct ccattgccca gtcggcagcg acatccttcg 3780

gcgcgatttt gccggttact gcgctgtacc aaatgcggga caacgtaagc actacatttc 3840

gctcatcgcc agcccagtcg ggcggcgagt tccatagcgt taaggtttca tttagcgcct 3900

caaatagatc ctgttcagga accggatcaa agagttcctc cgccgctgga cctaccaagg 3960

caacgctatg ttctcttgct tttgtcagca agatagccag atcaatgtcg atcgtggctg 4020

gctcgaagat acctgcaaga atgtcattgc gctgccattc tccaaattgc agttcgcgct 4080

tagctggata acgccacgga atgatgtcgt cgtgcacaac aatggtgact tctacagcgc 4140

ggagaatctc gctctctcca ggggaagccg aagtttccaa aaggtcgttg atcaaagctc 4200

gccgcgttgt ttcatcaagc cttacggtca ccgtaaccag caaatcaata tcactgtgtg 4260

gcttcaggcc gccatccact gcggagccgt acaaatgtac ggccagcaac gtcggttcga 4320

gatggcgctc gatgacgcca actacctctg atagttgagt cgatacttcg gcgatcaccg 4380

cttccctcat actcttcctt tttcaatatt attgaagcat ttatcagggt tattgtctca 4440

tgagcggata catatttgaa tgtatttaga aaaataaaca aatagctagc tcactcggtc 4500

gctacgctcc gggcgtgaga ctgcggcggg cgctgcggac acatacaaag ttacccacag 4560

attccgtgga taagcagggg actaacatgt gaggcaaaac agcagggccg cgccggtggc 4620

gtttttccat aggctccgcc ctcctgccag agttcacata aacagacgct tttccggtgc 4680

atctgtggga gccgtgaggc tcaaccatga atctgacagt acgggcgaaa cccgacagga 4740

cttaaagatc cccaccgttt ccggcgggtc gctccctctt gcgctctcct gttccgaccc 4800

tgccgtttac cggatacctg ttccgccttt ctcccttacg ggaagtgtgg cgctttctca 4860

tagctcacac actggtatct cggctcggtg taggtcgttc gctccaagct gggctgtaag 4920

caagaactcc ccgttcagcc cgactgctgc gccttatccg gtaactgttc acttgagtcc 4980

aacccggaaa agcacggtaa aacgccactg gcagcagcca ttggtaactg ggagttcgca 5040

gaggatttgt ttagctaaac acgcggttgc tcttgaagtg tgcgccaaag tccggctaca 5100

ctggaaggac agatttggtt gctgtgctct gcgaaagcca gttaccacgg ttaagcagtt 5160

ccccaactga cttaaccttc gatcaaacca cctccccagg tggttttttc gtttacaggg 5220

caaaagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctactgaa 5280

ccgctctaga tttcagtgca atttatctct tcaaatgtag cacctgaagt cagccccata 5340

cgatataagt tgtaattctc atgttagtca tgccccgcgc ccaccggaag gagctgactg 5400

ggttgaaggc tctcaagggc atcggtcgag atcccggtgc ctaatgagtg agctaactta 5460

cattaattgc gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 5520

attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc cagggtggtt 5580

tttcttttca ccagtgagac gggcaacagc tgattgccct tcaccgcctg gccctgagag 5640

agttgcagca agcggtccac gctggtttgc cccagcaggc gaaaatcctg tttgatggtg 5700

gttaacggcg ggatataaca tgagctgtct tcggtatcgt cgtatcccac taccgagatg 5760

tccgcaccaa cgcgcagccc ggactcggta atggcgcgca ttgcgcccag cgccatctga 5820

tcgttggcaa ccagcatcgc agtgggaacg atgccctcat tcagcatttg catggtttgt 5880

tgaaaaccgg acatggcact ccagtcgcct tcccgttccg ctatcggctg aatttgattg 5940

cgagtgagat atttatgcca gccagccaga cgcagacgcg ccgagacaga acttaatggg 6000

cccgctaaca gcgcgatttg ctggtgaccc aatgcgacca gatgctccac gcccagtcgc 6060

gtaccgtctt catgggagaa aataatactg ttgatgggtg tctggtcaga gacatcaaga 6120

aataacgccg gaacattagt gcaggcagct tccacagcaa tggcatcctg gtcatccagc 6180

ggatagttaa tgatcagccc actgacgcgt tgcgcgagaa gattgtgcac cgccgcttta 6240

caggcttcga cgccgcttcg ttctaccatc gacaccacca cgctggcacc cagttgatcg 6300

gcgcgagatt taatcgccgc gacaatttgc gacggcgcgt gcagggccag actggaggtg 6360

gcaacgccaa tcagcaacga ctgtttgccc gccagttgtt gtgccacgcg gttgggaatg 6420

taattcagct ccgccatcgc cgcttccact ttttcccgcg ttttcgcaga aacgtggctg 6480

gcctggttca ccacgcggga aacggtctga taagagacac cggcatactc tgcgacatcg 6540

tataacgtta ctggtttcac attcaccacc ctgaattgac tctcttccgg gcgctatcat 6600

gccataccgc gaaaggtttt gcgccattcg atggtgtccg ggatctcgac gctctccctt 6660

atgcgactcc tgcattagga aattaatacg actcactata 6700

<210> 9

<211> 60

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<220>

<221> 来源

<223> /注="组合的DNA/RNA分子的描述:合成的引物"

<400> 9

ctctagaaat aatttaactt taagtaggag auaggtaccc atggcggaca cgttattgat 60

<210> 10

<211> 58

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 10

cttcgaattc catttaaatt atttctagag tcattatgag tcatgattta ctaaaggc 58

<210> 11

<211> 65

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 11

ctctagaaat aattttagtt aagtataaga aggagatata ccatggtgaa gaaggtttgg 60

cttaa 65

<210> 12

<211> 51

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 12

cttcgaattc catttaaatt atttctagag ttatcaggct ttattgtcca c 51

<210> 13

<211> 5733

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的多核苷酸"

<400> 13

actcaccagt cacagaaaag catcttacgg atggcatgac agtaagagaa ttatgcagtg 60

ctgccataac catgagtgat aacactgcgg ccaacttact tctgacaacg atcggaggac 120

cgaaggagct aaccgctttt ttgcacaaca tgggggatca tgtaactcgc cttgatcgtt 180

gggaaccgga gctgaatgaa gccataccaa acgacgagcg tgacaccacg atgcctgcag 240

caatggcaac aacgttgcgc aaactattaa ctggcgaact acttactcta gcttcccggc 300

aacaattaat agactggatg gaggcggata aagttgcagg accacttctg cgctcggccc 360

ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg tctcgcggta 420

tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc tacacgacgg 480

ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt gcctcactga 540

ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt gatttaaaac 600

ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc atgaccaaaa 660

tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga tgatcttctt 720

gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc gccttgcagg 780

gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac tggcttggag 840

gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat gacttcaaga 900

ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc atgtctttcc 960

gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg aacggggggt 1020

tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt caggcgtgga 1080

atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg caggaacagg 1140

agagcgcacg agggagccgc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt 1200

tcgccaccac tgatttgagc gtcagatttc gtgatgcttg tcaggggggc ggagcctatg 1260

gaaaaacggc tttgccgcgg ccctctcact tccctgttaa gtatcttcct ggcatcttcc 1320

aggaaatctc cgccccgttc gtaagccatt tccgctcgcc gcagtcgaac gaccgagcgt 1380

agcgagtcag tgagcgagga agcggaatat atcctgtatc acatattctg ctgacgcacc 1440

ggtgcagcct tttttctcct gccacatgaa gcacttcact gacaccctca tcagtgccaa 1500

catagtaagc cagtatacac tccgctagcg ctgaggtctg cctcgtgaag aaggtgttgc 1560

tgactcatac caggcctgaa tcgccccatc atccagccag aaagtgaggg agccacggtt 1620

gatgagagct ttgttgtagg tggaccagtt ggtgattttg aacttttgct ttgccacgga 1680

acggtctgcg ttgtcgggaa gatgcgtgat ctgatccttc aactcagcaa aagttcgatt 1740

tattcaacaa agccacgttg tgtctcaaaa tctctgatgt tacattgcac aagataaaaa 1800

tatatcatca tgaacaataa aactgtctgc ttacataaac agtaatacaa ggggtgttat 1860

gagccatatt caacgggaaa cgtcttgctc gaggccgcga ttaaattcca acatggatgc 1920

tgatttatat gggtataaat gggctcgcga taatgtcggg caatcaggtg cgacaatcta 1980

tcgattgtat gggaagcccg atgcgccaga gttgtttctg aaacatggca aaggtagcgt 2040

tgccaatgat gttacagatg agatggtcag actaaactgg ctgacggaat ttatgcctct 2100

tccgaccatc aagcatttta tccgtactcc tgatgatgca tggttactca ccactgcgat 2160

ccccgggaaa acagcattcc aggtattaga agaatatcct gattcaggtg aaaatattgt 2220

tgatgcgctg gcagtgttcc tgcgccggtt gcattcgatt cctgtttgta attgtccttt 2280

taacagcgat cgcgtatttc gtctcgctca ggcgcaatca cgaatgaata acggtttggt 2340

tgatgcgagt gattttgatg acgagcgtaa tggctggcct gttgaacaag tctggaaaga 2400

aatgcataag cttttgccat tctcaccgga ttcagtcgtc actcatggtg atttctcact 2460

tgataacctt atttttgacg aggggaaatt aataggttgt attgatgttg gacgagtcgg 2520

aatcgcagac cgataccagg atcttgccat cctatggaac tgcctcggtg agttttctcc 2580

ttcattacag aaacggcttt ttcaaaaata tggtattgat aatcctgata tgaataaatt 2640

gcagtttcat ttgatgctcg atgagttttt ctaatcagaa ttggttaatt ggttgtaaca 2700

ctggcagagc attacgctga cttgacggga cggcggcttt gttgaataaa tcgaactttt 2760

gctgagttga aggatcagat cacgcatctt cccgacaacg cagaccgttc cgtggcaaag 2820

caaaagttca aaatcaccaa ctggtccacc tacaacaaag ctctcatcaa ccgtggctcc 2880

ctcactttct ggctggatga tggggcgatt caggcctggt atgagtcagc aacaccttct 2940

tcacgaggca gacctcagcg ctcaaagatg caggggtaaa agctaaccgc atctttaccg 3000

acaaggcatc cggcagttca acagatcggg aagggctgga tttgctgagg atgaaggtgg 3060

aggaaggtga tgtcattctg gtgaagaagc tcgaccgtct tggccgcgac accgccgaca 3120

tgatccaact gataaaagag tttgatgctc agggtgtagc ggttcggttt attgacgacg 3180

ggatcagtac cgacggtgat atggggcaaa tggtggtcac catcctgtcg gctgtggcac 3240

aggctgaacg ccggaggatc ctagagcgca cgaatgaggg ccgacaggaa gcaaagctga 3300

aaggaatcaa atttggccgc aggcgtaccg tggacaggaa cgtcgtgctg acgcttcatc 3360

agaagggcac tggtgcaacg gaaattgctc atcagctcag tattgcccgc tccacggttt 3420

ataaaattct tgaagacgaa agggcctcgt gatacgccta tttttatagg ttaatgtcat 3480

gataataatg gtttcttaga cgtcttaatt aatcaggaga gcgttcaccg acaaacaaca 3540

gataaaacga aaggcccagt ctttcgactg agcctttcgt tttatttgat gcctggcagt 3600

tccctactct cgcatgggga gaccccacac taccatcggc gctacggcgt ttcacttctg 3660

agttcggcat ggggtcaggt gggaccaccg cgctactgcc gccaggcaaa ttctgtttta 3720

tcagaccgct tctgcgttct gatttaatct gtatcaggct gaaaatcttc tctcatccgc 3780

caaaacagcc aagctggaga ccgtttaaac tcaatgatga tgatgatgat ggtcgacggc 3840

gctattcaga tcctcttctg agatgagttt ttgttcgggc ccaagcttcg aattcccata 3900

tggtaccagc tgcagatctc gagctcggat ccatggttta ttcctcctta tttaatcgat 3960

acattaatat atacctcttt aatttttaat aataaagtta atcgataatt ccggtcgagt 4020

gcccacacag attgtctgat aaattgttaa agagcagtgc cgcttcgctt tttctcagcg 4080

gcgctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacattat acgagccgga 4140

tgattaattg tcaacagctc atttcagaat atttgccaga accgttatga tgtcggcgca 4200

aaaaacatta tccagaacgg gagtgcgcct tgagcgacac gaattatgca gtgatttacg 4260

acctgcacag ccataccaca gcttccgatg gctgcctgac gccagaagca ttggtgcacc 4320

gtgcagtcga tgataagctg tcaaaccaga tcaattcgcg ctaactcaca ttaattgcgt 4380

tgcgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat taatgaatcg 4440

gccaacgcgc ggggagaggc ggtttgcgta ttgggcgcca gggtggtttt tcttttcacc 4500

agtgagacgg gcaacagctg attgcccttc accgcctggc cctgagagag ttgcagcaag 4560

cggtccacgc tggtttgccc cagcaggcga aaatcctgtt tgatggtggt tgacggcggg 4620

atataacatg agctgtcttc ggtatcgtcg tatcccacta ccgagatatc cgcaccaacg 4680

cgcagcccgg actcggtaat ggcgcgcatt gcgcccagcg ccatctgatc gttggcaacc 4740

agcatcgcag tgggaacgat gccctcattc agcatttgca tggtttgttg aaaaccggac 4800

atggcactcc agtcgccttc ccgttccgct atcggctgaa tttgattgcg agtgagatat 4860

ttatgccagc cagccagacg cagacgcgcc gagacagaac ttaatgggcc cgctaacagc 4920

gcgatttgct ggtgacccaa tgcgaccaga tgctccacgc ccagtcgcgt accgtcttca 4980

tgggagaaaa taatactgtt gatgggtgtc tggtcagaga catcaagaaa taacgccgga 5040

acattagtgc aggcagcttc cacagcaatg gcatcctggt catccagcgg atagttaatg 5100

atcagcccac tgacgcgttg cgcgagaaga ttgtgcaccg ccgctttaca ggcttcgacg 5160

ccgcttcgtt ctaccatcga caccaccacg ctggcaccca gttgatcggc gcgagattta 5220

atcgccgcga caatttgcga cggcgcgtgc agggccagac tggaggtggc aacgccaatc 5280

agcaacgact gtttgcccgc cagttgttgt gccacgcggt tgggaatgta attcagctcc 5340

gccatcgccg cttccacttt ttcccgcgtt ttcgcagaaa cgtggctggc ctggttcacc 5400

acgcgggaaa cggtctgata agagacaccg gcatactctg cgacatcgta taacgttact 5460

ggtttcacat tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga 5520

aaggttttgc accattcgat ggtgtcaacg taaatgcatg ccgcttcgcc ttcgcgcgcg 5580

aattgatctg ctgcctcgcg cgtttcggtg atgacggtga aaacctctga cacatgcagc 5640

tcccggagac ggtcacagct tgtctgtaag cggatgccgg gagcagacaa gcccgtcagg 5700

gcgcgtcagc gggtgttggc ggggccggcc tcg 5733

<210> 14

<211> 36

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 14

gggtcaatag cggccgccaa ttcgcgcgcg aaggcg 36

<210> 15

<211> 37

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 15

tggcgcgcct cctagggcat tacgctgact tgacggg 37

<210> 16

<211> 15179

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的多核苷酸"

<400> 16

ggccacgatg cgtccggcgt agaggatctg ctcatgtttg acagcttatc atcgatgcat 60

aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 120

cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 180

cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 240

agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 300

tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 360

taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 420

gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 480

cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 540

gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 600

gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 660

ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 720

cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 780

agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 840

gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 900

ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 960

ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 1020

ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1080

attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1140

ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1200

tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1260

ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1320

ctactgtttc tccatacccg tttttttggg ctagcgaatt cgagctcggt acccaagtct 1380

taaactagac agaatagttg taaactgaaa tcagtccagt tatgctgtga aaaagcatac 1440

tggacttttg ttatggctaa agcaaactct tcattttctg aagtgcaaat tgcccgtcgt 1500

attaaagagg ggcgtggcca agggcatggt aaagactata ttccatggct aacagtacaa 1560

gaagttcctt cttcaggtcg ttcccaccgt atttattctc ataagacggg acgagtccat 1620

catttgctat ctgacttaga gcttgctgtt tttctcagtc ttgagtggga gagcagcgtg 1680

ctagatatac gcgagcagtt ccccttatta cctagtgata ccaggcagat tgcaatagat 1740

agtggtatta agcatcctgt tattcgtggt gtagatcagg ttatgtctac tgatttttta 1800

gtggactgca aagatggtcc ttttgagcag tttgctattc aagtcaaacc tgcagcagcc 1860

ttacaagacg agcgtacctt agaaaaacta gaactagagc gtcgctattg gcagcaaaag 1920

caaattcctt ggttcatttt tactgataaa gaaataaatc ccgtagtaaa agaaaatatt 1980

gaatggcttt attcagtgaa aacagaagaa gtttctgcgg agcttttagc acaactatcc 2040

ccattggccc atatcctgca agaaaaagga gatgaaaaca ttatcaatgt ctgtaagcag 2100

gttgatattg cttatgattt ggagttaggc aaaacattga gtgagatacg agccttaacc 2160

gcaaatggtt ttattaagtt caatatttat aagtctttca gggcaaataa gtgtgcagat 2220

ctctgtatta gccaagtagt gaatatggag gagttgcgct atgtggcaaa ttaatgaggt 2280

tgtgctattt gataatgatc cgtatcgcat tttggctata gaggatggcc aagttgtctg 2340

gatgcaaata agcgctgata aaggagttcc acaagctagg gctgagttgt tgctaatgca 2400

gtatttagat gaaggccgct tagttagaac tgatgaccct tatgtacatc ttgatttaga 2460

agagccgtct gtagattctg tcagcttcca gaagcgcgag gaggattatc gaaaaattct 2520

tcctattatt aatagtaagg atcgtttcga ccctaaagtc agaagcgaac tcgttgagca 2580

tgtggtccaa gaacataagg ttactaaggc tacagtttat aagttgttac gccgttactg 2640

gcagcgtggt caaacgccta atgcattaat tcctgactac aaaaacagcg gtgcaccagg 2700

ggaaagacgt tcagcgacag gaacagcaaa gattggccga gccagagaat atggtaaggg 2760

tgaaggaacc aaggtaacgc ccgagattga acgccttttt aggttgacca tagaaaagca 2820

cctgttaaat caaaaaggta caaagaccac cgttgcctat agacgatttg tggacttgtt 2880

tgctcagtat tttcctcgca ttccccaaga ggattaccca acactacgtc agtttcgtta 2940

tttttatgat cgagaatacc ctaaagctca gcgcttaaag tctagagtta aagcaggggt 3000

atataaaaaa gacgtacgac ccttaagtag tacagccact tctcaggcgt taggccctgg 3060

gagtcgttat gagattgatg ccacgattgc tgatatttat ttagtggatc atcatgatcg 3120

ccaaaaaatc ataggaagac caacgcttta cattgtgatt gatgtgttta gtcggatgat 3180

cacgggcttt tatatcggct ttgaaaatcc gtcttatgtg gtggcgatgc aggcttttgt 3240

aaatgcttgc tctgacaaaa cggccatttg tgcccagcat gatattgaga ttagtagctc 3300

agactggccg tgtgtaggtt tgccagatgt gttgctagcg gaccgtggcg aattaatgag 3360

tcatcaggtc gaagccttag tttctagttt taatgtgcga gtggaaagtg ctccacctag 3420

acgtggcgat gctaaaggca tagtggaaag cacttttaga acactacaag ccgagtttaa 3480

gtcctttgca cctggcattg tagagggcag tcggatcaaa agccatggtg aaacagacta 3540

taggttagat gcatctctgt cggtatttga gttcacacaa attattttgc gtacgatctt 3600

attcagaaat aaccatctgg tgatggataa atacgatcga gatgctgatt ttcctacaga 3660

tttaccgtct attcctgtcc agctatggca atggggtatg cagcatcgta caggtagttt 3720

aagggctgtg gagcaagagc agttgcgagt agcgttactg cctcgccgaa aggtctctat 3780

ttcttcattt ggcgttaatt tgtggggttt gtattactcg gggtcagaga ttctgcgtga 3840

gggttggttg cagcggagca ctgatatagc tagacctcaa catttagaag cggcttatga 3900

cccagtgctg gttgatacga tttatttgtt tccgcaagtt ggcagccgtg tattttggcg 3960

ctgtaatctg acggaacgta gtcggcagtt taaaggtctc tcattttggg aggtttggga 4020

tatacaagca caagaaaaac acaataaagc caatgcgaag caggatgagt taactaaacg 4080

cagggagctt gaggcgttta ttcagcaaac cattcagaaa gcgaataagt taacgcccag 4140

tactactgag cccaaatcaa cacgcattaa gcagattaaa actaataaaa aagaagccgt 4200

gacctcggag cgtaaaaaac gtgcggagca tttgaagcca agctcttcag gtgatgaggc 4260

taaagttatt cctttcaacg cagtggaagc ggatgatcaa gaagattaca gcctacccac 4320

atacgtgcct gaattatttc aggatccacc agaaaaggat gagtcatgag tgctacccgg 4380

attcaagcag tttatcgtga tacgggggta gaggcttatc gtgataatcc ttttatcgag 4440

gccttaccac cattacaaga gtcagtgaat agtgctgcat cactgaaatc ctctttacag 4500

cttacttcct ctgacttgca aaagtcccgt gttatcagag ctcataccat ttgtcgtatt 4560

ccagatgact attttcagcc attaggtacg catttgctac taagtgagcg tatttcggtc 4620

atgattcgag gtggctacgt aggcagaaat cctaaaacag gagatttaca aaagcattta 4680

caaaatggtt atgagcgtgt tcaaacggga gagttggaga catttcgctt tgaggaggca 4740

cgatctacgg cacaaagctt attgttaatt ggttgttctg gtagtgggaa gacgacctct 4800

cttcatcgta ttctagccac gtatcctcag gtgatttacc atcgtgaact caatgtagag 4860

caggtggtgt atttgaaaat agactgctcg cataatggtt cgctaaaaga aatctgcttg 4920

aattttttca gagcgttgga tcgagccttg ggctcgaact atgagcgtcg ttatggctta 4980

aaacgtcatg gtatagaaac catgttggct ttgatgtcgc aaatagccaa tgcacatgct 5040

ttagggttgt tggttattga tgaaattcag catttaagcc gctctcgttc gggtggatct 5100

caagagatgc tgaacttttt tgtgacgatg gtgaatatta ttggcgtacc agtgatgttg 5160

attggtaccc ctaaagcacg agagattttt gaggctgatt tgcggtctgc acgtagaggg 5220

gcagggtttg gagctatatt ctgggatcct atacaacaaa cgcaacgtgg aaagcccaat 5280

caagagtgga tcgcttttac ggataatctt tggcaattac agcttttaca acgcaaagat 5340

gcgctgttat cggatgaggt ccgtgatgtg tggtatgagc taagccaagg agtgatggac 5400

attgtagtaa aactttttgt actcgctcag ctccgtgcgc tagctttagg caatgagcgt 5460

attaccgctg gtttattgcg gcaagtgtat caagatgagt taaagcctgt gcaccccatg 5520

ctagaggcat tacgctcggg tatcccagaa cgcattgctc gttattctga tctagtcgtt 5580

cccgagattg ataaacggtt aatccaactt cagctagata tcgcagcgat acaagaacaa 5640

acaccagaag aaaaagccct tcaagagtta gataccgaag atcagcgtca tttatatctg 5700

atgctgaaag aggattacga ttcaagcctg ttaattccca ctattaaaaa agcgtttagc 5760

cagaatccaa cgatgacaag acaaaagtta ctgcctcttg ttttgcagtg gttgatggaa 5820

ggcgaaacgg tagtgtcaga actagaaaag ccctccaaga gtaaaaaggt ttcggctata 5880

aaggtagtca agcccagcga ctgggatagc ttgcctgata cggatttacg ttatatctat 5940

tcacaacgcc aacctgaaaa aaccatgcat gaacggttaa aagggaaagg ggtaatagtg 6000

gatatggcga gcttatttaa acaagcaggt tagccatgag aaactttcct gttccgtact 6060

cgaatgagct gatttatagc actattgcac gggcaggcgt ttatcaaggg attgttagtc 6120

ctaagcagct gttggatgag gtgtatggca accgcaaggt ggtcgctacc ttaggtctgc 6180

cctcgcattt aggtgtgata gcaagacatc tacatcaaac aggacgttac gctgttcagc 6240

agcttattta tgagcatacc ttattccctt tatatgctcc gtttgtaggc aaggagcgcc 6300

gagacgaagc tattcggtta atggagtacc aagcgcaagg tgcggtgcat ttaatgctag 6360

gagtcgctgc ttctagagtt aagagcgata accgctttag atactgccct gattgcgttg 6420

ctcttcagct aaataggtat ggggaagcct tttggcaacg agattggtat ttgcccgctt 6480

tgccatattg tccaaaacac ggtgctttag tcttctttga tagagctgta gatgatcacc 6540

gacatcaatt ttgggctttg ggtcatactg agctgctttc agactacccc aaagactccc 6600

tatctcaatt aacagcacta gctgcttata tagcccctct gttagatgct ccacgagcgc 6660

aagagctttc cccaagcctt gagcagtgga cgctgtttta tcagcgctta gcgcaggatc 6720

tagggctaac caaaagcaag cacattcgtc atgacttggt ggcggagaga gtgaggcaga 6780

cttttagtga tgaggcacta gagaaactgg atttaaagtt ggcagagaac aaggacacgt 6840

gttggctgaa aagtatattc cgtaagcata gaaaagcctt tagttattta cagcatagta 6900

ttgtgtggca agccttattg ccaaaactaa cggttataga agcgctacag caggcaagtg 6960

ctcttactga gcactctata acgacaagac ctgttagcca gtctgtgcaa cctaactctg 7020

aagatttatc tgttaagcat aaagactggc agcaactagt gcataaatac caaggaatta 7080

aggcggcaag acagtcttta gagggtgggg tgctatacgc ttggctttac cgacatgaca 7140

gggattggct agttcactgg aatcaacagc atcaacaaga gcgtctggca cccgccccta 7200

gagttgattg gaaccaaaga gatcgaattg ctgtacgaca actattaaga atcataaagc 7260

gtctagatag tagccttgat cacccaagag cgacatcgag ctggctgtta aagcaaactc 7320

ctaacggaac ctctcttgca aaaaatctac agaaactgcc tttggtagcg ctttgcttaa 7380

agcgttactc agagagtgtg gaagattatc aaattagacg gattagccaa gcttttatta 7440

agcttaaaca ggaagatgtt gagcttaggc gctggcgatt attaagaagt gcaacgttat 7500

ctaaagagcg gataactgag gaagcacaaa gattcttgga aatggtttat ggggaagagt 7560

gagtggttag gctagctaca tttaatgaca atgtgcaggt tgtacatatt ggtcatttat 7620

tccgtaactc gggtcataag gagtggcgta tttttgtttg gtttaatcca atgcaagaac 7680

ggaaatggac tcgatttact catttgcctt tattaagtcg agctaaggtg gttaacagta 7740

caacaaagca aataaataag gcggatcgtg tgattgagtt tgaagcatcg gatcttcaac 7800

gagccaaaat aatcgatttt cctaatctct cgtcctttgc ttccgtacgc aacaaggatg 7860

gagcgcagag ttcatttatt tacgaagctg aaacaccata tagcaagact cgttatcaca 7920

tcccacagtt agagctagct cggtcattat ttttagggga tcctctagag tcgacctgca 7980

ggcatgcaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 8040

atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 8100

cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 8160

gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 8220

aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 8280

atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 8340

gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 8400

ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 8460

atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 8520

caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 8580

cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 8640

tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 8700

tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac 8760

gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 8820

tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 8880

gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 8940

aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 9000

gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgcagca 9060

atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 9120

caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 9180

ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 9240

attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 9300

agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 9360

aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttacgcgcc 9420

ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 9480

tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 9540

cgccggccag cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac 9600

agtgaagaag gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggcggcat 9660

caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 9720

tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 9780

cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 9840

gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 9900

gcgtcgatcc ccgacagtaa gacgggtaag cctgttgatg ataccgctgc cttactgggt 9960

gcattagcca gtctgaatga cctgtcacgg gataatccga agtggtcaga ctggaaaatc 10020

agagggcagg aactgctgaa cagcaaaaag tcagatagca ccacatagca gacccgccat 10080

aaaacgccct gagaagcccg tgacgggctt ttcttgtatt atgggtagtt tccttgcatg 10140

aatccataaa aggcgcctgt agtgccattt acccccattc actgccagag ccgtgagcgc 10200

agcgaactga atgtcacgaa aaagacagcg actcaggtgc ctgatggtcg gagacaaaag 10260

gaatattcag cgatttgccc gagcttgcga gggtgctact taagccttta gggttttaag 10320

gtctgttttg tagaggagca aacagcgttt gcgacatcct tttgtaatac tgcggaactg 10380

actaaagtag tgagttatac acagggctgg gatctattct ttttatcttt ttttattctt 10440

tctttattct ataaattata accacttgaa tataaacaaa aaaaacacac aaaggtctag 10500

cggaatttac agagggtcta gcagaattta caagttttcc agcaaaggtc tagcagaatt 10560

tacagatacc cacaactcaa aggaaaagga ctagtaatta tcattgacta gcccatctca 10620

attggtatag tgattaaaat cacctagacc aattgagatg tatgtctgaa ttagttgttt 10680

tcaaagcaaa tgaactagcg attagtcgct atgacttaac ggagcatgaa accaagctaa 10740

ttttatgctg tgtggcacta ctcaacccca cgattgaaaa ccctacaagg aaagaacgga 10800

cggtatcgtt cacttataac caatacgttc agatgatgaa catcagtagg gaaaatgctt 10860

atggtgtatt agctaaagca accagagagc tgatgacgag aactgtggaa atcaggaatc 10920

ctttggttaa aggctttgag attttccagt ggacaaacta tgccaagttc tcaagcgaaa 10980

aattagaatt agtttttagt gaagagatat tgccttatct tttccagtta aaaaaattca 11040

taaaatataa tctggaacat gttaagtctt ttgaaaacaa atactctatg aggatttatg 11100

agtggttatt aaaagaacta acacaaaaga aaactcacaa ggcaaatata gagattagcc 11160

ttgatgaatt taagttcatg ttaatgcttg aaaataacta ccatgagttt aaaaggctta 11220

accaatgggt tttgaaacca ataagtaaag atttaaacac ttacagcaat atgaaattgg 11280

tggttgataa gcgaggccgc ccgactgata cgttgatttt ccaagttgaa ctagatagac 11340

aaatggatct cgtaaccgaa cttgagaaca accagataaa aatgaatggt gacaaaatac 11400

caacaaccat tacatcagat tcctacctac ataacggact aagaaaaaca ctacacgatg 11460

ctttaactgc aaaaattcag ctcaccagtt ttgaggcaaa atttttgagt gacatgcaaa 11520

gtaagtatga tctcaatggt tcgttctcat ggctcacgca aaaacaacga accacactag 11580

agaacatact ggctaaatac ggaaggatct gaggttctta tggctcttgt atctatcagt 11640

gaagcatcaa gactaacaaa caaaagtaga acaactgttc accgttacat atcaaaggga 11700

aaactgtcca tatgcacaga tgaaaacggt gtaaaaaaga tagatacatc agagctttta 11760

cgagtttttg gtgcatttaa agctgttcac catgaacaga tcgacaatgt aacagatgaa 11820

cagcatgtaa cacctaatag aacaggtgaa accagtaaaa caaagcaact agaacatgaa 11880

attgaacacc tgagacaact tgttacagct caacagtcac acatagacag cctgaaacag 11940

gcgatgctgc ttatcgaatc aaagctgccg acaacacggg agccagtgac gcctcccgtg 12000

gggaaaaaat catggcaatt ctggaagaaa tagcgctttc agcctgtggg cggacaaaat 12060

agttgggaac tgggaggggt ggaaatggag tttttaagga ttatttaggg aagagtgaca 12120

aaatagatgg gaactgggtg tagcgtcgta agctaatacg aaaattaaaa atgacaaaat 12180

agtttggaac tagatttcac ttatctggtt ggtcgacact agtattaccc tgttatccct 12240

agatttaaat gatatcggat cctagtaagc cacgttttaa ttaatcagat gggtcaatag 12300

cggccgccaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 12360

gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 12420

gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 12480

cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 12540

agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 12600

acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat 12660

tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt 12720

agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt 12780

cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc 12840

ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat 12900

tattttctcc catgaagacg gtacgcgact gggcgtggag catctggtcg cattgggtca 12960

ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc 13020

tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga 13080

ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc 13140

cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga 13200

gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagacag 13260

ctcatgttat atcccgccgt caaccaccat caaacaggat tttcgcctgc tggggcaaac 13320

cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt 13380

gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc 13440

ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 13500

gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt gatctggttt gacagcttat 13560

catcgactgc acggtgcacc aatgcttctg gcgtcaggca gccatcggaa gctgtggtat 13620

ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 13680

gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt 13740

gacaattaat catccggctc gtataatgtg tggaattgtg agcggataac aatttcacac 13800

aggaaacagc gccgctgaga aaaagcgaag cggcactgct ctttaacaat ttatcagaca 13860

atctgtgtgg gcactcgacc ggaattatcg attaacttta ttattaaaaa ttaaagaggt 13920

atatattaat gtatcgatta aataaggagg aataaaccat ggcggacacg ttattgattc 13980

tgggtgatag cctgagcgcc gggtatcgaa tgtctgccag cgcggcctgg cctgccttgt 14040

tgaatgataa gtggcagagt aaaacgtcgg tagttaatgc cagcatcagc ggcgacacct 14100

cgcaacaagg actggcgcgc cttccggctc tgctgaaaca gcatcagccg cgttgggtgc 14160

tggttgaact gggcggcaat gacggtttgc gtggttttca gccacagcaa accgagcaaa 14220

cgctgcgcca gattttgcag gatgtcaaag ccgccaacgc tgaaccattg ttaatgcaaa 14280

tacgtctgcc tgcaaactat ggtcgccgtt ataatgaagc ctttagcgcc atttacccca 14340

aactcgccaa agagtttgat gttccgctgc tgcccttttt tatggaagag gtctacctca 14400

agccacaatg gatgcaggat gacggtattc atcccaaccg cgacgcccag ccgtttattg 14460

ccgactggat ggcgaagcag ttgcagcctt tagtaaatca tgactcataa tgactctaga 14520

aataatttaa atggaattcg aagcttgggc ccgaacaaaa actcatctca gaagaggatc 14580

tgaatagcgc cgtcgaccat catcatcatc atcattgagt ttaaacggtc tccagcttgg 14640

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 14700

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 14760

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 14820

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 14880

gttttatctg ttgtttgtcg gtgaacgctc tcctgattaa ttaagacgtc ccgtcaagtc 14940

agcgtaatgc cctaggaggc gcgccacggc cgcgtcgacc ccacgcccct ctttaatacg 15000

acgggcaatt tgcacttcag aaaatgaaga gtttgcttta gccataacaa aagtccagta 15060

tgctttttca cagcataact ggactgattt cagtttacaa ctattctgtc tagtttaaga 15120

ctttattgtc atagtttaga tctattttgt tcagtttaag actttattgt ccgcccaca 15179

<210> 17

<211> 17683

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的多核苷酸"

<400> 17

ggccacgatg cgtccggcgt agaggatctg ctcatgtttg acagcttatc atcgatgcat 60

aatgtgcctg tcaaatggac gaagcaggga ttctgcaaac cctatgctac tccgtcaagc 120

cgtcaattgt ctgattcgtt accaattatg acaacttgac ggctacatca ttcacttttt 180

cttcacaacc ggcacggaac tcgctcgggc tggccccggt gcatttttta aatacccgcg 240

agaaatagag ttgatcgtca aaaccaacat tgcgaccgac ggtggcgata ggcatccggg 300

tggtgctcaa aagcagcttc gcctggctga tacgttggtc ctcgcgccag cttaagacgc 360

taatccctaa ctgctggcgg aaaagatgtg acagacgcga cggcgacaag caaacatgct 420

gtgcgacgct ggcgatatca aaattgctgt ctgccaggtg atcgctgatg tactgacaag 480

cctcgcgtac ccgattatcc atcggtggat ggagcgactc gttaatcgct tccatgcgcc 540

gcagtaacaa ttgctcaagc agatttatcg ccagcagctc cgaatagcgc ccttcccctt 600

gcccggcgtt aatgatttgc ccaaacaggt cgctgaaatg cggctggtgc gcttcatccg 660

ggcgaaagaa ccccgtattg gcaaatattg acggccagtt aagccattca tgccagtagg 720

cgcgcggacg aaagtaaacc cactggtgat accattcgcg agcctccgga tgacgaccgt 780

agtgatgaat ctctcctggc gggaacagca aaatatcacc cggtcggcaa acaaattctc 840

gtccctgatt tttcaccacc ccctgaccgc gaatggtgag attgagaata taacctttca 900

ttcccagcgg tcggtcgata aaaaaatcga gataaccgtt ggcctcaatc ggcgttaaac 960

ccgccaccag atgggcatta aacgagtatc ccggcagcag gggatcattt tgcgcttcag 1020

ccatactttt catactcccg ccattcagag aagaaaccaa ttgtccatat tgcatcagac 1080

attgccgtca ctgcgtcttt tactggctct tctcgctaac caaaccggta accccgctta 1140

ttaaaagcat tctgtaacaa agcgggacca aagccatgac aaaaacgcgt aacaaaagtg 1200

tctataatca cggcagaaaa gtccacattg attatttgca cggcgtcaca ctttgctatg 1260

ccatagcatt tttatccata agattagcgg atcctacctg acgcttttta tcgcaactct 1320

ctactgtttc tccatacccg tttttttggg ctagcgaatt cgagctcggt acccaagtct 1380

taaactagac agaatagttg taaactgaaa tcagtccagt tatgctgtga aaaagcatac 1440

tggacttttg ttatggctaa agcaaactct tcattttctg aagtgcaaat tgcccgtcgt 1500

attaaagagg ggcgtggcca agggcatggt aaagactata ttccatggct aacagtacaa 1560

gaagttcctt cttcaggtcg ttcccaccgt atttattctc ataagacggg acgagtccat 1620

catttgctat ctgacttaga gcttgctgtt tttctcagtc ttgagtggga gagcagcgtg 1680

ctagatatac gcgagcagtt ccccttatta cctagtgata ccaggcagat tgcaatagat 1740

agtggtatta agcatcctgt tattcgtggt gtagatcagg ttatgtctac tgatttttta 1800

gtggactgca aagatggtcc ttttgagcag tttgctattc aagtcaaacc tgcagcagcc 1860

ttacaagacg agcgtacctt agaaaaacta gaactagagc gtcgctattg gcagcaaaag 1920

caaattcctt ggttcatttt tactgataaa gaaataaatc ccgtagtaaa agaaaatatt 1980

gaatggcttt attcagtgaa aacagaagaa gtttctgcgg agcttttagc acaactatcc 2040

ccattggccc atatcctgca agaaaaagga gatgaaaaca ttatcaatgt ctgtaagcag 2100

gttgatattg cttatgattt ggagttaggc aaaacattga gtgagatacg agccttaacc 2160

gcaaatggtt ttattaagtt caatatttat aagtctttca gggcaaataa gtgtgcagat 2220

ctctgtatta gccaagtagt gaatatggag gagttgcgct atgtggcaaa ttaatgaggt 2280

tgtgctattt gataatgatc cgtatcgcat tttggctata gaggatggcc aagttgtctg 2340

gatgcaaata agcgctgata aaggagttcc acaagctagg gctgagttgt tgctaatgca 2400

gtatttagat gaaggccgct tagttagaac tgatgaccct tatgtacatc ttgatttaga 2460

agagccgtct gtagattctg tcagcttcca gaagcgcgag gaggattatc gaaaaattct 2520

tcctattatt aatagtaagg atcgtttcga ccctaaagtc agaagcgaac tcgttgagca 2580

tgtggtccaa gaacataagg ttactaaggc tacagtttat aagttgttac gccgttactg 2640

gcagcgtggt caaacgccta atgcattaat tcctgactac aaaaacagcg gtgcaccagg 2700

ggaaagacgt tcagcgacag gaacagcaaa gattggccga gccagagaat atggtaaggg 2760

tgaaggaacc aaggtaacgc ccgagattga acgccttttt aggttgacca tagaaaagca 2820

cctgttaaat caaaaaggta caaagaccac cgttgcctat agacgatttg tggacttgtt 2880

tgctcagtat tttcctcgca ttccccaaga ggattaccca acactacgtc agtttcgtta 2940

tttttatgat cgagaatacc ctaaagctca gcgcttaaag tctagagtta aagcaggggt 3000

atataaaaaa gacgtacgac ccttaagtag tacagccact tctcaggcgt taggccctgg 3060

gagtcgttat gagattgatg ccacgattgc tgatatttat ttagtggatc atcatgatcg 3120

ccaaaaaatc ataggaagac caacgcttta cattgtgatt gatgtgttta gtcggatgat 3180

cacgggcttt tatatcggct ttgaaaatcc gtcttatgtg gtggcgatgc aggcttttgt 3240

aaatgcttgc tctgacaaaa cggccatttg tgcccagcat gatattgaga ttagtagctc 3300

agactggccg tgtgtaggtt tgccagatgt gttgctagcg gaccgtggcg aattaatgag 3360

tcatcaggtc gaagccttag tttctagttt taatgtgcga gtggaaagtg ctccacctag 3420

acgtggcgat gctaaaggca tagtggaaag cacttttaga acactacaag ccgagtttaa 3480

gtcctttgca cctggcattg tagagggcag tcggatcaaa agccatggtg aaacagacta 3540

taggttagat gcatctctgt cggtatttga gttcacacaa attattttgc gtacgatctt 3600

attcagaaat aaccatctgg tgatggataa atacgatcga gatgctgatt ttcctacaga 3660

tttaccgtct attcctgtcc agctatggca atggggtatg cagcatcgta caggtagttt 3720

aagggctgtg gagcaagagc agttgcgagt agcgttactg cctcgccgaa aggtctctat 3780

ttcttcattt ggcgttaatt tgtggggttt gtattactcg gggtcagaga ttctgcgtga 3840

gggttggttg cagcggagca ctgatatagc tagacctcaa catttagaag cggcttatga 3900

cccagtgctg gttgatacga tttatttgtt tccgcaagtt ggcagccgtg tattttggcg 3960

ctgtaatctg acggaacgta gtcggcagtt taaaggtctc tcattttggg aggtttggga 4020

tatacaagca caagaaaaac acaataaagc caatgcgaag caggatgagt taactaaacg 4080

cagggagctt gaggcgttta ttcagcaaac cattcagaaa gcgaataagt taacgcccag 4140

tactactgag cccaaatcaa cacgcattaa gcagattaaa actaataaaa aagaagccgt 4200

gacctcggag cgtaaaaaac gtgcggagca tttgaagcca agctcttcag gtgatgaggc 4260

taaagttatt cctttcaacg cagtggaagc ggatgatcaa gaagattaca gcctacccac 4320

atacgtgcct gaattatttc aggatccacc agaaaaggat gagtcatgag tgctacccgg 4380

attcaagcag tttatcgtga tacgggggta gaggcttatc gtgataatcc ttttatcgag 4440

gccttaccac cattacaaga gtcagtgaat agtgctgcat cactgaaatc ctctttacag 4500

cttacttcct ctgacttgca aaagtcccgt gttatcagag ctcataccat ttgtcgtatt 4560

ccagatgact attttcagcc attaggtacg catttgctac taagtgagcg tatttcggtc 4620

atgattcgag gtggctacgt aggcagaaat cctaaaacag gagatttaca aaagcattta 4680

caaaatggtt atgagcgtgt tcaaacggga gagttggaga catttcgctt tgaggaggca 4740

cgatctacgg cacaaagctt attgttaatt ggttgttctg gtagtgggaa gacgacctct 4800

cttcatcgta ttctagccac gtatcctcag gtgatttacc atcgtgaact caatgtagag 4860

caggtggtgt atttgaaaat agactgctcg cataatggtt cgctaaaaga aatctgcttg 4920

aattttttca gagcgttgga tcgagccttg ggctcgaact atgagcgtcg ttatggctta 4980

aaacgtcatg gtatagaaac catgttggct ttgatgtcgc aaatagccaa tgcacatgct 5040

ttagggttgt tggttattga tgaaattcag catttaagcc gctctcgttc gggtggatct 5100

caagagatgc tgaacttttt tgtgacgatg gtgaatatta ttggcgtacc agtgatgttg 5160

attggtaccc ctaaagcacg agagattttt gaggctgatt tgcggtctgc acgtagaggg 5220

gcagggtttg gagctatatt ctgggatcct atacaacaaa cgcaacgtgg aaagcccaat 5280

caagagtgga tcgcttttac ggataatctt tggcaattac agcttttaca acgcaaagat 5340

gcgctgttat cggatgaggt ccgtgatgtg tggtatgagc taagccaagg agtgatggac 5400

attgtagtaa aactttttgt actcgctcag ctccgtgcgc tagctttagg caatgagcgt 5460

attaccgctg gtttattgcg gcaagtgtat caagatgagt taaagcctgt gcaccccatg 5520

ctagaggcat tacgctcggg tatcccagaa cgcattgctc gttattctga tctagtcgtt 5580

cccgagattg ataaacggtt aatccaactt cagctagata tcgcagcgat acaagaacaa 5640

acaccagaag aaaaagccct tcaagagtta gataccgaag atcagcgtca tttatatctg 5700

atgctgaaag aggattacga ttcaagcctg ttaattccca ctattaaaaa agcgtttagc 5760

cagaatccaa cgatgacaag acaaaagtta ctgcctcttg ttttgcagtg gttgatggaa 5820

ggcgaaacgg tagtgtcaga actagaaaag ccctccaaga gtaaaaaggt ttcggctata 5880

aaggtagtca agcccagcga ctgggatagc ttgcctgata cggatttacg ttatatctat 5940

tcacaacgcc aacctgaaaa aaccatgcat gaacggttaa aagggaaagg ggtaatagtg 6000

gatatggcga gcttatttaa acaagcaggt tagccatgag aaactttcct gttccgtact 6060

cgaatgagct gatttatagc actattgcac gggcaggcgt ttatcaaggg attgttagtc 6120

ctaagcagct gttggatgag gtgtatggca accgcaaggt ggtcgctacc ttaggtctgc 6180

cctcgcattt aggtgtgata gcaagacatc tacatcaaac aggacgttac gctgttcagc 6240

agcttattta tgagcatacc ttattccctt tatatgctcc gtttgtaggc aaggagcgcc 6300

gagacgaagc tattcggtta atggagtacc aagcgcaagg tgcggtgcat ttaatgctag 6360

gagtcgctgc ttctagagtt aagagcgata accgctttag atactgccct gattgcgttg 6420

ctcttcagct aaataggtat ggggaagcct tttggcaacg agattggtat ttgcccgctt 6480

tgccatattg tccaaaacac ggtgctttag tcttctttga tagagctgta gatgatcacc 6540

gacatcaatt ttgggctttg ggtcatactg agctgctttc agactacccc aaagactccc 6600

tatctcaatt aacagcacta gctgcttata tagcccctct gttagatgct ccacgagcgc 6660

aagagctttc cccaagcctt gagcagtgga cgctgtttta tcagcgctta gcgcaggatc 6720

tagggctaac caaaagcaag cacattcgtc atgacttggt ggcggagaga gtgaggcaga 6780

cttttagtga tgaggcacta gagaaactgg atttaaagtt ggcagagaac aaggacacgt 6840

gttggctgaa aagtatattc cgtaagcata gaaaagcctt tagttattta cagcatagta 6900

ttgtgtggca agccttattg ccaaaactaa cggttataga agcgctacag caggcaagtg 6960

ctcttactga gcactctata acgacaagac ctgttagcca gtctgtgcaa cctaactctg 7020

aagatttatc tgttaagcat aaagactggc agcaactagt gcataaatac caaggaatta 7080

aggcggcaag acagtcttta gagggtgggg tgctatacgc ttggctttac cgacatgaca 7140

gggattggct agttcactgg aatcaacagc atcaacaaga gcgtctggca cccgccccta 7200

gagttgattg gaaccaaaga gatcgaattg ctgtacgaca actattaaga atcataaagc 7260

gtctagatag tagccttgat cacccaagag cgacatcgag ctggctgtta aagcaaactc 7320

ctaacggaac ctctcttgca aaaaatctac agaaactgcc tttggtagcg ctttgcttaa 7380

agcgttactc agagagtgtg gaagattatc aaattagacg gattagccaa gcttttatta 7440

agcttaaaca ggaagatgtt gagcttaggc gctggcgatt attaagaagt gcaacgttat 7500

ctaaagagcg gataactgag gaagcacaaa gattcttgga aatggtttat ggggaagagt 7560

gagtggttag gctagctaca tttaatgaca atgtgcaggt tgtacatatt ggtcatttat 7620

tccgtaactc gggtcataag gagtggcgta tttttgtttg gtttaatcca atgcaagaac 7680

ggaaatggac tcgatttact catttgcctt tattaagtcg agctaaggtg gttaacagta 7740

caacaaagca aataaataag gcggatcgtg tgattgagtt tgaagcatcg gatcttcaac 7800

gagccaaaat aatcgatttt cctaatctct cgtcctttgc ttccgtacgc aacaaggatg 7860

gagcgcagag ttcatttatt tacgaagctg aaacaccata tagcaagact cgttatcaca 7920

tcccacagtt agagctagct cggtcattat ttttagggga tcctctagag tcgacctgca 7980

ggcatgcaag cttggctgtt ttggcggatg agagaagatt ttcagcctga tacagattaa 8040

atcagaacgc agaagcggtc tgataaaaca gaatttgcct ggcggcagta gcgcggtggt 8100

cccacctgac cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg 8160

gtctccccat gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga 8220

aagactgggc ctttcgtttt atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa 8280

atccgccggg agcggatttg aacgttgcga agcaacggcc cggagggtgg cgggcaggac 8340

gcccgccata aactgccagg catcaaatta agcagaaggc catcctgacg gatggccttt 8400

ttgcgtttct acaaactctt ttgtttattt ttctaaatac attcaaatat gtatccgctc 8460

atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagag tatgagtatt 8520

caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc tgtttttgct 8580

cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc acgagtgggt 8640

tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc cgaagaacgt 8700

tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc ccgtgttgac 8760

gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt ggttgagtac 8820

tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt atgcagtgct 8880

gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat cggaggaccg 8940

aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct tgatcgttgg 9000

gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat gcctgcagca 9060

atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc ttcccggcaa 9120

caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg ctcggccctt 9180

ccggctggct ggtttattgc tgataaatct ggagccggtg agcgtgggtc tcgcggtatc 9240

attgcagcac tggggccaga tggtaagccc tcccgtatcg tagttatcta cacgacgggg 9300

agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc ctcactgatt 9360

aagcattggt aactgtcaga ccaagtttac tcatatatac tttagattga tttacgcgcc 9420

ctgtagcggc gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact 9480

tgccagcgcc ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc 9540

cgccggccag cctcgcagag caggattccc gttgagcacc gccaggtgcg aataagggac 9600

agtgaagaag gaacacccgc tcgcgggtgg gcctacttca cctatcctgc ccggcggcat 9660

caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 9720

tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 9780

cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 9840

gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 9900

gcgtcgatcc ccgacagtaa gacgggtaag cctgttgatg ataccgctgc cttactgggt 9960

gcattagcca gtctgaatga cctgtcacgg gataatccga agtggtcaga ctggaaaatc 10020

agagggcagg aactgctgaa cagcaaaaag tcagatagca ccacatagca gacccgccat 10080

aaaacgccct gagaagcccg tgacgggctt ttcttgtatt atgggtagtt tccttgcatg 10140

aatccataaa aggcgcctgt agtgccattt acccccattc actgccagag ccgtgagcgc 10200

agcgaactga atgtcacgaa aaagacagcg actcaggtgc ctgatggtcg gagacaaaag 10260

gaatattcag cgatttgccc gagcttgcga gggtgctact taagccttta gggttttaag 10320

gtctgttttg tagaggagca aacagcgttt gcgacatcct tttgtaatac tgcggaactg 10380

actaaagtag tgagttatac acagggctgg gatctattct ttttatcttt ttttattctt 10440

tctttattct ataaattata accacttgaa tataaacaaa aaaaacacac aaaggtctag 10500

cggaatttac agagggtcta gcagaattta caagttttcc agcaaaggtc tagcagaatt 10560

tacagatacc cacaactcaa aggaaaagga ctagtaatta tcattgacta gcccatctca 10620

attggtatag tgattaaaat cacctagacc aattgagatg tatgtctgaa ttagttgttt 10680

tcaaagcaaa tgaactagcg attagtcgct atgacttaac ggagcatgaa accaagctaa 10740

ttttatgctg tgtggcacta ctcaacccca cgattgaaaa ccctacaagg aaagaacgga 10800

cggtatcgtt cacttataac caatacgttc agatgatgaa catcagtagg gaaaatgctt 10860

atggtgtatt agctaaagca accagagagc tgatgacgag aactgtggaa atcaggaatc 10920

ctttggttaa aggctttgag attttccagt ggacaaacta tgccaagttc tcaagcgaaa 10980

aattagaatt agtttttagt gaagagatat tgccttatct tttccagtta aaaaaattca 11040

taaaatataa tctggaacat gttaagtctt ttgaaaacaa atactctatg aggatttatg 11100

agtggttatt aaaagaacta acacaaaaga aaactcacaa ggcaaatata gagattagcc 11160

ttgatgaatt taagttcatg ttaatgcttg aaaataacta ccatgagttt aaaaggctta 11220

accaatgggt tttgaaacca ataagtaaag atttaaacac ttacagcaat atgaaattgg 11280

tggttgataa gcgaggccgc ccgactgata cgttgatttt ccaagttgaa ctagatagac 11340

aaatggatct cgtaaccgaa cttgagaaca accagataaa aatgaatggt gacaaaatac 11400

caacaaccat tacatcagat tcctacctac ataacggact aagaaaaaca ctacacgatg 11460

ctttaactgc aaaaattcag ctcaccagtt ttgaggcaaa atttttgagt gacatgcaaa 11520

gtaagtatga tctcaatggt tcgttctcat ggctcacgca aaaacaacga accacactag 11580

agaacatact ggctaaatac ggaaggatct gaggttctta tggctcttgt atctatcagt 11640

gaagcatcaa gactaacaaa caaaagtaga acaactgttc accgttacat atcaaaggga 11700

aaactgtcca tatgcacaga tgaaaacggt gtaaaaaaga tagatacatc agagctttta 11760

cgagtttttg gtgcatttaa agctgttcac catgaacaga tcgacaatgt aacagatgaa 11820

cagcatgtaa cacctaatag aacaggtgaa accagtaaaa caaagcaact agaacatgaa 11880

attgaacacc tgagacaact tgttacagct caacagtcac acatagacag cctgaaacag 11940

gcgatgctgc ttatcgaatc aaagctgccg acaacacggg agccagtgac gcctcccgtg 12000

gggaaaaaat catggcaatt ctggaagaaa tagcgctttc agcctgtggg cggacaaaat 12060

agttgggaac tgggaggggt ggaaatggag tttttaagga ttatttaggg aagagtgaca 12120

aaatagatgg gaactgggtg tagcgtcgta agctaatacg aaaattaaaa atgacaaaat 12180

agtttggaac tagatttcac ttatctggtt ggtcgacact agtattaccc tgttatccct 12240

agatttaaat gatatcggat cctagtaagc cacgttttaa ttaatcagat gggtcaatag 12300

cggccgccaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 12360

gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 12420

gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 12480

cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 12540

agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 12600

acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat 12660

tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt 12720

agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt 12780

cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc 12840

ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat 12900

tattttctcc catgaagacg gtacgcgact gggcgtggag catctggtcg cattgggtca 12960

ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc 13020

tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga 13080

ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc 13140

cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga 13200

gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagacag 13260

ctcatgttat atcccgccgt caaccaccat caaacaggat tttcgcctgc tggggcaaac 13320

cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt 13380

gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc 13440

ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 13500

gcagtgagcg caacgcaatt aatgtgagtt agcgcgaatt gatctggttt gacagcttat 13560

catcgactgc acggtgcacc aatgcttctg gcgtcaggca gccatcggaa gctgtggtat 13620

ggctgtgcag gtcgtaaatc actgcataat tcgtgtcgct caaggcgcac tcccgttctg 13680

gataatgttt tttgcgccga catcataacg gttctggcaa atattctgaa atgagctgtt 13740

gacaattaat catccggctc gtataatgtg tggaattgtg agcggataac aatttcacac 13800

aggaaacagc gccgctgaga aaaagcgaag cggcactgct ctttaacaat ttatcagaca 13860

atctgtgtgg gcactcgacc ggaattatcg attaacttta ttattaaaaa ttaaagaggt 13920

atatattaat gtatcgatta aataaggagg aataaaccat ggcggacacg ttattgattc 13980

tgggtgatag cctgagcgcc gggtatcgaa tgtctgccag cgcggcctgg cctgccttgt 14040

tgaatgataa gtggcagagt aaaacgtcgg tagttaatgc cagcatcagc ggcgacacct 14100

cgcaacaagg actggcgcgc cttccggctc tgctgaaaca gcatcagccg cgttgggtgc 14160

tggttgaact gggcggcaat gacggtttgc gtggttttca gccacagcaa accgagcaaa 14220

cgctgcgcca gattttgcag gatgtcaaag ccgccaacgc tgaaccattg ttaatgcaaa 14280

tacgtctgcc tgcaaactat ggtcgccgtt ataatgaagc ctttagcgcc atttacccca 14340

aactcgccaa agagtttgat gttccgctgc tgcccttttt tatggaagag gtctacctca 14400

agccacaatg gatgcaggat gacggtattc atcccaaccg cgacgcccag ccgtttattg 14460

ccgactggat ggcgaagcag ttgcagcctt tagtaaatca tgactcataa tgactctaga 14520

aataatttta gttaagtata agaaggagat ataccatggt gaagaaggtt tggcttaacc 14580

gttatcccgc ggacgttccg acggagatca accctgaccg ttatcaatct ctggtagata 14640

tgtttgagca gtcggtcgcg cgctacgccg atcaacctgc gtttgtgaat atgggggagg 14700

taatgacctt ccgcaagctg gaagaacgca gtcgcgcgtt tgccgcttat ttgcaacaag 14760

ggttggggct gaagaaaggc gatcgcgttg cgttgatgat gcctaattta ttgcaatatc 14820

cggtggcgct gtttggcatt ttgcgtgccg ggatgatcgt cgtaaacgtt aacccgttgt 14880

ataccccgcg tgagcttgag catcagctta acgatagcgg cgcatcggcg attgttatcg 14940

tgtctaactt tgctcacaca ctggaaaaag tggttgataa aaccgccgtt cagcacgtaa 15000

ttctgacccg tatgggcgat cagctatcta cggcaaaagg cacggtagtc aatttcgttg 15060

ttaaatacat caagcgtttg gtgccgaaat accatctgcc agatgccatt tcatttcgta 15120

gcgcactgca taacggctac cggatgcagt acgtcaaacc cgaactggtg ccggaagatt 15180

tagcttttct gcaatacacc ggcggcacca ctggtgtggc gaaaggcgcg atgctgactc 15240

accgcaatat gctggcgaac ctggaacagg ttaacgcgac ctatggtccg ctgttgcatc 15300

cgggcaaaga gctggtggtg acggcgctgc cgctgtatca catttttgcc ctgaccatta 15360

actgcctgct gtttatcgaa ctgggtgggc agaacctgct tatcactaac ccgcgcgata 15420

ttccagggtt ggtaaaagag ttagcgaaat atccgtttac cgctatcacg ggcgttaaca 15480

ccttgttcaa tgcgttgctg aacaataaag agttccagca gctggatttc tccagtctgc 15540

atctttccgc aggcggaggg atgccagtgc agcaagtggt ggcagagcgt tgggtgaaac 15600

tgacaggaca gtatctgctg gaaggctatg gccttaccga gtgtgcgccg ctggtcagcg 15660

ttaacccata tgatattgat tatcatagtg gtagcatcgg tttgccggtg ccgtcgacgg 15720

aagccaaact ggtggatgat gatgataatg aagtaccacc gggtcaaccg ggtgagcttt 15780

gtgtcaaagg accgcaggtg atgctgggtt actggcagcg tccggatgct acagatgaga 15840

tcatcaaaaa tggctggtta cacaccggcg acatcgcggt gatggatgaa gaagggttcc 15900

tgcgcattgt cgatcgtaaa aaagacatga ttctggtttc cggttttaac gtctatccca 15960

acgagattga agatgtcgtc atgcagcatc ctggcgtaca ggaagtcgcg gctgttggcg 16020

taccttccgg ctccagtggt gaagcggtga aaatcttcgt agtgaaaaaa gatccatcgc 16080

ttaccgaaga gtcactggtg accttttgcc gccgtcagct cacgggctac aaagtaccga 16140

agctggtgga gtttcgtgat gagttaccga aatctaacgt cggaaaaatt ttgcgacgag 16200

aattacgtga cgaagcgcgc ggcaaagtgg acaataaagc ctgataactc tagaaataat 16260

ttaaatggaa ttcgaagctt gggcccgaac aaaaactcat ctcagaagag gatctgaata 16320

gcgccgtcga ccatcatcat catcatcatt gagtttaaac ggtctccagc ttggctgttt 16380

tggcggatga gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct 16440

gataaaacag aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa 16500

ctcagaagtg aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg 16560

gaactgccag gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta 16620

tctgttgttt gtcggtgaac gctctcctga ttaattaaga cgtctaagaa accattatta 16680

tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctt caagaatttt 16740

ataaaccgtg gagcgggcaa tactgagctg atgagcaatt tccgttgcac cagtgccctt 16800

ctgatgaagc gtcagcacga cgttcctgtc cacggtacgc ctgcggccaa atttgattcc 16860

tttcagcttt gcttcctgtc ggccctcatt cgtgcgctct aggatcctcc ggcgttcagc 16920

ctgtgccaca gccgacagga tggtgaccac catttgcccc atatcaccgt cggtactgat 16980

cccgtcgtca ataaaccgaa ccgctacacc ctgagcatca aactctttta tcagttggat 17040

catgtcggcg gtgtcgcggc caagacggtc gagcttcttc accagaatga catcaccttc 17100

ctccaccttc atcctcagca aatccagccc ttcccgatct gttgaactgc cggatgcctt 17160

gtcggtaaag atgcggttag cttttacccc tgcatctttg agcgctgagg tctgcctcgt 17220

gaagaaggtg ttgctgactc ataccaggcc tgaatcgccc catcatccag ccagaaagtg 17280

agggagccac ggttgatgag agctttgttg taggtggacc agttggtgat tttgaacttt 17340

tgctttgcca cggaacggtc tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca 17400

gcaaaagttc gatttattca acaaagccgc cgtcccgtca agtcagcgta atgccctagg 17460

aggcgcgcca cggccgcgtc gaccccacgc ccctctttaa tacgacgggc aatttgcact 17520

tcagaaaatg aagagtttgc tttagccata acaaaagtcc agtatgcttt ttcacagcat 17580

aactggactg atttcagttt acaactattc tgtctagttt aagactttat tgtcatagtt 17640

tagatctatt ttgttcagtt taagacttta ttgtccgccc aca 17683

<210> 18

<211> 20

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 18

gatgctggtg gcgaagctgt 20

<210> 19

<211> 23

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 19

gttgcgacgg tggtacgcat aac 23

<210> 20

<211> 35

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 20

gaggaataaa ccatgcccat tcttgaaagc gtggg 35

<210> 21

<211> 45

<212> DNA

<213> 人工序列

<220>

<221> 来源

<223> /注="人工序列的描述: 合成的引物"

<400> 21

agctggagac cgtttaaact tataaaccgc tgtttgtcgc aaccg 45

<210> 22

<211> 663

<212> DNA

<213> 未知

<220>

<221> 来源

<223> /注="未知的描述: 未培养的细菌RM44"

<400> 22

atgcccattc ttgaaagcgt gggtttcatg aagacgctat gggagagcgg cggcgctcag 60

gtcgccctga tggaatcgcg ggaagagacc agccacatgg tcggcatcct ggaagggatc 120

gccgccgaac tctcgtggcg tcctggtacg cagcttcgcg attatcagga tagggcggcg 180

cacctggccg ttctggtcgg gtcggagatc gtcggcggct tgcagatcgt cacgtcgccg 240

tcagcggatt gccttcccta ccggctcgtc tggccggaag tctgcgtgcc ggacggtgcc 300

gcaatcgcgg acatcacgat tctggcgcta cggaaggaat accgcgcccg cttcaacctc 360

ttctggccgc tgtgcgtcga gctctggcgg cactgtgtcg cggagggtgc cacggagatg 420

cgcctggagg caacgccgga tacgctcagg ctctaccgcc gcatcggctg gccgctggag 480

gtcatcggcg acctgcgcct ccactggaac gagccgtgct tcctgtgccg gatggggatc 540

gtagatgtcg cgggggcgat ggttgtgcgg gccttgcagt ccgccaccta tcaggcggtc 600

ctcgcgggga tgagtcggcc tgtggcgtca gcgtcgccgg ttgcgacaaa cagcggttta 660

tga 663

相关技术
  • 烷醇酰胺及酰胺胺的微生物生产及其用途
  • 烷醇酰胺及酰胺胺的微生物生产及其用途
技术分类

06120112508162