掌桥专利:专业的专利平台
掌桥专利
首页

用于羟基化氨基酸的融合蛋白和产品

文献发布时间:2023-06-19 10:22:47


用于羟基化氨基酸的融合蛋白和产品

序列表

本申请包含已经以电子方式提交并且全文以引用方式并入的序列表。

技术领域

本文描述了工程化蛋白质及其在发酵中的用途、用于产生蛋白质的方法,以及用于蛋白质的体外和体内羟基化的方法。

背景技术

存在使用微生物来制备用于商业应用的化合物的整个行业。微生物通常用制备这些化合物所必需的DNA来进行工程改造。这些微生物的示例包括酵母和细菌。所制备的化合物包括药物、芳香剂、风味剂、蛋白质等。

融合蛋白通过接合最初制备分离蛋白的两个或更多个基因来产生。在药物开发中产生融合蛋白的一个目的是将每种“亲本”蛋白的特性赋予所得的融合蛋白。

发明内容

在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基;和可溶性蛋白质伴侣。在一些实施方案中,本公开提供了由以下序列编码的融合蛋白:编码脯氨酰4-羟化酶α亚基的DNA序列;以及编码可溶性蛋白质伴侣的DNA序列。

在一些实施方案中,脯氨酰4-羟化酶α亚基选自由以下项组成的组:脯氨酰4-羟化酶α亚基-1、脯氨酰4-羟化酶α亚基-2和脯氨酰4-羟化酶α亚基-3。在一些实施方案中,可溶性蛋白质伴侣选自由以下项组成的组:脯氨酰4-羟化酶β亚基、麦芽糖结合蛋白、小泛素样修饰体、钙调蛋白结合蛋白和谷胱甘肽S-转移酶。在某些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫(C.elegans)。

在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基-1;和脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:编码脯氨酰4-羟化酶α亚基的DNA序列;和编码脯氨酰4-羟化酶β亚基的DNA序列。在某些实施方案中,脯氨酰4-羟化酶α亚基-1位于融合蛋白的N端。在特定实施方案中,脯氨酰4-羟化酶β亚基位于融合蛋白的C端。

在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基-1;以及脯氨酰4-羟化酶β亚基,其中脯氨酰4-羟化酶α亚基-1位于该融合蛋白的N端,并且脯氨酰4-羟化酶β亚基位于该融合蛋白的C端。

在某些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。在一些实施方案中,脯氨酰4-羟化酶α亚基-1由SEQ ID NO:1的核酸编码,并且脯氨酰4-羟化酶β亚基由SEQ ID NO:2的核酸编码。

在一些实施方案中,本公开提供了包含本文所公开的任何融合蛋白的微生物。在一些实施方案中,本公开提供了微生物,该微生物包含:融合蛋白,该融合蛋白包含脯氨酰4-羟化酶α亚基-1和脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了微生物,该微生物包含:融合蛋白,该融合蛋白包含位于N端的脯氨酰4-羟化酶α亚基-1和位于C端的脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了微生物,该微生物包含:

融合蛋白,该融合蛋白包含脯氨酰4-羟化酶α亚基-1和脯氨酰4-羟化酶β亚基;以及待羟基化的第二蛋白质。在某些实施方案中,微生物选自由以下项组成的组:芽孢杆菌属(Bacillus)、大肠杆菌(Escherichia coli)和丝状真菌。在一些实施方案中,微生物为酵母。在具体的实施方案中,第二蛋白质选自由以下项组成的组:胶原、重组胶原、胶原样蛋白质等。在一些实施方案中,脯氨酰4-羟化酶α亚基-1由SEQ ID NO:1的核酸编码,并且脯氨酰4-羟化酶β亚基由SEQ ID NO:2的核酸编码。

在一些实施方案中,本公开提供了用于向个体的皮肤提供护肤有益效果的方法,该方法包括:将本文所公开的融合蛋白施用到皮肤上。在某些实施方案中,该融合蛋白被配制成组合物,该组合物选自由以下项组成的组:霜、乳、软膏、凝胶、精华以及它们的组合。在一些实施方案中,护肤有益效果选自由以下项组成的组:抗皱、改善皮肤色素沉着、水合作用、减少痤疮、预防痤疮、减少黑头、预防黑头、减少妊娠纹、预防妊娠纹、预防脂肪团、减少脂肪团以及它们的组合。在某些实施方案中,该融合蛋白与其他护肤有益成分组合,所述其他护肤有益成分选自由以下项组成的组:水杨酸、视黄醇、过氧化苯甲酰、维生素C、甘油、α-羟基酸、对苯二酚、曲酸、透明质酸以及它们的组合。

在一些实施方案中,本公开提供了用于羟基化蛋白质的体外方法,该体外方法包括:提供含有待羟基化的蛋白质的微生物;提供本文所公开的融合蛋白;裂解该微生物以产生裂解物;将特定浓度的融合蛋白添加至裂解物;以及在促进蛋白质被融合蛋白羟基化的反应条件下温育裂解物和融合蛋白。在一些实施方案中,裂解物在添加融合蛋白之前纯化。在某些实施方案中,基于待羟基化的约1uM蛋白质,融合蛋白的浓度在约0.05uM至约5uM的范围内。在特定实施方案中,羟基化在约5至约12范围内的pH处进行。在一些实施方案中,羟基化在约16℃至约40℃范围内的温度处进行。在某些实施方案中,羟基化进行约30分钟以上至约1小时。

在一些实施方案中,本公开提供了用于制备羟基化蛋白质的方法,该方法包括:提供本文所公开的微生物;以及使该微生物在培养基中生长足以羟基化第二蛋白质的时间。在某些实施方案中,微生物为酵母。在一个具体实施方案中,酵母为巴斯德毕赤酵母(Pichia pastoris)。在一些实施方案中,微生物生长约50小时至约72小时。

在一些实施方案中,本公开提供了微生物,该微生物包含:编码脯氨酰4-羟化酶α亚基的DNA序列;以及编码可溶性蛋白质伴侣的DNA序列。

附加的方面和实施方案存在于以下的详细描述中。

附图说明

图1示出了MMV-130,其如实施例1中所述用于生成巴斯德毕赤酵母菌株PP153。

图2示出了MMV156,其如实施例3中所述用于生成巴斯德毕赤酵母菌株PP154。

图3MMV-191,其如实施例3中所述用于生成巴斯德毕赤酵母菌株PP268。

图4示出了MMV-290载体,其如实施例1中所述产生并转化到巴斯德毕赤酵母菌株PP153中以生成巴斯德毕赤酵母菌株PP336,并且表达在N端具有P4HA1、在C端具有P4HB且具有接头序列“GSGSGS”的融合蛋白。

图5示出了MMV-289载体,其如实施例2中所述产生并转化到巴斯德毕赤酵母菌株PP153中以生成巴斯德毕赤酵母菌株PP335,并且表达在N端具有P4HB且在C端具有P4HA1的融合蛋白。

图6示出了如实施例4中所述的MMV-400载体,并且该载体含有AB融合蛋白(即,如实施例3中所述的在N端具有P4HA1且在C端具有P4HB的融合蛋白)的DNA序列。

图7示出了如实施例5中所述的MMV-502载体,并且该载体含有AB融合蛋白的DNA序列、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子。

图8示出了如实施例5中所述的MMV-503载体,并且该载体含有P4HB亚基蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子。

图9示出了实施例7中所用的MMV411载体。

图10示出了如实施例1中所述的载体MMV-644。

具体实施方式

与本文所述的那些方法和材料类似或等同的所有方法和材料均可以与本文所述的合适方法和材料一起用于本公开的实践或测试中。本文提及的所有出版物、专利申请、专利和其他参考文献均全文以引用方式并入本文。如发生矛盾,则以本说明书及其所包括的定义为准。另外,除非另外指明,否则材料、方法和实施例仅为说明性的,并非旨在进行限制。

在一些实施方案中,本公开提供了由以下序列编码的融合蛋白:脯氨酰4-羟化酶α亚基的DNA序列和可溶性蛋白质伴侣的DNA序列。在某些实施方案中,该融合蛋白包含脯氨酰4-羟化酶α亚基-1(P4HA1)和脯氨酰4-羟化酶β亚基(P4HB)。在某些实施方案中,单体脯氨酰4-羟化酶α亚基可以在任何实施方案中用于代替本文所公开的融合蛋白。

P4HA基因和P4HB基因编码脯氨酰-4-羟化酶的组成,脯氨酰-4-羟化酶是胶原合成中的关键酶,由两个相同的α亚基和两个β亚基组成(异源四聚体)。P4HA编码的蛋白质是几种不同类型的α亚基之一,并且提供活性酶的催化位点的主要部分。参见例如,Crit RevBiochem Mol Biol.45(2):106–124(2010)。P4HA包含三个结构域:二聚化结构域、底物结合结构域和催化结构域。在一些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。在某些实施方案中,单体脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:细菌、病毒、真菌和藻类。在某些实施方案中,单体脯氨酰4-羟化酶α亚基来自拟菌病毒(DNA序列:SEQ ID NO:15;蛋白质序列:SEQ ID NO:16)。参见例如,Rutschmann等人,Appl.Microbiol Biotechnol.98:4445-4455(2014)以及Shi等人,Protein J.36:322-331(2017)。在胶原和相关蛋白中,脯氨酰4-羟化酶催化4-羟脯氨酸的形成,这对于新合成的前胶原链的正确三维折叠是重要的。P4HB蛋白也称为二硫化物异构酶。它是人类中由P4HB基因编码的酶。人P4HB基因位于染色体17q25中。该蛋白质是多功能的,不同于其他脯氨酰4-羟化酶家族蛋白质,并且充当氧化还原酶用于二硫化物形成、断裂和异构化。P4HB的活性受到严格调控,二聚体解离和底物结合均可能在催化过程期间增强其酶活性。在一些实施方案中,P4HB来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。

P4HA的DNA序列(NCBI参考号:XP_005226443.1;UNIPROT:Q1RMU3)、P4HB的DNA序列(基因库:AAI46272.1;UNIPROT:P05307)、P4HA3的DNA序列(UNIPROT:P4HA3)和P4HA2的DNA序列(UNIPROT:G3N2F2)是已知并且可商购获得的。在一些实施方案中,通过从编码第一蛋白质的cDNA序列移除终止密码子,然后通过连接或重叠延伸聚合酶链反应(PCR)将第二蛋白质的DNA序列附连在框中来制备融合蛋白。融合蛋白的DNA序列然后将由细胞表达为单一蛋白。

用于制备融合蛋白的一种技术是连接,它是在酶的作用下接合两个核酸片段。DNA片段接合在一起产生重组DNA分子,诸如在将外来DNA片段插入质粒中时。DNA片段的端部通过在一个DNA末端的3'-羟基与另一个DNA末端的5'-磷酰基之间形成磷酸二酯键而接合在一起。用于制备融合蛋白的另一种技术是重叠延伸PCR,也称为重叠延伸剪接术。重叠延伸PCR用于在序列中的特定点处插入特定突变或用于将较小的DNA片段剪接到较大的多核苷酸中。分泌信号序列(诸如酿酒酵母(Saccharomyces cerevisiae)α交配因子信号)可以被置于单体脯氨酰4-羟化酶α亚基的前面,以将蛋白质从宿主分泌到生产培养基中。

在一些实施方案中,本文所公开的融合蛋白可以由以下组合编码:脯氨酰4-羟化酶α亚基-1(P4HA1)的DNA序列或脯氨酰4-羟化酶α亚基-2(P4HA2)的DNA序列或脯氨酰4-羟化酶α亚基-3(P4HA3)的DNA序列和脯氨酰4-羟化酶β亚基(P4HB)的DNA序列;以及脯氨酰4-羟化酶α亚基-1(P4HA1)的DNA序列或脯氨酰4-羟化酶α亚基-2(P4HA2)的DNA序列或脯氨酰4-羟化酶α亚基-3(P4HA3)的DNA序列,以及选自下列各项的可溶性蛋白质伴侣的DNA序列:脯氨酰4-羟化酶β亚基(P4HB)、麦芽糖结合蛋白、小泛素样修饰体、钙调蛋白结合蛋白、谷胱甘肽S-转移酶等。活性脯氨酰-4-羟化酶复合物可以包括来自诸如牛、人、大鼠、小鼠、秀丽隐杆线虫等物种的P4H亚基。在一个实施方案中,融合蛋白包含P4HA1和P4HB。

当制备本文所述的融合蛋白时,可以制备在N端具有P4HA或P4HB的蛋白。我们惊奇地发现,在游离脯氨酸存在下,在N端具有P4HA的融合蛋白在酵母中形成功能性羟基化酶,而在N端具有P4HB的融合蛋白在酵母中不形成功能性羟基化酶。在某些实施方案中,融合蛋白在N端具有P4HA并且在C端具有第二蛋白质。在一些实施方案中,融合蛋白在N端具有P4HA并且在C端具有P4HB。

可以将编码P4HA1和P4HB的融合蛋白的DNA或者单体脯氨酰4-羟化酶α亚基的DNA转化或转染到生物体中。合适的生物体包括酵母、细菌、真菌等。在一些实施方案中,细菌可以是芽孢杆菌属或大肠杆菌。在一些实施方案中,微生物可以是丝状真菌。在一些实施方案中,生物体可以是酵母。在某些实施方案中,酵母可以是巴斯德毕赤酵母。通常,为了发挥羟基化酶的功能,需要多个转染/转化反应。本文所述的融合蛋白能够实现更有效的过程。本文所述的融合蛋白将转化反应的数目减少至一个而不是两个(例如,一个用于P4HA1,另一个用于P4HB)。如果酶被分别转化,则它们将经历三个反应以形成四聚体,以便成为有效的酶。四聚体由例如两个P4HA亚基和两个P4HB亚基组成。这三个反应如下:1)第一P4HA和第一P4HB组合形成第一二聚体,2)第二P4HA和第二P4HB组合形成第二二聚体,以及3)两个二聚体形成四聚体。当酶被分别转化时,并非所有P4HA和P4HB都会反应形成四聚体。融合蛋白将需要与另一种融合蛋白反应一次以形成有效的四聚体。本公开的有益效果是融合蛋白(两个分子)比分离的蛋白质(四种蛋白质)更有效地形成四聚体。两种融合蛋白将形成一种四聚体。因此,本文所述的融合蛋白提供更有效和高效的羟基化酶。在一些实施方案中,融合蛋白可以用于蛋白质的体外羟基化的方法中。在一些实施方案中,融合蛋白可以用于蛋白质的体内羟基化的方法中。

在一些实施方案中,本文所述的融合蛋白可以用于在体外将蛋白质羟基化。可以将含有蛋白质(诸如胶原)的微生物裂解,从而产生裂解物。可以对裂解物进行加工以产生纯化的蛋白质。可以将融合蛋白添加到纯化的蛋白质样品中或添加到裂解物中。在一些实施方案中,羟基化反应的辅因子可以包括下列中的一种或多种:抗坏血酸、抗坏血酸钠或铁(II),例如FeSO

替代性地,可以将融合蛋白的DNA序列转染到微生物中并用于在细胞内/体内将蛋白质羟基化。转染的微生物可以在适于特定微生物的培养基中,在本领域普通技术人员熟知的条件下生长。在一些实施方案中,适用于反应的培养基可以是例如用于大肠杆菌的LB(溶菌肉汤)、用于毕赤酵母属(Pichia)的BMGY(缓冲型甘油复合培养基)、用于毕赤酵母属的YPD(酵母提取物蛋白胨右旋糖)或用于毕赤酵母属的HMP(六偏磷酸钠)。该培养基的温度可以在约16℃至42℃的范围内。在一些实施方案中,该培养基的温度可以为约16℃、约18℃、约20℃、约22℃、约24℃、约26℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约38℃、约40℃或约42℃。在一些实施方案中,微生物为毕赤酵母属,并且培养基的温度可以在约28℃至约36℃的范围内,例如约32℃。在一些实施方案中,培养基的温度可以为约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃或约36℃。微生物可以生长约50小时至约72小时的范围内(例如约68小时)的时间。在一些实施方案中,微生物可以生长约50小时、约51小时、约52小时、约53小时、约54小时、约55小时、约56小时、约57小时、约58小时、约59小时、约60小时、约61小时、约62小时、约63小时、约64小时、约65小时、约66小时、约67小时、约68小时、约69小时、约70小时、约71小时或约72小时。在某些实施方案中,用于羟基化反应的底物可以选自由以下项组成的组:AKG、分子胶原和分子氧。

在一些实施方案中,融合蛋白的DNA序列可以连同以下序列一起置于载体中:融合蛋白启动子的DNA序列;融合蛋白终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与酵母基因组的同源性的DNA序列(任选地在转化到酵母中时用于提高效率)。在一些实施方案中,载体已插入生物体中(或已成为其附加体)。在一些实施方案中,然后可以通过本领域已知的方法(诸如电穿孔)将载体转化到微生物中。

可以将编码脯氨酰4-羟化酶α亚基-1(P4HA1)和脯氨酰4-羟化酶β亚基(P4HB)的融合蛋白的DNA,以及编码待羟基化的第二蛋白质的DNA可转化到微生物中。羟基化修饰可以在各种氨基酸上进行,这些氨基酸包括但不限于脯氨酸、赖氨酸、天冬酰胺、天冬氨酸和组氨酸。可以被羟基化的合适蛋白质包括胶原等。在本文所述的任何实施方案、任何方法和/或任何反应中,可以使用单体脯氨酰4-羟化酶α亚基来代替融合蛋白。

在一些实施方案中,融合蛋白的DNA序列可以连同以下序列一起置于载体中:融合蛋白启动子的DNA序列;融合蛋白终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与宿主生物体基因组的同源性的DNA序列。在一些实施方案中,待羟基化的第二蛋白质的DNA序列可以连同以下序列一起置于载体上:第二蛋白质启动子的DNA序列;第二蛋白质终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与宿主生物体基因组的同源性的DNA序列。在一些实施方案中,然后通过本领域已知的方法(诸如电穿孔)将两种载体转化到微生物中。

替代性地,在一些实施方案中,可以使用多合一载体,其中融合蛋白的DNA,包括启动子和终止子;第二蛋白质的DNA,包括启动子和终止子;选择标记的DNA,包括启动子和终止子;和/或与生物体的基因组具有同源性的用于整合到基因组中的DNA包含在该多合一载体中。然后可以通过本领域已知的方法(诸如电穿孔)将该多合一载体转化到微生物中。

本领域已知启动子可以提高蛋白质的产量。启动子是包含在载体中的DNA序列。在本公开中使用的合适启动子包括但不限于AOXl甲醇诱导的启动子、pDF去阻遏启动子、pCAT去阻遏启动子、Dasl-Das2甲醇诱导的双向启动子、pHTXl组成型双向启动子、pGCW14-pGAP1组成型双向启动子以及它们的组合。

在结合到酵母中的载体中利用的每个开放阅读框的末端需要终止子。在一些实施方案中,可以将终止子的DNA序列插入载体中。

复制起点是引发复制所必需的。在一些实施方案中,可以将复制起点的DNA序列插入载体中。

当酵母是微生物时,含有与酵母基因组的同源性的DNA序列是必需的并且可以结合到载体中。

选择标记用于选择已成功转化的生物体。这些标记有时与抗生素抗性相关。这些标记也可以与在具有或不具有某些氨基酸的情况下生长的能力相关(营养缺陷型标记)。合适的营养缺陷型标记包括但不限于ADE、HIS、URA、LEU、LYS、TRP以及它们的组合。在一些实施方案中,可以将选择标记的DNA序列结合到载体中。本公开包括使表达融合蛋白的细胞生长、表达融合蛋白、分离和纯化融合蛋白的方法。本公开还包括如本文所述的融合蛋白的用途。

具体地讲,本文所述的融合蛋白可以用于个人护理组合物。就个人护理组合物而言,可以将融合蛋白施用于皮肤。对于该用途,融合蛋白可以全部或仅一定程度地分离或纯化(例如,至少25%纯化、至少50%纯化、至少65%纯化、至少75%纯化、至少85%纯化、至少90%纯化、至少95%纯化、至少96%纯化、至少97%纯化、至少98%纯化、至少99%纯化或100%纯化)。换句话讲,融合蛋白可以作为纯化蛋白质添加到个人护理产品中,或者可以作为从其中发现该蛋白的级分的一部分添加。融合蛋白可以被制成霜、乳、软膏、凝胶、精华等。

个人护理组合物可以提供适于局部施用于皮肤的配制物。该组合物还可以包含美容上可接受的载剂。美容上可接受的载剂可以占该组合物的约50重量%至约99重量%(例如,占该组合物的约80重量%至约95重量%)。在一些实施方案中,载剂可以为该组合物的约50重量%、约55重量%、约60重量%、约65重量%、约70重量%、约75重量%、约80重量%、约85重量%、约90重量%、约95重量%、约96重量%、约97重量%、约98重量%或约99重量%。这些组合物可以制成各式各样的产品类型,包括但不限于液体组合物,诸如乳、霜、凝胶、棒状物、喷雾、剃刮膏、软膏、卸妆液洗剂和固体棒状物、糊状物、粉末、摩丝、面膜、果皮、化妆品和湿巾。这些产品类型可以包含若干类型的美容上可接受的载剂,包括但不限于溶液、乳液(例如,微乳液和纳米乳液)、凝胶、固体和脂质体。以下是此类载剂的非限制性示例。其他载剂可以由本领域的普通技术人员配制。

可用于本公开的局部用组合物可以配制为溶液。溶液通常包含水性溶剂(例如,约50%至约99%或约90%至约95%的美容上可接受的水性溶剂)。在一些实施方案中,溶液可以具有约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%或约99的美容上可接受的水性溶剂。局部用组合物可以配制为包含润肤剂的溶液。此类组合物优选地含有约2%至约50%的润肤剂。在一些实施方案中,组合物可以包含约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约12%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%的润肤剂。如本文所用,“润肤剂”是指用于预防或缓解干燥以及用于保护皮肤的材料。各式各样的合适润肤剂是已知的,并且可以用于个人护理组合物中。参见International Cosmetic IngredientDictionary and Handbook,Wenninger和McEwen编辑,(The Cosmetic,Toiletry,andFragrance Assoc.,Washington,D.C.,第7版,1997)(下文称为“CTFAs手册”),其包含合适材料的许多示例。

乳可以由这种溶液制成。乳通常包含约1%至约20%(例如,约5%至约10%)的润肤剂和约50%至约90%(例如,约60%至约80%)的水。在一些实施方案中,乳可以具有约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%或约20%的润肤剂。在一些实施方案中,乳可以具有约50%、约55%、约60%、约65%、约70%、约75%或约80%的水。

可以由溶液配制的另一类产品可以是霜。霜通常包含约5%至约50%(例如,约10%至约20%)的润肤剂和约45%至约85%(例如,约50%至约75%)的水。在一些实施方案中,霜可以具有约5%、约6%、约7%、约8%、约9%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%的润肤剂。在一些实施方案中,霜可以具有约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%或约85%的水。

可以由溶液配制的又一类产品可以是软膏。软膏可以包含动物油或植物油或者半固体烃类的简单基料。软膏可以包含约2%至约10%的润肤剂,加上约0.1%至约2%的增稠剂。在一些实施方案中,软膏可以具有约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%或约10%的润肤剂。在一些实施方案中,软膏可以具有约0.1%、约0.2%、约0.3%、约0.4%、约0.6%、约0.8%、约1.0%、约1.2%、约1.4%、约1.6%、约1.8%或约2.0%的增稠剂。可用于本文的增稠剂或增粘剂的更完整的公开可以在CTFA手册中找到。

这些个人护理组合物可以配制为乳液。如果载剂可以是乳液,则该约1%至约10%(例如,约2%至约5%)的载剂包含乳化剂。在一些实施方案中,约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%或约10%的载剂包含乳化剂。乳化剂可以为非离子乳化剂、阴离子乳化剂或阳离子乳化剂。合适的乳化剂公开于例如CTFA手册中。

乳和霜可以配制为乳液。通常,此类乳包含0.5%至约5%的乳化剂。此类霜将通常包含约1%至约20%(例如,约5%至约10%)的润肤剂;约20%至约80%(例如,30%至约70%)的水;和约1%至约10%(例如,约2%至约5%)的乳化剂。

水包油型和油包水型的单一乳液护肤组合物(诸如乳和霜)是美容领域熟知的,并且可用于个人护理组合物。多相乳液组合物(诸如水包油包水型)也是可用的。一般来讲,此类单相或多相乳液含有水、润肤剂和乳化剂作为基本成分。

本公开的个人护理组合物还可以配制为凝胶(例如,使用合适的胶凝剂的含水凝胶)。用于含水凝胶的合适胶凝剂包括但不限于天然树胶、丙烯酸的聚合物和共聚物、丙烯酸酯的聚合物和共聚物,以及纤维素衍生物(例如,羟甲基纤维素和羟丙基纤维素)。用于油(诸如矿物油)的合适胶凝剂包括但不限于氢化丁烯/乙烯/苯乙烯共聚物和氢化乙烯/丙烯/苯乙烯共聚物。此类凝胶通常包含介于约0.1重量%和5重量%之间的此类胶凝剂。在一些实施方案中,凝胶包含约0.1重量%、约0.2重量%、约0.3重量%、约0.4重量%、约0.5重量%、约1.0重量%、约1.5重量%、约2.0重量%、约2.5重量%、约3.0重量%、约3.5重量%、约4.0重量%、约4.5重量%或约5.0重量%的此类胶凝剂。

除前述组分以外,可用于本公开中的个人护理组合物还可以含有各式各样的附加的油溶性材料和/或水溶性材料,这些材料按照惯例以其领域既定的含量用于在皮肤上使用的组合物中。

可以根据需要和/或作为常规方案的一部分,将个人护理组合物施用于皮肤或施用在皮肤上,该常规方案涉及的范围从每周施用一次直到每天施用一次或多次(例如,每天两次)。用量将随最终使用者的年龄和身体状况、处理持续时间,所采用的具体化合物、产品或组合物,所利用的特定的美容上可接受的载剂等因素而变化。

本文所述的融合蛋白可以在个人护理应用中用于实现护肤有益效果,诸如抗皱、改善皮肤色素沉着、水合作用、减少痤疮、预防痤疮、减少黑头、预防黑头、减少妊娠纹、预防妊娠纹、预防脂肪团、减少脂肪团等。所谓改善皮肤色素沉着,是指使皮肤色素沉着均匀或减少皮肤色素沉着,以提供白皙的皮肤。

本文所述的融合蛋白还可以与其他护肤有益成分组合,这些成分诸如但不限于水杨酸、视黄醇、过氧化苯甲酰、维生素C、甘油、α-羟基酸、对苯二酚、曲酸、透明质酸等。

胶原脯氨酰4羟化酶含有与脯氨酰羟化酶结构域蛋白(PHD)(包括PHD1、PHD2、PHD3、PHD4等)相似的保守结构域。这些PHD起到调节缺氧诱导因子(HIF)的羟基化的关键作用。HIF是在缺氧条件下与特定核辅因子相互作用的DNA结合转录因子,HIF反式激活一系列缺氧相关基因以触发适应性应答。由于其在细胞中的作用,HIF与许多细胞功能(诸如体内稳态、血管形成和厌氧代谢等)相关联。细胞中HIF的上调和下调可以引起癌细胞的血管生成或增殖,因此HIF和脯氨酰羟化酶由于其治疗潜能而被越来越多地研究。因此,本文所述的融合蛋白可以适用于脯氨酰羟化酶结构域蛋白。

在本说明书的上下文中,如果没有另外指明,则本文提及的所有出版物、专利申请、专利和其他参考文献均全文以引用方式明确地并入本文以用于所有目的,如同被完全阐述一样,并且其全文应当被认为是本公开的一部分。

除非另外限定,否则本文所使用的所有技术术语和科学术语均具有与本公开所属领域的普通技术人员所通常理解的相同的含义。如发生矛盾,则以本说明书及其所包括的定义为准。

当数量、浓度或者其他值或参数以范围给出或通过列出上限值和下限值而给出时,其应当理解为具体地公开由任何成对的任何范围上限和下限所形成的所有范围,而不管范围是否被单独地公开。当本文中引用数值范围时,除非另外规定,否则该范围旨在包括其端点,以及该范围内的所有的整数和分数。当限定范围时,不旨在将本公开的范围限制于所列举的具体值。

另外,除非另外明确相反地规定,否则当提供一个或多个范围或项目清单时,这应当理解为明确地公开这种范围或清单中的任何单个指定的值或项目,以及它们与相同的清单或任何其他清单中的任何其他单个值或项目的任何组合。

如本文所用,术语“包含”、“包括”、“具有”或它们的任何其他变型旨在涵盖非排他性的包括。例如,包括要素清单的过程、方法、制品或设备不必仅限于那些要素,而是可以包括未明确列出的或者此类过程、方法、制品或设备所固有的其他要素。

另外,除非明确相反地规定,否则“或”和“和/或”是指包含性的而不是排他性的。例如,以下任何一种情况都满足条件A或B,或者A和/或B:A为真(或存在)且B为假(或不存在)、A为假(或不存在)且B为真(或存在),以及A和B均为真(或存在)。

使用“一个”或“一种”来描述本文的各种要素和组成仅仅是为了方便起见,并且用于给出本公开的一般意义。该描述应当被解读为包括一个/种或至少一个/种,并且单数也包括复数,除非明显地另有所指。

以上书面描述提供了制备和使用该描述的方式和过程,使得本领域的任何技术人员均能够制备和使用该描述,该可据以实施性具体地是针对构成原始描述的一部分的所附权利要求书的主题提供的。

如本文所用,短语“选自由以下项组成的组”、“选自”等包括指定材料的混合物。

当特征或要素在本文中被称为“在”另一个特征或要素“之上”时,它可以直接位于其他特征或要素之上,或者还可以存在居间的特征和/或要素。相比之下,当特征或要素被称为“直接在”另一个特征或要素“之上”时,不存在居间的特征或要素。还应当理解,当特征或要素被称为“连接”、“附接”或“联接”到另一个特征或要素时,它可以直接连接、附接或联接到其他特征或要素,或者可以存在居间的特征或要素。相比之下,当特征或要素被称为“直接连接”、“直接附接”或“直接联接”到另一个特征或要素时,不存在居间的特征或要素。尽管是相对于一个实施方案描述或示出的,但如此描述或示出的特征和元件可应用于其他实施方案。本领域技术人员还将认识到,提及与另一个特征“相邻”设置的结构或特征可以具有与相邻特征重叠或位于相邻特征之下的部分。

为了便于描述,可以在本文中使用空间相对术语,诸如“在…下方”、“在…之下”、“下部”、“在…上方”、“上部”等来描述如附图所展示的一种要素或特征与另一种要素或特征的关系。应当理解,除了描绘于附图中的取向以外,空间相对术语还旨在涵盖使用或操作中的装置的不同取向。例如,如果附图中的装置是倒置的,则被描述为在其他要素或特征“下方”或“下面”的要素将取向为在其他要素或特征“上方”。因此,示例性术语“在…下方”可以涵盖“在…上方”和“在…下方”这两种取向。可按另外的方式来取向装置(旋转90度或呈其他取向),并且相应地解释本文所使用的空间相对描述词。类似地,仅出于解释的目的,在本文中使用术语“向上”、“向下”、“竖直”、“水平”等,除非另外明确指明。

尽管术语“第一”和“第二”可以在本文中用于描述各种特征/要素,但是这些特征/要素不应当受这些术语限制,除非上下文另外指明。这些术语可用于将一个特征/元件与另一个特征/元件区分开。因此,以下讨论的第一特征/要素可以被称为第二特征/要素,并且类似地,以下讨论的第二特征/要素可以被称为第一特征/要素,而不脱离本公开的教导内容。

当使用术语“约”时,其用于表示可以在一定的公差内获得一定的效果或结果,并且技术人员知道如何获得公差。当术语“约”用于描述值或范围的端点时,本公开应当被理解为包括所提及的具体的值或端点。在实施方案中,“约”可以指至多10%(即,±10%)的范围。

本文所列举的任何数值范围均旨在包括其中所包含的所有子范围。

本文包括的实施例和例证通过说明而非限制的方式示出其中可以实践主题的具体实施方案。如所提及的,可使用并从其中得到其他实施方案,使得可在不脱离本公开的范围的情况下做出结构和逻辑上的替代和变化。本发明主题的此类实施方案可以在本文中仅出于方便而单独或共同地提及,并非旨在自动将本申请的范围限制于任何单个发明构思(如果事实上公开多于一个的话)。因此,尽管在本文中已说明并且描述了具体实施方案,但是旨在实现相同目的的任何布置均可替代所示出的具体实施方案。本公开旨在涵盖各种实施方案的任何和所有改型或变型。对于本领域技术人员而言,在审阅以上描述后,以上实施方案的组合以及本文中未具体描述的其他实施方案将变得显而易见。

呈现以上描述是为了使本领域的技术人员能够制备和使用本文所公开的所有融合蛋白,并且以上描述是在特定应用及其要求的上下文中提供的。对优选实施方案的各种修改对于本领域的技术人员来说将是显而易见的,并且在不脱离本公开的实质和范围的情况下,本文所定义的一般原理可以应用于其他实施方案和应用。因此,本公开并非旨在限于所示的实施方案,而是要符合与本文所公开的原理和特征一致的最宽范围。

已经一般性地描述了本公开,可以通过参考某些具体实施例来获得进一步的理解,这些具体实施例在本文中仅出于说明的目的而提供,并且除非另外指明,则并非旨在进行限制。

从DNA 2.0获得牛P4HA1的DNA序列(SEQ ID NO:1)和牛P4HB的DNA序列(SEQ IDNO:2)。使用DNA序列作为模板通过引物MM-1090(SEQ ID NO:3)、MM-750(SEQ ID NO:4)、MM-0782(SEQ ID NO:5)、MM-0783(SEQ ID NO:6)、MM-0784(SEQ ID NO:7)、MM-0785(SEQ IDNO:8)进行聚合酶链反应,然后Gibson组装到载体MMV290(SEQ ID NO:9)中(Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA,Smith HO.Enzymatic assembly of DNAmolecules up to several hundred kilobases.NatMethods.2009;6:343–5.)。最终载体MMV290(图4)通过测序确认并且转化到巴斯德毕赤酵母菌株PP153中,以生成在N端具有P4HA1并且在C端具有P4HB的菌株PP336。

通过用Pme I消化MMV-130(图1)并且转化到PP1中而生成PP153。PP153包含由pDF启动子驱动的野生型胶原。

从IDT获得单体脯氨酰4-羟化酶α的DNA序列(SEQ ID NO:15)。使用DNA序列作为模板通过引物MM-0579(SEQ ID NO:18)、MM-0580(SEQ ID NO:19)、MM-1569(SEQ ID NO:20)、MM-1570(SEQ ID NO:21)、MM-0784(SEQ ID NO:7)进行聚合酶链反应,然后Gibson组装到载体MMV-644(SEQ ID NO:17)中。最终载体MMV-644(图10)通过测序确认并且转化到巴斯德毕赤酵母菌株PP97中,以生成菌株PP765。

通过用Swa I消化MMV-644(图10)并且转化到PP97中而生成PP765。PP765包含由pDF启动子驱动的在C端具有6X His标签的单体脯氨酰4-羟化酶和来自酿酒酵母α交配因子的分泌信号。

从DNA 2.0获得牛P4HA1的DNA序列和牛P4HB的DNA序列。使用DNA序列作为模板通过引物MM-1090、MM-750、MM-779、MM-780、MM-781、MM-369进行聚合酶链反应,然后Gibson组装到载体MMV289(SEQ ID NO:10)中。最终载体MMV289(图5)通过测序确认并且转化到酵母菌株PP153中,以生成在N端具有P4HB并且在C端具有P4HA1的菌株PP335。

将菌株PP336接种在具有2mL BMGY培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。将细胞快速离心,然后在800uL裂解缓冲液中通过Qiagen组织裂解仪裂解。用以下组分制备裂解缓冲液:2.5mL1M HEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mL Triton X-100;最终浓度1%并且42mLMillipure水。上清液含有在N端具有P4HA1并且在C端具有P4HB的融合蛋白(AB融合蛋白),将其上样于SDS PAGE凝胶上并且转移至PVDF膜。在蛋白质印迹中用P4HB抗体探测融合蛋白。

将菌株PP765接种在具有2mL BMGY培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。将细胞快速离心并且收集培养基。将含有单体脯氨酰4-羟化酶的上清液上样于SDS PAGE凝胶上并且转移至PVDF膜。在蛋白质印迹中用His标签抗体探测融合蛋白。

使用菌株PP335进行上述相同程序以生成在N端具有P4HB并且在C端具有P4HA1的融合蛋白(BA融合蛋白)。

对于AB22融合蛋白,我们通过考马斯染色和蛋白质印迹均检测到分子量为约120kDa的融合蛋白。对于BA融合蛋白,我们不能同时通过这两种方法检测到融合蛋白。

将菌株PP336接种在具有2mL BMGY发酵培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。同时,让分别具有胶原的DNA序列、P4HA的DNA序列和P4HB的DNA序列的基准酵母菌株PP268在相同条件下生长。

通过用Bam HI消化MMV156(图2)并且转化到PP153中以生成PP154,来生成PP268,然后用Bam HI消化MMV-191(图3)并且转化到PP154中以生成PP268。

按照以下程序通过胃蛋白酶测定来分析样品PP336和PP268,以评估胶原三聚体对胃蛋白酶的敏感性。PP336将具有与PP268类似的胃蛋白酶耐受性。

通过氨基酸分析对PP336和PP268的脯氨酸羟基化进行分析。PP336将具有与针对PP268观察到的相似或更好的脯氨酸羟基化。

胃蛋白酶测定用以下程序进行:

1.在胃蛋白酶处理之前,根据Thermo Scientific方案进行二辛可宁酸(BCA)测定以获得每个样品的总蛋白。对于所有样品,将总蛋白标准化为最低浓度。

2.将100uL裂解物放入微量离心管中。

3.产生含有以下物质的主混合物:

a.37%HCl(每l00mL含有0.6mL酸)和

b.胃蛋白酶(在去离子水中的原液为l mg/mL,并且胃蛋白酶的最终添加应当为1:25比率的胃蛋白酶:总蛋白(重量:重量)。

c.基于步骤#1,即总蛋白的标准化,胃蛋白酶的量将随最终添加而变化,使用创建的电子表格进行调整。

4.添加胃蛋白酶之后,用吸移管混合3次,然后使样品在室温处温育一小时,以进行胃蛋白酶反应。

5.一小时之后,向每个样品中添加1:1体积的含有β-巯基乙醇的LDS加载缓冲液,然后使其在70℃处温育7分钟。

6.然后以14,000rpm旋转1分钟以除去浊度。

将不含胶原和融合蛋白的DNA的酵母菌株PP97在YPD培养基和80mM脯氨酸中生长过夜,以产生生长的培养物。用5mL生长的培养物接种20mL YPD培养基和80mM脯氨酸,并且在30℃处以300rpm温育1小时。在4℃处以5000rpm离心5分钟来收获细胞并用无菌水洗涤两次,然后与10mL转化缓冲液混合并在25℃处与10mM DDT一起温育25分钟。收获细胞并用冷山梨醇洗涤两次,然后用电穿孔转化含有AB融合蛋白的DNA的MMV400(SEQ ID NO:11和图6)。细胞在80mM脯氨酸在整个持续时间内存在的博莱霉素500板上温育三小时之后进行铺板。将板在30℃处温育两天,然后按照实施例3中所述的程序筛选菌落。结果显示,融合蛋白在脯氨酸的存在下转化到空宿主细胞中。

在YPD培养基中不存在脯氨酸的情况下,没有菌落或仅形成了几个菌落。当通过蛋白质印迹来分析这些菌落时,所有菌落对于AB融合蛋白均为阴性。在将80mM脯氨酸添加到YPD培养基的实验中,通过蛋白质印迹来分析6/6菌落,所有菌落对于AB融合蛋白均为阳性。

用BglII和MluI将载体MMV290(图4)(SEQ ID NO:9)消化,然后与插入序列(SEQ IDNO:12)一起进行Gibson组装,该插入序列涵盖AB融合蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子,从而生成载体MMV502(图7)。

用BglII和MluI将载体MMV156(图2)(SEQ ID NO:13)消化,然后与插入序列(SEQID NO:12)一起进行Gibson组装,该插入序列涵盖P4HB亚基蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子,从而生成载体MMV503(图8)。

将MMV502转化到PP153中,从而生成菌株PP548。对该菌株进行培养、裂解并使用各种方法(包括蛋白质印迹和考马斯染色凝胶)测定蛋白含量。蛋白质印迹确认存在AB融合蛋白。考马斯染色凝胶确认了具有His标签的AB融合蛋白的分子量(119kDa)。将PP548菌株的高表达变体在摇瓶和发酵罐中生长。一旦汇合,就将细胞离心成沉淀并洗涤。然后在800uL裂解缓冲液中通过Qiagen组织裂解仪将细胞裂解。用以下组分制备裂解缓冲液:2.5mL 1MHEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mLTriton X-100;最终浓度1%并且42mL Millipure水。将裂解物离心,并且将可溶性级分与镍-NTA琼脂糖珠一起温育。将澄清的裂解物-珠混合物施加到保留珠的柱上。随后用不同浓度的咪唑(可能包括其他化学品,诸如1,10-菲咯啉和EDTA)洗涤镍-NTA珠。然后通过用300mM咪唑洗涤来洗脱由质粒MMV502编码的具有His标签的AB融合蛋白。将这些洗脱液合并或保持分离,然后使用Amico Ultra-15过滤柱进行缓冲液交换以除去残余咪唑。然后将AB融合蛋白用于后续测定。

将MMV503转化到PP153中,从而生成菌株PP549。对该菌株进行培养、裂解并使用各种方法(包括蛋白质印迹和考马斯染色凝胶)测定蛋白含量。蛋白质印迹确认存在P4HA酶和P4HB酶。考马斯染色凝胶确认了P4HA酶的分子量(61kDa)和P4HB酶的分子量(57kDa)。将PP549菌株的高表达变体在摇瓶和发酵罐中生长。一旦汇合,就将细胞离心成沉淀并洗涤。然后在800uL裂解缓冲液中通过Qiagen组织裂解仪将细胞裂解。用以下组分制备裂解缓冲液:2.5mL 1M HEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mL Triton X-100;最终浓度1%并且42mL Millipure水。将裂解物离心,并且将可溶性级分与镍-NTA琼脂糖珠一起温育。将澄清的裂解物-珠混合物施加到保留珠的柱上。随后用不同浓度的咪唑(可能包括其他化学品,诸如1,10-菲咯啉和EDTA)洗涤镍-NTA珠。然后通过用300mM咪唑洗涤来洗脱由质粒MMV503编码的具有His标签的P4HA和P4HB。将洗脱液合并或保持分离,然后使用Amico Ultra-15过滤柱进行缓冲液交换以除去残余咪唑。然后将P4HA蛋白和P4HB蛋白用于后续测定。

通过对基于α-酮戊二酸羟基化偶联脱羧的方法的改进,确认了来自PP548的融合蛋白酶活性(Kivirikko,K.I.和Myllyla

来自PP548的P4HA和P4HB酶活性通过与上文相同的测定法来确认。

结果显示,与具有天然的P4HA蛋白和P4HB蛋白的样品相比,在具有AB融合蛋白的样品中存在较少的α-酮戊二酸。这表明AB融合蛋白比天然的P4HA蛋白和P4HB蛋白具有更大的活性。

通过用Pme I消化MMV411(SEQ ID NO:14和图9)并且转化到PP97中而生成PP434。

将单个菌落接种在50mL BMGY培养基中,同时在30℃处以250rpm恒定振荡过夜。第二天,用1L锥形瓶中过夜生长的培养物接种500mL新鲜的BMGY培养基,并且在30℃处伴随以250rpm恒定振荡生长2天。

将PP434细胞重悬(1g湿细胞重量(wcw))在5.667ml磷酸盐缓冲液(50mM,pH 7.4)中。在珠磨器中使用Matrix D珠将细胞裂解5个循环(每两个循环之间冷却1分钟)以生成全细胞裂解物。然后将全细胞裂解物置于若干个1.5ml微量离心管中并且在70℃处加热30分钟,每5分钟轻轻混合一次。然后将全细胞裂解物在4℃处以21000*g快速离心5分钟。将上清液置于冰上10分钟。将Ni-NTA树脂(对于1g wcw,0.5ml床体积)用去离子水平衡3次,通过在4℃处以800*g离心2分钟将乙醇除去。将澄清的裂解物添加到平衡的Ni-NTA树脂中,并且在4℃处上下颠倒旋转温育60分钟。通过在4℃处以800*g离心5分钟来收集上清液。用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、20mM咪唑通过在4℃处以800*g离心2分钟来洗涤树脂。然后用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、250mM咪唑通过在4℃处以800*g离心2分钟来洗涤树脂。在4℃处将蛋白质与洗脱缓冲液一起温育5分钟(上下颠倒旋转)之后,通过在4℃处以800*g离心2分钟,来用5ml 50mM磷酸盐缓冲液(pH 7.4)、500mM咪唑将蛋白质洗脱3次。在SDSPAGE上分析样品(上清液和沉淀两者,连同全细胞裂解物)。然后将样品在50mMTris(pH 8.0)、100mM NaCl中用至少一次缓冲液更换进行透析(在至少100倍样品体积中透析)。

将载体MMV363修饰为包括22kD小Pre-Pro-Col3以及相关联的启动子pDF和终止子AOX1TT、Flag标签和HA标签、用于标记表达的DNA序列以及相关联的启动子和终止子、用于细菌和酵母的复制起点的DNA序列,以及用于整合的与酵母基因组具有同源性的DNA序列。载体MMV88是Pre-Pro-Col3结构域的来源DNA。载体MMV130是Col3A1结构域加上HA标签和Flag标签的来源DNA。Col3A1多肽的总长度为190个氨基酸(aa)。将3个片段Gibson组装在一起,所得的质粒为MMV383。

使用Aox着陆垫进行整合,将MMV383转化到PP97中。所得的毕赤酵母属菌株为PP414。随后的蛋白质印迹显示分泌了小的22kD Col3分子。

用MMV502(MMV290的带His标签的版本)转化PP414,以生成PP547

将PP97的单个菌落接种在具有80mM脯氨酸的15ml YPD培养基中,并且在30℃处伴随振荡(250rpm)生长过夜。第二天,用具有80mM脯氨酸的新鲜YPD将培养基的体积加倍,并且在30℃处伴随振荡(250rpm)再生长一小时。将细胞以3,500g快速离心5分钟;用无菌水洗涤两次,重悬于10ml转化缓冲液(10mM Tris-Cl(pH 7.5)、100mM LiAc、0.6M山梨醇)中,添加10mM二硫苏糖醇(DTT)并且充分混合。将重悬液在室温处温育30分钟。将细胞以3,500×g快速离心5分钟并且将沉淀重悬于5ml冰冷的1M山梨醇中,并且以3,500×g再次快速离心5分钟。用5ml 1M山梨醇重复洗涤两次。将洗涤过的沉淀重悬于500μl冰冷的1M山梨醇中,取100μl该重悬液等分到预冷却的0.2cm电穿孔比色皿中。将MMV502的线性化DNA序列(图7)和MMV503的线性化DNA序列(图8)添加至细胞(在单独的比色皿中),并且通过吸移进行混合。还设置了阴性对照,其中将水而不是线性化DNA序列添加至细胞混合物。将混合物在冰上温育10分钟。温育之后,使用毕赤酵母属-WU方案(1500v,25uF,200W)通过脉冲进行电穿孔,使用Bio-Rad Gene Pulser Xcell

挑取在温育2天后出现在板上的菌落并且接种在含有500μg/ml的G418的BMGY培养基中。接种在2ml培养物中进行,并且以24孔的形式进行。将板在30℃处伴随振荡(900rpm)温育2天。将每个2ml培养物快速离心,将100mg沉淀重悬于1ml裂解缓冲液(50mM磷酸钠、5%甘油和1%EDTA,pH 7.5)中。使用组织裂解仪和Y基质珠裂解15分钟。将裂解物与SDS Licor负载染料以5:1的比率混合,在90℃处加热10分钟,然后上样在4%至12%Bis-Tris凝胶上。将凝胶转移到PVDF膜上。使用抗His抗体和抗胶原抗体进行蛋白质印迹分析。由于P4H带His标签,所以融合P4H在红色通道中显示为110kDa蛋白,而双向表达的P4HA/B在红色通道中在59kDa处出现。在印迹中没有观察到胶原条带,确认P4H质粒已转化,此时无胶原。示出融合P4H的高表达的克隆被确认为PP635,并且示出双向表达P4H的高表达的克隆被确认为PP636。

将每种菌株的单个菌落分别接种在50mL BMGY培养基中,同时在30℃处以250rpm恒定振荡过夜。第二天,用1L锥形瓶中过夜生长的培养物接种500mL新鲜的BMGY培养基,并且在30℃处伴随以250rpm恒定振荡生长2天。

将细胞(0.45g wcw(湿细胞重量))重悬于0.65ml裂解缓冲液(25mM Tris(pH7.5)、50mM NaCl、20mM咪唑)中,以获得45%悬液。在珠磨器中使用Matrix D珠将细胞裂解5个循环(在每两个循环之间冷却1分钟)以生成裂解物。将裂解物快速离心,以澄清上清液和沉淀(4℃,10分钟,16000*g)。移出澄清的裂解物并置于冰上。用2倍wcw的裂解缓冲液重悬沉淀,并且以16000*g离心10分钟,以收集更澄清的裂解物。将澄清的裂解物合并在一起。将Ni-NTA树脂(对于1g wcw为约0.025ml床体积并且适当放大)在去离子水中平衡三次,通过在4℃处以800*g离心2分钟将乙醇除去。将澄清的裂解物添加到平衡的Ni-NTA树脂中,并且在4℃处上下颠倒旋转温育过夜。通过在4℃处以800*g离心5分钟来收集上清液。用10倍柱体积的含有50mM咪唑的裂解缓冲液通过在4℃处以800*g离心2分钟来洗涤树脂。然后用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、250mM咪唑通过在4℃处以800*g离心5分钟来洗涤树脂。在4℃处将蛋白质与洗脱缓冲液一起温育5分钟(上下颠倒旋转)之后,通过在4℃处以800*g离心5分钟,来用5ml含有300mM咪唑的裂解缓冲液将蛋白质洗脱。再进行2次洗脱(总共3次)。在SDSPAGE上分析样品(上清液和沉淀两者,连同全细胞裂解物)。将样品在50mMTris(pH 8.0)、100mM NaCl中用至少一次缓冲液更换进行透析(在至少100倍样品体积中透析),以生成经纯化的胶原裂解物。

1)按照下表制备用于40个反应的反应混合物(每个反应250ul)。

2)对于250ul反应物,将20ul上述混合物等分到每个管中(每种反应物一式三份地进行)。

3)添加1g/L BSA、0.1g/L过氧化氢酶和水,以将最终体积补足至250uL

4)添加5uM融合蛋白

5)添加2uM胶原样品

6)将反应物在32℃处温育2分钟

7)添加2.5ul的0.4M 2-氧化戊二酸并充分混合

8)在32℃处温育1小时

9)将100ul的每种反应物转移到新的管中,并且移交样品用于羟脯氨酸测定

1.制备以下溶液:

用Milli-Q水补足至100mL

1.41g 氯胺T

10mL 异丙醇

10mL Milli-Q水

4g 对二甲基苯甲醛(DMAB)

6mL 盐酸

14mL 异丙醇

4mL 氯胺T(来自上文)

16mL 柠檬酸盐/乙酸盐缓冲液(来自上文)

2.

a.将100uL含有胶原的体外羟基化反应物放入琥珀色玻璃小瓶中。

b.添加500uL浓HCl,并将小瓶盖紧。

c.将小瓶在加热块中在125℃处温育至少18小时。

d.使用快速真空将样品干燥。

e.用225uL Milli-Q水将干燥样品重悬于小瓶中。

f.以10,000X g将样品离心5分钟以除去析出物和碎片,并且取出上清液以用于测定。

3.

a.制备1000ug/mL的羟脯氨酸原液

b.使用该原液制备50ug/mL的最高标准浓度

c.使用50ug/mL溶液,使标准曲线具有以下浓度:25ug/mL、18.75ug/mL、12.5ug/mL、6.25ug/mL、3.125ug/mL

d.0ug/mL=水

e.将这些标准物置于96孔板中的孔A1至A7中,其平行样置于孔B1至B7中。

4.

a.按照步骤2a至2d,但是使用400uL的III型胶原(Abcam,ab7528)代替含有胶原的体外羟基化反应物

b.重悬于400uL Milli-Q水中

c.将内参置于96孔板的A8和B8中

5.

a.从III型胶原的原液小瓶中取出50uL等分试样,以在qSDS上运行。

b.使用由qSDS获得的浓度来计算内参的羟基化百分比。

6.

a.添加50uL标准物并且一式四份地取样(2个平行样将为其中不添加氯胺T的空白样)

b.对于待分析的每个反应物(包括标准曲线孔),添加100uL氯胺T/柠檬酸盐-乙酸盐溶液

c.对于

d.将板密封,并且在30℃处伴随振荡温育25分钟

e.添加100uL的埃尔利希氏溶液并将每个孔充分混合,直到孔澄清为止

f.将板密封,并且在65℃处伴随振荡温育25分钟

g.将板从热源移走,并且测量所有样品/空白样在560nm处的吸光度。

h.通过获得所用胶原的分子量来计算羟基化百分比。还需要所使用的所述胶原的螺旋区中的羟脯氨酸位点和脯氨酸的数目。

i.

PP685胶原的分子量=94,752g/mol

羟脯氨酸的分子量=131.13g/mol

螺旋区中的羟脯氨酸位点的数目=145

螺旋区中的脯氨酸位点的数目=246

IVOH反应中的PP685胶原浓度=0.084g/L

a.从IVOH反应的标准曲线获得的羟脯氨酸浓度

·3.91ug/mL

·使用乘法因子校正=3.1×3.91ug/mL=12.1ug/mL

b.以微克(ug)表示的羟脯氨酸浓度

·每孔使用50uL样品

·(50uL×12.1ug/mL)除以1000=0.607ug羟脯氨酸

c.IVOH反应中所使用的胶原的微克数

·每孔使用50uL样品

·(50uL×0.084g/L)乘以1×10

d.PP685胶原的nmol

·(4.2ug/1×10

·(4.2×10

mol

·4.4×10

e.羟脯氨酸的nmol

·(0.607ug/131.13g/mol)×1000=4.6nmol羟脯氨酸

f.脯氨酸的nmol

·0.044nmol胶原×246=10.8nmol脯氨酸

g.羟脯氨酸的百分比%

·(4.6nmol/10.8nmol)×100=42%羟基化

结果表明,在存在必要辅因子和适当反应条件(温度和pH)的情况下,两种菌株(PP547和PP635)中的融合蛋白均能够将胶原底物羟基化至比含有非融合蛋白的PP636菌株更高的%。PP547和PP635的不同之处在于前者中存在胶原的小片段,该小片段最初被认为是菌株以及蛋白质的稳定性所必需的。这表明融合蛋白是稳定的,并且与非融合蛋白相比可以在体外作为更好的双加氧酶起作用,从而提供优于非融合对应物的优点。P4HA和P4HB这两者的融合产生化学计算量的蛋白质,从而产生有助于蛋白质的结构和稳定性的功能性四聚体。%羟基化结果通过质谱确认。

-使用NaPO

对于体内羟基化,胶原是在粗面内质网中在几种分子伴侣和酶的帮助下合成的。胶原的折叠机制由蛋白质二硫键异构酶(PDI)辅助,PDI是本文所用的菌株中存在的P4HA-B融合蛋白的一部分。PDI有助于在蛋白质的非胶原性N端和C端中正确地形成二硫键,之后由该融合蛋白的P4HA部分将脯氨酸残基羟基化。参与形成羟基化反应的辅因子存在于ER(内质网)中,从而使ER成为体内羟基化的重要细胞器。一旦胶原被合成,它就被ER中存在的分子伴侣稳定并且被P4HA-B融合蛋白羟基化,其中B亚基进一步稳定和/或有助于三聚反应,而A亚基使用其双加氧酶活性将脯氨酸残基羟基化。

按照上述教导内容,本公开的许多修改和变型是可能的。因此,应当理解,在所附权利要求书的范围内,本公开可以以不同于本文具体描述的方式实施。

序列表

<110> Modern Meadow, Inc.

<120> 用于羟基化氨基酸的融合蛋白和产品

<130> 514761WO

<160> 21

<170> PatentIn版本3.5

<210> 1

<211> 1612

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 1

atgatttggt atatcctagt cgttggtatt ttgttgccac agtcactggc tcacccaggc 60

ttcttcactt ctataggaca gatgactgat ttgattcaca cagaaaaaga cctagttaca 120

agccttaaag actatatcaa agctgaagag gataagttgg agcaaatcaa aaagtgggca 180

gagaaactcg atagattgac tagtactgca acaaaagatc ctgagggttt tgtgggtcac 240

ccagtgaatg ctttcaagct gatgaagaga cttaatacag agtggtcaga attggaaaac 300

ttggtactta aagatatgag tgatggattc atttctaact taacaattca aagacaatac 360

tttccaaacg atgaggacca agtaggagca gcaaaagctt tgttgcgatt gcaggacaca 420

tacaatttgg acaccgacac gatatcgaag ggtgatttac ctggtgtgaa gcataagtcc 480

ttcctcactg tggaagattg ttttgaattg ggaaaagtcg catatacaga agccgactac 540

tatcacacag aattatggat ggagcaagct ctgcgtcagt tggacgaagg tgaagtttct 600

accgttgata aggtttcagt tttggattac ttatcatacg ctgtttacca gcaaggtgat 660

ctggacaaag ctctactttt aactaaaaag ttgttggagc tggacccgga gcatcaaaga 720

gctaacggta atctgaaata ctttgaatac atcatggcta aggaaaagga cgcaaataag 780

tcctcgtccg atgaccaatc cgatcaaaag accactctga aaaaaaaagg tgcagctgtt 840

gactacctcc cagagagaca aaagtatgaa atgctgtgta gaggagaggg tatcaagatg 900

actccaagga gacagaaaaa gctgttctgt agatatcatg atgggaaccg taacccaaaa 960

ttcattcttg ctccagcgaa acaggaagat gaatgggaca agcctagaat cattcgtttt 1020

catgacatca tctccgatgc agaaatagag gttgtgaaag acttggccaa accaagattg 1080

agtagggcta ccgtccatga ccctgagact ggaaaattga ctaccgcaca atatcgtgtc 1140

tctaaatcag catggttgtc cggttacgag aatcccgtgg tcagccgtat caatatgcgt 1200

attcaagatt tgactggtct tgacgtaagc actgctgagg aactacaagt tgccaactat 1260

ggtgtgggcg gtcagtatga accccacttt gatttcgcca gaaaggacga gcctgatgct 1320

tttaaggagc taggtactgg aaatagaatc gcaacgtggt tgttctatat gtccgatgtg 1380

cttgctggag gagccacagt tttccctgag gtaggtgctt ctgtttggcc taaaaagggc 1440

acggccgtat tttggtacaa tctgtttgca tctggagaag gtgattacag cactagacat 1500

gctgcttgtc ccgtcttagt cggtaataag tgggtttcca ataagtggct gcatgagaga 1560

ggtcaagagt ttaggaggcc atgcacattg tcagaattag aatgataatt tt 1612

<210> 2

<211> 1750

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 2

aaaatgagat tcccatctat tttcaccgct gtcttgttcg ctgcctcctc tgcattggct 60

gcccctgtta acactaccac tgaagacgag actgctcaaa ttccagctga agcagttatc 120

ggttactctg accttgaggg tgatttcgac gtcgctgttt tgcctttctc taactccact 180

aacaacggtt tgttgttcat taacaccact atcgcttcca ttgctgctaa ggaagagggt 240

gtctctctcg agaaaagaga ggccgaagct gcacccgatg aggaagatca tgttttagta 300

ttgcataaag gaaatttcga tgaagctttg gccgctcaca aatatctgct cgtcgagttt 360

tacgctccct ggtgcggtca ttgtaaggcc cttgcaccag agtacgccaa ggcagctggt 420

aagttaaagg ccgaaggttc agagatcaga ttagcaaaag ttgatgctac agaagagtcc 480

gatcttgctc aacaatacgg ggttcgagga tacccaacaa ttaagttttt caaaaatggt 540

gatactgctt ccccaaagga atatactgct ggtagagagg cagacgacat agtcaactgg 600

ctcaaaaaga gaacgggccc agctgcgtct acattaagcg acggagcagc agccgaagct 660

cttgtggaat ctagtgaagt tgctgtaatc ggtttcttta aggacatgga atctgattca 720

gctaaacagt tccttttagc agctgaagca atcgatgaca tccctttcgg aatcacctca 780

aatagtgacg tgttcagcaa gtaccaactt gacaaagatg gagtggtctt gttcaaaaag 840

tttgacgaag gcagaaacaa tttcgagggt gaggttacaa aggagaaact gcttgatttc 900

attaaacata accaactacc cttagttatc gaattcactg aacaaactgc tcctaagatt 960

ttcggtggag aaatcaaaac acatatcttg ttgtttttgc caaagtccgt atcggattat 1020

gaaggtaaac tctccaattt caaaaaggcc gctgagagct ttaagggcaa gattttgttc 1080

atctttattg actcagacca cacagacaat cagaggattt tggagttttt cggtttgaaa 1140

aaggaggaat gtccagcagt ccgtttgatc accttggagg aggagatgac caaatacaaa 1200

ccagagtcgg atgagttgac tgccgagaag ataacagaat tttgtcacag atttctggaa 1260

ggtaagatca agcctcatct tatgtctcaa gagttgcctg atgactggga taagcaacca 1320

gttaaagtat tggtgggtaa aaactttgag gaagtggcct tcgacgagaa aaaaaatgtc 1380

tttgttgaat tctatgctcc gtggtgtggt cactgtaagc agctggcacc aatttgggat 1440

aaactgggtg aaacttacaa agatcacgaa aacattgtta ttgcaaagat ggacagtact 1500

gctaacgaag tggaggctgt gaaagttcac tccttcccta cgctgaagtt ctttcctgca 1560

tctgctgaca gaactgttat cgactataat ggagagagga cattggatgg ttttaaaaag 1620

tttcttgaat ccggaggtca agacggagct ggtgacgacg atgatttgga agatctggag 1680

gaggctgagg aacctgatct tgaggaggat gacgaccaga aggcagtcaa agatgaactg 1740

tgataagggg 1750

<210> 3

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 3

ctcaattgtt gtttatatca ttgctattta aatcaggtga acccacctaa ctattttt 58

<210> 4

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 4

ttttgttgtt gagtgaagcg agtgacggaa 30

<210> 5

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 5

ttccgtcact cgcttcactc aacaacaaaa atgatttggt atatcctagt cgttggtatt 60

<210> 6

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 6

ttctaattct gacaatgtgc atggcctcct 30

<210> 7

<211> 84

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 7

aggaggccat gcacattgtc agaattagaa ggttctggct ctggttctgg ctctatgaga 60

ttcccatcta ttttcaccgc tgtc 84

<210> 8

<211> 69

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 8

ctgcaacaaa agaaacaaga cattactgaa gggccggccg cacaaacgaa ggtctcactt 60

aatcttctg 69

<210> 9

<211> 10109

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 9

ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60

aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120

cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180

tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240

tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300

gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360

aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420

cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480

atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540

aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600

cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660

gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720

ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780

tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840

gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900

cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960

attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020

tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080

cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140

gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200

tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260

aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320

gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380

tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440

tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500

gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560

tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620

tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680

gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740

atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800

attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcatcagaat 1860

tggttaattg gttgtaacac tgacccctat ttgtttattt ttctaaatac attcaaatat 1920

gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagaa 1980

tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 2040

tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 2100

acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 2160

cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 2220

ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 2280

ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 2340

atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 2400

cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 2460

tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 2520

gcctgtagcg atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 2580

ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 2640

ctcggccctt ccggctggct ggtttattgc tgataaatcc ggagccggtg agcgtggttc 2700

tcgcggtatc atcgcagcgc tggggccaga tggtaagccc tcccgtatcg tagttatcta 2760

cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 2820

ctcactgatt aagcattggt aactgcagga aaagggtacc actgagcgtc agaccccgta 2880

gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 2940

acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 3000

tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 3060

ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 3120

atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggaccca 3180

agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 3240

cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 3300

agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 3360

acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 3420

gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 3480

ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 3540

gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt ttgtaagtaa 3600

acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta tatatcaggc 3660

atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg atataggtat 3720

gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg caggaggaaa 3780

agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt aaacacatgg 3840

ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga tcattcgagt 3900

ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt tcatctgggt 3960

ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca gatgaggagg 4020

atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac aaagtagacc 4080

tgtcactcaa ttgttgttta tatcattgct atttaaataa tgtatctaaa cgcaaactcc 4140

gagctggaaa aatgttaccg gcgatgcgcg gacaatttag aggcggcgat caagaaacac 4200

ctgctgggcg agcagtctgg agcacagtct tcgatgggcc cgagatccca ccgcgttcct 4260

gggtaccggg acgtgaggca gcgcgacatc catcaaatat accaggcgcc aaccgagtgt 4320

ctcggaaaac agcttctgga tatcttccgc tggcggcgca acgacgaata atagtccctg 4380

gaggtgacgg aatatatatg tgtggagggt aaatctgaca gggtgtagca aaggtaatat 4440

tttcctaaaa catgcaatcg gctgccccgc aacgggaaaa agaatgactt tggcactctt 4500

caccagagtg gggtgtcccg ctcgtgtgtg caaataggct cccactggtc accccggatt 4560

ttgcagaaaa acagcaagtt ccggggtgtc tcactggtgt ccgccaataa gaggagccgg 4620

caggcacgga gtttacatca agctgtctcc gatacactcg actaccatcc gggtctctca 4680

gagaggggaa tggcactata aataccgcct ccttgcgctc tctgccttca tcaatcaaat 4740

catgctgagg actcgaattc gacctctgtt gcctctttgt tggacgaacc attcaccggt 4800

gtcttgtact taaagggcag tggtatcact gaagacttcc agtccctaaa gggtaagaag 4860

atcggttacg ttggtgactt cggtaagatc caaatcgatg aattgaccaa gcactacggt 4920

atgaagccag aagactacac cgccgtcaga tgtggtatga atgtcgccaa gtacatcatc 4980

gaaggtaaga ttgatgccgg tattggtatc gaatgtatgc aacaagtcga attggaagag 5040

tacttggcca agcaaggcag accagcttct gatgctaaaa tgttgagaat tgacaagttg 5100

gcttgcttgg gttgctgttg cttctgtacc gttctttaca tctgcaacga tgaatttttg 5160

aagaagaacc ctgaaaaggt cagaaagttc ttgaaagcca tcaagaaggc aaccgactac 5220

gttctagccg accctgtgaa ggcttggaaa gaatacatcg acttcaagcc tcaattgaac 5280

aacgatctat cctacaagca ataccaaaga tgttacgctt acttctcttc atctttgtac 5340

aatgttcacc gtgactggaa gaaggttacc ggttacggta agagattagc catcttgcca 5400

ccagactatg tctcgaacta cactaatgaa tacttgtcct ggccagaacc agaagaggtt 5460

tctgatcctt tggaagctca aagattgatg gctattcatc aagaaaaatg cagacaggaa 5520

ggtactttca agagattggc tcttccagct taagcggccg cgagtcgtga gtaatcaaga 5580

ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac ttttttattt 5640

gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac gagcttgctc 5700

ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg aaaatcattc 5760

gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag attaagtgag 5820

acgttcgttt gtgctccgga caggtgaacc cacctaacta tttttaactg ggatccagtg 5880

agctcgctgg gtgaaagcca accatctttt gtttcgggga accgtgctcg ccccgtaaag 5940

ttaatttttt tttcccgcgc agctttaatc tttcggcaga gaaggcgttt tcatcgtagc 6000

gtgggaacag aataatcagt tcatgtgcta tacaggcaca tggcagcagt cactattttg 6060

ctttttaacc ttaaagtcgt tcatcaatca ttaactgacc aatcagattt tttgcatttg 6120

ccacttatct aaaaatactt ttgtatctcg cagatacgtt cagtggtttc caggacaaca 6180

cccaaaaaaa ggtatcaatg ccactaggca gtcggtttta tttttggtca cccacgcaaa 6240

gaagcaccca cctcttttag gttttaagtt gtgggaacag taacaccgcc tagagcttca 6300

ggaaaaacca gtacctgtga ccgcaattca ccatgatgca gaatgttaat ttaaacgagt 6360

gccaaatcaa gatttcaaca gacaaatcaa tcgatccata gttacccatt ccagcctttt 6420

cgtcgtcgag cctgcttcat tcctgcctca ggtgcataac tttgcatgaa aagtccagat 6480

tagggcagat tttgagttta aaataggaaa tataaacaaa tataccgcga aaaaggtttg 6540

tttatagctt ttcgcctggt gccgtacggt ataaatacat actctcctcc cccccctggt 6600

tctctttttc ttttgttact tacattttac cgttccgtca ctcgcttcac tcaacaacaa 6660

aaatgatttg gtatatccta gtcgttggta ttttgttgcc acagtcactg gctcacccag 6720

gcttcttcac ttctatagga cagatgactg atttgattca cacagaaaaa gacctagtta 6780

caagccttaa agactatatc aaagctgaag aggataagtt ggagcaaatc aaaaagtggg 6840

cagagaaact cgatagattg actagtactg caacaaaaga tcctgagggt tttgtgggtc 6900

acccagtgaa tgctttcaag ctgatgaaga gacttaatac agagtggtca gaattggaaa 6960

acttggtact taaagatatg agtgatggat tcatttctaa cttaacaatt caaagacaat 7020

actttccaaa cgatgaggac caagtaggag cagcaaaagc tttgttgcga ttgcaggaca 7080

catacaattt ggacaccgac acgatatcga agggtgattt acctggtgtg aagcataagt 7140

ccttcctcac tgtggaagat tgttttgaat tgggaaaagt cgcatataca gaagccgact 7200

actatcacac agaattatgg atggagcaag ctctgcgtca gttggacgaa ggtgaagttt 7260

ctaccgttga taaggtttca gttttggatt acttatcata cgctgtttac cagcaaggtg 7320

atctggacaa agctctactt ttaactaaaa agttgttgga gctggacccg gagcatcaaa 7380

gagctaacgg taatctgaaa tactttgaat acatcatggc taaggaaaag gacgcaaata 7440

agtcctcgtc cgatgaccaa tccgatcaaa agaccactct gaaaaaaaaa ggtgcagctg 7500

ttgactacct cccagagaga caaaagtatg aaatgctgtg tagaggagag ggtatcaaga 7560

tgactccaag gagacagaaa aagctgttct gtagatatca tgatgggaac cgtaacccaa 7620

aattcattct tgctccagcg aaacaggaag atgaatggga caagcctaga atcattcgtt 7680

ttcatgacat catctccgat gcagaaatag aggttgtgaa agacttggcc aaaccaagat 7740

tgagtagggc taccgtccat gaccctgaga ctggaaaatt gactaccgca caatatcgtg 7800

tctctaaatc agcatggttg tccggttacg agaatcccgt ggtcagccgt atcaatatgc 7860

gtattcaaga tttgactggt cttgacgtaa gcactgctga ggaactacaa gttgccaact 7920

atggtgtggg cggtcagtat gaaccccact ttgatttcgc cagaaaggac gagcctgatg 7980

cttttaagga gctaggtact ggaaatagaa tcgcaacgtg gttgttctat atgtccgatg 8040

tgcttgctgg aggagccaca gttttccctg aggtaggtgc ttctgtttgg cctaaaaagg 8100

gcacggccgt attttggtac aatctgtttg catctggaga aggtgattac agcactagac 8160

atgctgcttg tcccgtctta gtcggtaata agtgggtttc caataagtgg ctgcatgaga 8220

gaggtcaaga gtttaggagg ccatgcacat tgtcagaatt agaaggttct ggctctggtt 8280

ctggctctat gagattccca tctattttca ccgctgtctt gttcgctgcc tcctctgcat 8340

tggctgcacc cgatgaggaa gatcatgttt tagtattgca taaaggaaat ttcgatgaag 8400

ctttggccgc tcacaaatat ctgctcgtcg agttttacgc tccctggtgc ggtcattgta 8460

aggcccttgc accagagtac gccaaggcag ctggtaagtt aaaggccgaa ggttcagaga 8520

tcagattagc aaaagttgat gctacagaag agtccgatct tgctcaacaa tacggggttc 8580

gaggataccc aacaattaag tttttcaaaa atggtgatac tgcttcccca aaggaatata 8640

ctgctggtag agaggcagac gacatagtca actggctcaa aaagagaacg ggcccagctg 8700

cgtctacatt aagcgacgga gcagcagccg aagctcttgt ggaatctagt gaagttgctg 8760

taatcggttt ctttaaggac atggaatctg attcagctaa acagttcctt ttagcagctg 8820

aagcaatcga tgacatccct ttcggaatca cctcaaatag tgacgtgttc agcaagtacc 8880

aacttgacaa agatggagtg gtcttgttca aaaagtttga cgaaggcaga aacaatttcg 8940

agggtgaggt tacaaaggag aaactgcttg atttcattaa acataaccaa ctacccttag 9000

ttatcgaatt cactgaacaa actgctccta agattttcgg tggagaaatc aaaacacata 9060

tcttgttgtt tttgccaaag tccgtatcgg attatgaagg taaactctcc aatttcaaaa 9120

aggccgctga gagctttaag ggcaagattt tgttcatctt tattgactca gaccacacag 9180

acaatcagag gattttggag tttttcggtt tgaaaaagga ggaatgtcca gcagtccgtt 9240

tgatcacctt ggaggaggag atgaccaaat acaaaccaga gtcggatgag ttgactgccg 9300

agaagataac agaattttgt cacagatttc tggaaggtaa gatcaagcct catcttatgt 9360

ctcaagagtt gcctgatgac tgggataagc aaccagttaa agtattggtg ggtaaaaact 9420

ttgaggaagt ggccttcgac gagaaaaaaa atgtctttgt tgaattctat gctccgtggt 9480

gtggtcactg taagcagctg gcaccaattt gggataaact gggtgaaact tacaaagatc 9540

acgaaaacat tgttattgca aagatggaca gtactgctaa cgaagtggag gctgtgaaag 9600

ttcactcctt ccctacgctg aagttctttc ctgcatctgc tgacagaact gttatcgact 9660

ataatggaga gaggacattg gatggtttta aaaagtttct tgaatccgga ggtcaagacg 9720

gagctggtga cgacgatgat ttggaagatc tggaggaggc tgaggaacct gatcttgagg 9780

aggatgacga ccagaaggca gtcaaagatg aactgtgata aggggtcaag aggatgtcag 9840

aatgccattt gcctgagaga tgcaggcttc atttttgata cttttttatt tgtaacctat 9900

atagtatagg attttttttg tcattttgtt tcttctcgta cgagcttgct cctgatcagc 9960

ctatctcgca gcagatgaat atcttgtggt aggggtttgg gaaaatcatt cgagtttgat 10020

gtttttcttg gtatttccca ctcctcttca gagtacagaa gattaagtga gaccttcgtt 10080

tgtgcggttc tggctctggt tctggctct 10109

<210> 10

<211> 10075

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 10

ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60

aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120

cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180

tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240

tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300

gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360

aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420

cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480

atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540

aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600

cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660

gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720

ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780

tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840

gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900

cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960

attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020

tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080

cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140

gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200

tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260

aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320

gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380

tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440

tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500

gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560

tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620

tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680

gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740

atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800

attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcatcagaat 1860

tggttaattg gttgtaacac tgacccctat ttgtttattt ttctaaatac attcaaatat 1920

gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagaa 1980

tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 2040

tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 2100

acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 2160

cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 2220

ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 2280

ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 2340

atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 2400

cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 2460

tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 2520

gcctgtagcg atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 2580

ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 2640

ctcggccctt ccggctggct ggtttattgc tgataaatcc ggagccggtg agcgtggttc 2700

tcgcggtatc atcgcagcgc tggggccaga tggtaagccc tcccgtatcg tagttatcta 2760

cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 2820

ctcactgatt aagcattggt aactgcagga aaagggtacc actgagcgtc agaccccgta 2880

gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 2940

acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 3000

tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 3060

ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 3120

atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggaccca 3180

agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 3240

cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 3300

agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 3360

acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 3420

gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 3480

ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 3540

gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt ttgtaagtaa 3600

acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta tatatcaggc 3660

atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg atataggtat 3720

gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg caggaggaaa 3780

agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt aaacacatgg 3840

ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga tcattcgagt 3900

ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt tcatctgggt 3960

ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca gatgaggagg 4020

atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac aaagtagacc 4080

tgtcactcaa ttgttgttta tatcattgct atttaaataa tgtatctaaa cgcaaactcc 4140

gagctggaaa aatgttaccg gcgatgcgcg gacaatttag aggcggcgat caagaaacac 4200

ctgctgggcg agcagtctgg agcacagtct tcgatgggcc cgagatccca ccgcgttcct 4260

gggtaccggg acgtgaggca gcgcgacatc catcaaatat accaggcgcc aaccgagtgt 4320

ctcggaaaac agcttctgga tatcttccgc tggcggcgca acgacgaata atagtccctg 4380

gaggtgacgg aatatatatg tgtggagggt aaatctgaca gggtgtagca aaggtaatat 4440

tttcctaaaa catgcaatcg gctgccccgc aacgggaaaa agaatgactt tggcactctt 4500

caccagagtg gggtgtcccg ctcgtgtgtg caaataggct cccactggtc accccggatt 4560

ttgcagaaaa acagcaagtt ccggggtgtc tcactggtgt ccgccaataa gaggagccgg 4620

caggcacgga gtttacatca agctgtctcc gatacactcg actaccatcc gggtctctca 4680

gagaggggaa tggcactata aataccgcct ccttgcgctc tctgccttca tcaatcaaat 4740

catgctgagg actcgaattc gacctctgtt gcctctttgt tggacgaacc attcaccggt 4800

gtcttgtact taaagggcag tggtatcact gaagacttcc agtccctaaa gggtaagaag 4860

atcggttacg ttggtgactt cggtaagatc caaatcgatg aattgaccaa gcactacggt 4920

atgaagccag aagactacac cgccgtcaga tgtggtatga atgtcgccaa gtacatcatc 4980

gaaggtaaga ttgatgccgg tattggtatc gaatgtatgc aacaagtcga attggaagag 5040

tacttggcca agcaaggcag accagcttct gatgctaaaa tgttgagaat tgacaagttg 5100

gcttgcttgg gttgctgttg cttctgtacc gttctttaca tctgcaacga tgaatttttg 5160

aagaagaacc ctgaaaaggt cagaaagttc ttgaaagcca tcaagaaggc aaccgactac 5220

gttctagccg accctgtgaa ggcttggaaa gaatacatcg acttcaagcc tcaattgaac 5280

aacgatctat cctacaagca ataccaaaga tgttacgctt acttctcttc atctttgtac 5340

aatgttcacc gtgactggaa gaaggttacc ggttacggta agagattagc catcttgcca 5400

ccagactatg tctcgaacta cactaatgaa tacttgtcct ggccagaacc agaagaggtt 5460

tctgatcctt tggaagctca aagattgatg gctattcatc aagaaaaatg cagacaggaa 5520

ggtactttca agagattggc tcttccagct taagcggccg cgagtcgtga gtaatcaaga 5580

ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac ttttttattt 5640

gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac gagcttgctc 5700

ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg aaaatcattc 5760

gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag attaagtgag 5820

acgttcgttt gtgctccgga caggtgaacc cacctaacta tttttaactg ggatccagtg 5880

agctcgctgg gtgaaagcca accatctttt gtttcgggga accgtgctcg ccccgtaaag 5940

ttaatttttt tttcccgcgc agctttaatc tttcggcaga gaaggcgttt tcatcgtagc 6000

gtgggaacag aataatcagt tcatgtgcta tacaggcaca tggcagcagt cactattttg 6060

ctttttaacc ttaaagtcgt tcatcaatca ttaactgacc aatcagattt tttgcatttg 6120

ccacttatct aaaaatactt ttgtatctcg cagatacgtt cagtggtttc caggacaaca 6180

cccaaaaaaa ggtatcaatg ccactaggca gtcggtttta tttttggtca cccacgcaaa 6240

gaagcaccca cctcttttag gttttaagtt gtgggaacag taacaccgcc tagagcttca 6300

ggaaaaacca gtacctgtga ccgcaattca ccatgatgca gaatgttaat ttaaacgagt 6360

gccaaatcaa gatttcaaca gacaaatcaa tcgatccata gttacccatt ccagcctttt 6420

cgtcgtcgag cctgcttcat tcctgcctca ggtgcataac tttgcatgaa aagtccagat 6480

tagggcagat tttgagttta aaataggaaa tataaacaaa tataccgcga aaaaggtttg 6540

tttatagctt ttcgcctggt gccgtacggt ataaatacat actctcctcc cccccctggt 6600

tctctttttc ttttgttact tacattttac cgttccgtca ctcgcttcac tcaacaacaa 6660

aaatgagatt cccatctatt ttcaccgctg tcttgttcgc tgcctcctct gcattggctg 6720

cacccgatga ggaagatcat gttttagtat tgcataaagg aaatttcgat gaagctttgg 6780

ccgctcacaa atatctgctc gtcgagtttt acgctccctg gtgcggtcat tgtaaggccc 6840

ttgcaccaga gtacgccaag gcagctggta agttaaaggc cgaaggttca gagatcagat 6900

tagcaaaagt tgatgctaca gaagagtccg atcttgctca acaatacggg gttcgaggat 6960

acccaacaat taagtttttc aaaaatggtg atactgcttc cccaaaggaa tatactgctg 7020

gtagagaggc agacgacata gtcaactggc tcaaaaagag aacgggccca gctgcgtcta 7080

cattaagcga cggagcagca gccgaagctc ttgtggaatc tagtgaagtt gctgtaatcg 7140

gtttctttaa ggacatggaa tctgattcag ctaaacagtt ccttttagca gctgaagcaa 7200

tcgatgacat ccctttcgga atcacctcaa atagtgacgt gttcagcaag taccaacttg 7260

acaaagatgg agtggtcttg ttcaaaaagt ttgacgaagg cagaaacaat ttcgagggtg 7320

aggttacaaa ggagaaactg cttgatttca ttaaacataa ccaactaccc ttagttatcg 7380

aattcactga acaaactgct cctaagattt tcggtggaga aatcaaaaca catatcttgt 7440

tgtttttgcc aaagtccgta tcggattatg aaggtaaact ctccaatttc aaaaaggccg 7500

ctgagagctt taagggcaag attttgttca tctttattga ctcagaccac acagacaatc 7560

agaggatttt ggagtttttc ggtttgaaaa aggaggaatg tccagcagtc cgtttgatca 7620

ccttggagga ggagatgacc aaatacaaac cagagtcgga tgagttgact gccgagaaga 7680

taacagaatt ttgtcacaga tttctggaag gtaagatcaa gcctcatctt atgtctcaag 7740

agttgcctga tgactgggat aagcaaccag ttaaagtatt ggtgggtaaa aactttgagg 7800

aagtggcctt cgacgagaaa aaaaatgtct ttgttgaatt ctatgctccg tggtgtggtc 7860

actgtaagca gctggcacca atttgggata aactgggtga aacttacaaa gatcacgaaa 7920

acattgttat tgcaaagatg gacagtactg ctaacgaagt ggaggctgtg aaagttcact 7980

ccttccctac gctgaagttc tttcctgcat ctgctgacag aactgttatc gactataatg 8040

gagagaggac attggatggt tttaaaaagt ttcttgaatc cggaggtcaa gacggagctg 8100

gtgacgacga tgatttggaa gatctggagg aggctgagga acctgatctt gaggaggatg 8160

acgaccagaa ggcagtcaaa gatgaactgg gttctggctc tggttctggc tctatgattt 8220

ggtatatcct agtcgttggt attttgttgc cacagtcact ggctcaccca ggcttcttca 8280

cttctatagg acagatgact gatttgattc acacagaaaa agacctagtt acaagcctta 8340

aagactatat caaagctgaa gaggataagt tggagcaaat caaaaagtgg gcagagaaac 8400

tcgatagatt gactagtact gcaacaaaag atcctgaggg ttttgtgggt cacccagtga 8460

atgctttcaa gctgatgaag agacttaata cagagtggtc agaattggaa aacttggtac 8520

ttaaagatat gagtgatgga ttcatttcta acttaacaat tcaaagacaa tactttccaa 8580

acgatgagga ccaagtagga gcagcaaaag ctttgttgcg attgcaggac acatacaatt 8640

tggacaccga cacgatatcg aagggtgatt tacctggtgt gaagcataag tccttcctca 8700

ctgtggaaga ttgttttgaa ttgggaaaag tcgcatatac agaagccgac tactatcaca 8760

cagaattatg gatggagcaa gctctgcgtc agttggacga aggtgaagtt tctaccgttg 8820

ataaggtttc agttttggat tacttatcat acgctgttta ccagcaaggt gatctggaca 8880

aagctctact tttaactaaa aagttgttgg agctggaccc ggagcatcaa agagctaacg 8940

gtaatctgaa atactttgaa tacatcatgg ctaaggaaaa ggacgcaaat aagtcctcgt 9000

ccgatgacca atccgatcaa aagaccactc tgaaaaaaaa aggtgcagct gttgactacc 9060

tcccagagag acaaaagtat gaaatgctgt gtagaggaga gggtatcaag atgactccaa 9120

ggagacagaa aaagctgttc tgtagatatc atgatgggaa ccgtaaccca aaattcattc 9180

ttgctccagc gaaacaggaa gatgaatggg acaagcctag aatcattcgt tttcatgaca 9240

tcatctccga tgcagaaata gaggttgtga aagacttggc caaaccaaga ttgagtaggg 9300

ctaccgtcca tgaccctgag actggaaaat tgactaccgc acaatatcgt gtctctaaat 9360

cagcatggtt gtccggttac gagaatcccg tggtcagccg tatcaatatg cgtattcaag 9420

atttgactgg tcttgacgta agcactgctg aggaactaca agttgccaac tatggtgtgg 9480

gcggtcagta tgaaccccac tttgatttcg ccagaaagga cgagcctgat gcttttaagg 9540

agctaggtac tggaaataga atcgcaacgt ggttgttcta tatgtccgat gtgcttgctg 9600

gaggagccac agttttccct gaggtaggtg cttctgtttg gcctaaaaag ggcacggccg 9660

tattttggta caatctgttt gcatctggag aaggtgatta cagcactaga catgctgctt 9720

gtcccgtctt agtcggtaat aagtgggttt ccaataagtg gctgcatgag agaggtcaag 9780

agtttaggag gccatgcaca ttgtcagaat tagaatgata attttacggg aagtctttac 9840

agttttagtt aggagccctt atatatgaca gtaatgctag tacgttttgt tttgtttaat 9900

taataactta gtttatgtta gcctagtata gactccatca attttttttg ttattacgta 9960

agccgcgatg ataatatctg atgaaaaatt cctatcagaa aataatttat caaaagtttc 10020

atgcgatatg agactaagta gaatagggac tcccaaagtg tcagtcacaa gggtc 10075

<210> 11

<211> 8413

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 11

ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60

aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120

cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180

tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240

tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300

gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360

aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420

cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480

atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540

aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600

cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660

gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720

ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780

tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840

gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900

cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960

attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020

tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080

cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140

gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200

tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260

aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320

gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380

tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440

tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500

gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560

tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620

tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680

gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740

atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800

attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcattaccaa 1860

tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 1920

tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagcgct 1980

gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat aaaccagcca 2040

gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 2100

aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 2160

gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 2220

ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 2280

tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 2340

atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 2400

ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 2460

ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 2520

ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 2580

atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 2640

gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 2700

tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca gggttattgt 2760

ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt 2820

acaaccaatt aaccaattct gaaaggaaga atctgcagga aaagggtacc actgagcgtc 2880

agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 2940

ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 3000

accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct 3060

tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 3120

cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 3180

gttggaccca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 3240

gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 3300

gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 3360

cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 3420

tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 3480

ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 3540

ctggcctttt gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt 3600

ttgtaagtaa acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta 3660

tatatcaggc atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg 3720

atataggtat gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg 3780

caggaggaaa agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt 3840

aaacacatgg ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga 3900

tcattcgagt ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt 3960

tcatctgggt ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca 4020

gatgaggagg atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac 4080

aaagtagacc tgtcactcaa ttgttgttta tatcattgct atttaaatca ggtgaaccca 4140

cctaactatt tttaactggc atccagtgag ctcgctgggt gaaagccaac catcttttgt 4200

ttcggggaac cgtgctcgcc ccgtaaagtt aatttttttt tcccgcgcag ctttaatctt 4260

tcggcagaga aggcgttttc atcgtagcgt gggaacagaa taatcagttc atgtgctata 4320

caggcacatg gcagcagtca ctattttgct ttttaacctt aaagtcgttc atcaatcatt 4380

aactgaccaa tcagattttt tgcatttgcc acttatctaa aaatactttt gtatctcgca 4440

gatacgttca gtggtttcca ggacaacacc caaaaaaagg tatcaatgcc actaggcagt 4500

cggttttatt tttggtcacc cacgcaaaga agcacccacc tcttttaggt tttaagttgt 4560

gggaacagta acaccgccta gagcttcagg aaaaaccagt acctgtgacc gcaattcacc 4620

atgatgcaga atgttaattt aaacgagtgc caaatcaaga tttcaacaga caaatcaatc 4680

gatccatagt tacccattcc agccttttcg tcgtcgagcc tgcttcattc ctgcctcagg 4740

tgcataactt tgcatgaaaa gtccagatta gggcagattt tgagtttaaa ataggaaata 4800

taaacaaata taccgcgaaa aaggtttgtt tatagctttt cgcctggtgc cgtacggtat 4860

aaatacatac tctcctcccc cccctggttc tctttttctt ttgttactta cattttaccg 4920

ttccgtcact cgcttcactc aacaacaaaa atgttctctc caattttgtc cttggaaatt 4980

attttagctt tggctacttt gcaatctgtc ttcgctcacc caggcttctt cacttctata 5040

ggacagatga ctgatttgat tcacacagaa aaagacctag ttacaagcct taaagactat 5100

atcaaagctg aagaggataa gttggagcaa atcaaaaagt gggcagagaa actcgataga 5160

ttgactagta ctgcaacaaa agatcctgag ggttttgtgg gtcacccagt gaatgctttc 5220

aagctgatga agagacttaa tacagagtgg tcagaattgg aaaacttggt acttaaagat 5280

atgagtgatg gattcatttc taacttaaca attcaaagac aatactttcc aaacgatgag 5340

gaccaagtag gagcagcaaa agctttgttg cgattgcagg acacatacaa tttggacacc 5400

gacacgatat cgaagggtga tttacctggt gtgaagcata agtccttcct cactgtggaa 5460

gattgttttg aattgggaaa agtcgcatat acagaagccg actactatca cacagaatta 5520

tggatggagc aagctctgcg tcagttggac gaaggtgaag tttctaccgt tgataaggtt 5580

tcagttttgg attacttatc atacgctgtt taccagcaag gtgatctgga caaagctcta 5640

cttttaacta aaaagttgtt ggagctggac ccggagcatc aaagagctaa cggtaatctg 5700

aaatactttg aatacatcat ggctaaggaa aaggacgcaa ataagtcctc gtccgatgac 5760

caatccgatc aaaagaccac tctgaaaaaa aaaggtgcag ctgttgacta cctcccagag 5820

agacaaaagt atgaaatgct gtgtagagga gagggtatca agatgactcc aaggagacag 5880

aaaaagctgt tctgtagata tcatgatggg aaccgtaacc caaaattcat tcttgctcca 5940

gcgaaacagg aagatgaatg ggacaagcct agaatcattc gttttcatga catcatctcc 6000

gatgcagaaa tagaggttgt gaaagacttg gccaaaccaa gattgagtag ggctaccgtc 6060

catgaccctg agactggaaa attgactacc gcacaatatc gtgtctctaa atcagcatgg 6120

ttgtccggtt acgagaatcc cgtggtcagc cgtatcaata tgcgtattca agatttgact 6180

ggtcttgacg taagcactgc tgaggaacta caagttgcca actatggtgt gggcggtcag 6240

tatgaacccc actttgattt cgccagaaag gacgagcctg atgcttttaa ggagctaggt 6300

actggaaata gaatcgcaac gtggttgttc tatatgtccg atgtgcttgc tggaggagcc 6360

acagttttcc ctgaggtagg tgcttctgtt tggcctaaaa agggcacggc cgtattttgg 6420

tacaatctgt ttgcatctgg agaaggtgat tacagcacta gacatgctgc ttgtcccgtc 6480

ttagtcggta ataagtgggt ttccaataag tggctgcatg agagaggtca agagtttagg 6540

aggccatgca cattgtcaga attagaaggt tctggctctg gttctggctc tatgagattc 6600

ccatctattt tcaccgctgt cttgttcgct gcctcctctg cattggctgc acccgatgag 6660

gaagatcatg ttttagtatt gcataaagga aatttcgatg aagctttggc cgctcacaaa 6720

tatctgctcg tcgagtttta cgctccctgg tgcggtcatt gtaaggccct tgcaccagag 6780

tacgccaagg cagctggtaa gttaaaggcc gaaggttcag agatcagatt agcaaaagtt 6840

gatgctacag aagagtccga tcttgctcaa caatacgggg ttcgaggata cccaacaatt 6900

aagtttttca aaaatggtga tactgcttcc ccaaaggaat atactgctgg tagagaggca 6960

gacgacatag tcaactggct caaaaagaga acgggcccag ctgcgtctac attaagcgac 7020

ggagcagcag ccgaagctct tgtggaatct agtgaagttg ctgtaatcgg tttctttaag 7080

gacatggaat ctgattcagc taaacagttc cttttagcag ctgaagcaat cgatgacatc 7140

cctttcggaa tcacctcaaa tagtgacgtg ttcagcaagt accaacttga caaagatgga 7200

gtggtcttgt tcaaaaagtt tgacgaaggc agaaacaatt tcgagggtga ggttacaaag 7260

gagaaactgc ttgatttcat taaacataac caactaccct tagttatcga attcactgaa 7320

caaactgctc ctaagatttt cggtggagaa atcaaaacac atatcttgtt gtttttgcca 7380

aagtccgtat cggattatga aggtaaactc tccaatttca aaaaggccgc tgagagcttt 7440

aagggcaaga ttttgttcat ctttattgac tcagaccaca cagacaatca gaggattttg 7500

gagtttttcg gtttgaaaaa ggaggaatgt ccagcagtcc gtttgatcac cttggaggag 7560

gagatgacca aatacaaacc agagtcggat gagttgactg ccgagaagat aacagaattt 7620

tgtcacagat ttctggaagg taagatcaag cctcatctta tgtctcaaga gttgcctgat 7680

gactgggata agcaaccagt taaagtattg gtgggtaaaa actttgagga agtggccttc 7740

gacgagaaaa aaaatgtctt tgttgaattc tatgctccgt ggtgtggtca ctgtaagcag 7800

ctggcaccaa tttgggataa actgggtgaa acttacaaag atcacgaaaa cattgttatt 7860

gcaaagatgg acagtactgc taacgaagtg gaggctgtga aagttcactc cttccctacg 7920

ctgaagttct ttcctgcatc tgctgacaga actgttatcg actataatgg agagaggaca 7980

ttggatggtt ttaaaaagtt tcttgaatcc ggaggtcaag acggagctgg tgacgacgat 8040

gatttggaag atctggagga ggctgaggaa cctgatcttg aggaggatga cgaccagaag 8100

gcagtcaaag atgaactgtg ataagggggg ccgcgagtcg tgagtaatca agaggatgtc 8160

agaatgccat ttgcctgaga gatgcaggct tcatttttga tactttttta tttgtaacct 8220

atatagtata ggattttttt tgtcattttg tttcttctcg tacgagcttg ctcctgatca 8280

gcctatctcg cagctgatga atatcttgtg gtaggggttt gggaaaatca ttcgagtttg 8340

atgtttttct tggtatttcc cactcctctt cagagtacag aagattaagt gagacgttcg 8400

tttgtgctcc gga 8413

<210> 12

<211> 714

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 12

gtttcttgaa tccggaggtc aagacggagc tggtgacgac gatgatttgg aagatctgga 60

ggaggctgag gaacctgatc ttgaggagga tgacgaccag aaggcagtca aagatgaact 120

gcatcatcat catcatcatt gataaggggt caagaggatg tcagaatgcc atttgcctga 180

gagatgcagg cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt 240

tttgtcattt tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagcagat 300

gaatatcttg tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt 360

cccactcctc ttcagagtac agaagattaa gtgagacctt cgtttgtgcg gttctggctc 420

tggttctggc tctggatcct tcagtaatgt cttgtttctt ttgttgcagt ggtgagccat 480

tttgacttcg tgaaagtttc tttagaatag ttgtttccag aggccaaaca ttccacccgt 540

agtaaagtgc aagcgtagga agaccaagac tggcataaat caggtataag tgtcgagcac 600

tggcaggtga tcttctgaaa gtttctacta gcagataaga tccagtagtc atgcatatgg 660

caacaatgta ccgtgtggat ctaagaacgc gtcctactaa ccttcgcatt cgtt 714

<210> 13

<211> 7605

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 13

tgcaggtacc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 60

ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 120

tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 180

cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 240

gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 300

gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 360

tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 420

ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 480

gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 540

ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 600

tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 660

ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc ggtacccaga 720

tccaattccc gctttgactg cctgaaatct ccatcgccta caatgatgac atttggattt 780

ggttgactca tgttggtatt gtgaaataga cgcagatcgg gaacactgaa aaatacacag 840

ttattattca tttcagaagc gatagagaga ctgcgctaag cattaatgag attatttttg 900

agcattcgtc aatcaatacc aaacaagaca aacggtatgc cgacttttgg aagtttcttt 960

ttgaccaact ggccgttagc atttcaacga accaaactta gttcatcttg gatgagatca 1020

cgcttttgtc atattaggtt ccaagacagc gtttaaactg tcagttttgg gccatttggg 1080

gaacatgaaa ctatttgacc ccacactcag aaagccctca tctggagtga tgttcgggtg 1140

taatgcggag cttgttgcat tcggaaataa acaaacatga acctcgccag gggggccagg 1200

atagacaggc taataaagtc atggtgttag tagcctaata gaaggaattg gaataaatga 1260

cccttgtgac tgacactttg ggagtcccta ttctacttag tctcatatcg catgaaactt 1320

ttgataaatt attttctgat aggaattttt catcagatat tatcatcgcg gcttacgtaa 1380

taacaaaaaa aattgatgga gtctatacta ggctaacata aactaagtta ttaattaaac 1440

aaaacaaaac gtactagcat tactgtcata tataagggct cctaactaaa actgtaaaga 1500

cttcccgtaa aattatcatt ctaattctga caatgtgcat ggcctcctaa actcttgacc 1560

tctctcatgc agccacttat tggaaaccca cttattaccg actaagacgg gacaagcagc 1620

atgtctagtg ctgtaatcac cttctccaga tgcaaacaga ttgtaccaaa atacggccgt 1680

gcccttttta ggccaaacag aagcacctac ctcagggaaa actgtggctc ctccagcaag 1740

cacatcggac atatagaaca accacgttgc gattctattt ccagtaccta gctccttaaa 1800

agcatcaggc tcgtcctttc tggcgaaatc aaagtggggt tcatactgac cgcccacacc 1860

atagttggca acttgtagtt cctcagcagt gcttacgtca agaccagtca aatcttgaat 1920

acgcatattg atacggctga ccacgggatt ctcgtaaccg gacaaccatg ctgatttaga 1980

gacacgatat tgtgcggtag tcaattttcc agtctcaggg tcatggacgg tagccctact 2040

caatcttggt ttggccaagt ctttcacaac ctctatttct gcatcggaga tgatgtcatg 2100

aaaacgaatg attctaggct tgtcccattc atcttcctgt ttcgctggag caagaatgaa 2160

ttttgggtta cggttcccat catgatatct acagaacagc tttttctgtc tccttggagt 2220

catcttgata ccctctcctc tacacagcat ttcatacttt tgtctctctg ggaggtagtc 2280

aacagctgca cctttttttt tcagagtggt cttttgatcg gattggtcat cggacgagga 2340

cttatttgcg tccttttcct tagccatgat gtattcaaag tatttcagat taccgttagc 2400

tctttgatgc tccgggtcca gctccaacaa ctttttagtt aaaagtagag ctttgtccag 2460

atcaccttgc tggtaaacag cgtatgataa gtaatccaaa actgaaacct tatcaacggt 2520

agaaacttca ccttcgtcca actgacgcag agcttgctcc atccataatt ctgtgtgata 2580

gtagtcggct tctgtatatg cgacttttcc caattcaaaa caatcttcca cagtgaggaa 2640

ggacttatgc ttcacaccag gtaaatcacc cttcgatatc gtgtcggtgt ccaaattgta 2700

tgtgtcctgc aatcgcaaca aagcttttgc tgctcctact tggtcctcat cgtttggaaa 2760

gtattgtctt tgaattgtta agttagaaat gaatccatca ctcatatctt taagtaccaa 2820

gttttccaat tctgaccact ctgtattaag tctcttcatc agcttgaaag cattcactgg 2880

gtgacccaca aaaccctcag gatcttttgt tgcagtacta gtcaatctat cgagtttctc 2940

tgcccacttt ttgatttgct ccaacttatc ctcttcagct ttgatatagt ctttaaggct 3000

tgtaactagg tctttttctg tgtgaatcaa atcagtcatc tgtcctatag aagtgaagaa 3060

gcctgggtga gccagtgact gtggcaacaa aataccaacg actaggatat accaaatcat 3120

gcggcctgtt gtagttttaa tatagtttga gtatgagatg gaactcagaa cgaaggaatt 3180

atcaccagtt tatatattct gaggaaaggg tgtgtcctaa attggacagt cacgatggca 3240

ataaacgctc agccaatcag aatgcaggag ccataaattg ttgtattatt gctgcaagat 3300

ttatgtgggt tcacattcca ctgaatggtt ttcactgtag aattggtgtc ctagttgtta 3360

tgtttcgaga tgttttcaag aaaaactaaa atgcacaaac tgaccaataa tgtgccgtcg 3420

cgcttggtac aaacgtcagg attgccacca cttttttcgc actctggtac aaaagttcgc 3480

acttcccact cgtatgtaac gaaaaacaga gcagtctatc cagaacgaga caaattagcg 3540

cgtactgtcc cattccataa ggtatcatag gaaacgagag tcctcccccc atcacgtata 3600

tataaacaca ctgatatccc acatccgctt gtcaccaaac taatacatcc agttcaagtt 3660

acctaaacaa atcaaagcat gagattccca tctattttca ccgctgtctt gttcgctgcc 3720

tcctctgcat tggctgcacc cgatgaggaa gatcatgttt tagtattgca taaaggaaat 3780

ttcgatgaag ctttggccgc tcacaaatat ctgctcgtcg agttttacgc tccctggtgc 3840

ggtcattgta aggcccttgc accagagtac gccaaggcag ctggtaagtt aaaggccgaa 3900

ggttcagaga tcagattagc aaaagttgat gctacagaag agtccgatct tgctcaacaa 3960

tacggggttc gaggataccc aacaattaag tttttcaaaa atggtgatac tgcttcccca 4020

aaggaatata ctgctggtag agaggcagac gacatagtca actggctcaa aaagagaacg 4080

ggcccagctg cgtctacatt aagcgacgga gcagcagccg aagctcttgt ggaatctagt 4140

gaagttgctg taatcggttt ctttaaggac atggaatctg attcagctaa acagttcctt 4200

ttagcagctg aagcaatcga tgacatccct ttcggaatca cctcaaatag tgacgtgttc 4260

agcaagtacc aacttgacaa agatggagtg gtcttgttca aaaagtttga cgaaggcaga 4320

aacaatttcg agggtgaggt tacaaaggag aaactgcttg atttcattaa acataaccaa 4380

ctacccttag ttatcgaatt cactgaacaa actgctccta agattttcgg tggagaaatc 4440

aaaacacata tcttgttgtt tttgccaaag tccgtatcgg attatgaagg taaactctcc 4500

aatttcaaaa aggccgctga gagctttaag ggcaagattt tgttcatctt tattgactca 4560

gaccacacag acaatcagag gattttggag tttttcggtt tgaaaaagga ggaatgtcca 4620

gcagtccgtt tgatcacctt ggaggaggag atgaccaaat acaaaccaga gtcggatgag 4680

ttgactgccg agaagataac agaattttgt cacagatttc tggaaggtaa gatcaagcct 4740

catcttatgt ctcaagagtt gcctgatgac tgggataagc aaccagttaa agtattggtg 4800

ggtaaaaact ttgaggaagt ggccttcgac gagaaaaaaa atgtctttgt tgaattctat 4860

gctccgtggt gtggtcactg taagcagctg gcaccaattt gggataaact gggtgaaact 4920

tacaaagatc acgaaaacat tgttattgca aagatggaca gtactgctaa cgaagtggag 4980

gctgtgaaag ttcactcctt ccctacgctg aagttctttc ctgcatctgc tgacagaact 5040

gttatcgact ataatggaga gaggacattg gatggtttta aaaagtttct tgaatccgga 5100

ggtcaagacg gagctggtga cgacgatgat ttggaagatc tggaggaggc tgaggaacct 5160

gatcttgagg aggatgacga ccagaaggca gtcaaagatg aactgtgata aggggtcaag 5220

aggatgtcag aatgccattt gcctgagaga tgcaggcttc atttttgata cttttttatt 5280

tgtaacctat atagtatagg attttttttg tcattttgtt tcttctcgta cgagcttgct 5340

cctgatcagc ctatctcgca gcagatgaat atcttgtggt aggggtttgg gaaaatcatt 5400

cgagtttgat gtttttcttg gtatttccca ctcctcttca gagtacagaa gattaagtga 5460

gaccttcgtt tgtgcggatc cttcagtaat gtcttgtttc ttttgttgca gtggtgagcc 5520

attttgactt cgtgaaagtt tctttagaat agttgtttcc agaggccaaa cattccaccc 5580

gtagtaaagt gcaagcgtag gaagaccaag actggcataa atcaggtata agtgtcgagc 5640

actggcaggt gatcttctga aagtttctac tagcagataa gatccagtag tcatgcatat 5700

ggcaacaatg taccgtgtgg atctaagaac gcgtcctact aaccttcgca ttcgttggtc 5760

cagtttgttg ttatcgatca acgtgacaag gttgtcgatt ccgcgtaagc atgcataccc 5820

aaggacgcct gttgcaattc caagtgagcc agttccaaca atctttgtaa tattagagca 5880

cttcattgtg ttgcgcttga aagtaaaatg cgaacaaatt aagagataat ctcgaaaccg 5940

cgacttcaaa cgccaatatg atgtgcggca cacaataagc gttcatatcc gctgggtgac 6000

tttctcgctt taaaaaatta tccgaaaaaa ttttctagag tgttgacact ttatacttcc 6060

ggctcgtata atacgacaag gtgtaaggag gactaaacca tgggtaaaaa gcctgaactc 6120

accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg 6180

cagctctcgg agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat 6240

gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac 6300

tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc 6360

ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc 6420

gaactgcccg ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat 6480

cttagccaga cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca 6540

tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg 6600

gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag 6660

gactgccccg aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg 6720

gacaatggcc gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa 6780

tacgaggtcg ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg 6840

cgctacttcg agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg 6900

ctccgcattg gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca 6960

gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt 7020

acacaaatcg cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc 7080

gatagtggaa accgacgccc cagcactcgt ccgagggcaa aggaataaca attgacacct 7140

tacgattatt tagagagtat ttattagttt tattgtatgt atacggatgt tttattatct 7200

atttatgccc ttatattctg taactatcca aaagtcctat cttatcaagc cagcaatcta 7260

tgtccgcgaa cgtcaactaa aaataagctt tttatgctct tctctctttt tttcccttcg 7320

gtataattat accttgcatc cacagattct cctgccaaat tttgcataat cctttacaac 7380

atggctatat gggagcactt agcgccctcc aaaacccata ttgcctacgc atgtataggt 7440

gttttttcca caatattttc tctgtgctct ctttttatta aagagaagct ctatatcgga 7500

gaagcttctg tggccgttat attcggcctt atcgtgggac cacattgcct gaattggttt 7560

gccccggaag attggggaaa cttggatctg attaccttag ctgca 7605

<210> 14

<211> 7377

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 14

ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60

aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120

cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180

tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240

tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300

gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360

aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420

cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480

atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540

aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600

acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660

gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720

ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780

gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840

gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900

gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960

ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020

ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080

cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140

acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200

taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260

tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320

acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380

gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440

gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500

accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560

gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620

caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680

tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740

ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800

tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860

gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920

tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980

gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040

gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100

ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160

ggccttttgc tcacatgttt cagaagcgat agagagactg cgctaagcat taatgagatt 2220

atttttgagc attcgtcaat caataccaaa caagacaaac ggtatgccga cttttggaag 2280

tttctttttg accaactggc cgttagcatt tcaacgaacc aaacttagtt catcttggat 2340

gagatcacgc ttttgtcata ttaggttcca agacagcgtt taaactgtca gttttgggcc 2400

atttggggaa catgaaacta tttgacccca cactcagaaa gccctcatct ggagtgatgt 2460

tcgggtgtaa tgcggagctt gttgcattcg gaaataaaca aacatgaacc tcgccagggg 2520

ggccaggata gacaggctaa taaagtcatg gtgttagtag cctaatagaa ggaattggaa 2580

ataatgtatc taaacgcaaa ctccgagctg gaaaaatgtt accggcgatg cgcggacaat 2640

ttagaggcgg cgatcaagaa acacctgctg ggcgagcagt ctggagcaca gtcttcgatg 2700

ggcccgagat cccaccgcgt tcctgggtac cgggacgtga ggcagcgcga catccatcaa 2760

atataccagg cgccaaccga gtctctcgga aaacagcttc tggatatctt ccgctggcgg 2820

cgcaacgacg aataatagtc cctggaggtg acggaatata tatgtgtgga gggtaaatct 2880

gacagggtgt agcaaaggta atattttcct aaaacatgca atcggctgcc ccgcaacggg 2940

aaaaagaatg actttggcac tcttcaccag agtggggtgt cccgctcgtg tgtgcaaata 3000

ggctcccact ggtcaccccg gattttgcag aaaaacagca agttccgggg tgtctcactg 3060

gtgtccgcca ataagaggag ccggcaggca cggagtctac atcaagctgt ctccgataca 3120

ctcgactacc atccgggtct ctcagagagg ggaatggcac tataaatacc gcctccttgc 3180

gctctctgcc ttcatcaatc aaatcatgtt ctctccaatt ttgtccttgg aaattatttt 3240

agctttggct actttgcaat ctgtcttcgc tcaacaggaa gcagtagatg gtggttgctc 3300

acatttaggt caatcttacg cagatagaga tgtatggaaa cctgaaccat gtcaaatttg 3360

cgtgtgtgac tcaggttcag tgctctgcga cgatatcata tgtgacgacc aggaattgga 3420

ctgtccaaac ccagagatac cattcggtga atgttgtgct gtttgtccac agccaccaac 3480

tgctcctaca agacctccaa acggtcaagg tccacaaggt cctaaaggtg atccgggtcc 3540

acctggtatt cctggtagaa atggtgaccc tggacctccc ggttccccag gtagcccagg 3600

atcacctggg cctcctggaa tatgtgaatc ctgcccaact ggtggtcaga actatagccc 3660

acaatacgag gcctacgacg tcaaatctgg tgttgctgga ggaggtattg caggctaccc 3720

tggtcccgca gggcccccag gtccgccggg tccgcccgga acatcaggtc atcccggagc 3780

ccctggtgca ccaggttatc agggaccgcc cggagagcct ggacaagctg gtcccgctgg 3840

accccctggt ccaccaggtg ctattggacc aagtggtcct gccggaaaag acggtgaatc 3900

cggtagacct ggtagacccg gcgaaagggg tttcccaggt cctcccggaa tgaagggtcc 3960

agccggtatg cccggttttc ctgggatgaa gggtcacaga ggatttgatg gtagaaacgg 4020

agagaaaggc gaaaccggtg ctcccggact gaagggtgaa aacggtgtcc ctggtgagaa 4080

cggcgctcct ggacctatgg gtccacgtgg tgctccagga gaaagaggca gaccaggatt 4140

gcctggtgca gctggtgcta gaggtaacga tggtgcccgt ggttccgatg gacaacccgg 4200

gccacccggc cctccaggta ccgctggatt tcctggaagc cctggtgcta agggggaggt 4260

tggtccggct ggtagtcccg gaagtagcgg tgccccaggt caaagaggcg aaccaggccc 4320

tcagggtcac gcaggagcac ctggaccgcc tggtcctcct ggttcgaatg gttcgcctgg 4380

aggaaaaggt gaaatggggc ccgcaggaat ccccggtgcg cctggtctta ttggtgccag 4440

gggtcctcca ggcccgccag gtacaaatgg tgtacccgga cagcgaggag cagctggtga 4500

acctggtaaa aacggtgcca aaggagatcc aggtcctcgt ggagagcgtg gtgaagctgg 4560

ctctcccggt atcgccggtc caaaaggtga ggacggtaag gacggttccc ctggtgagcc 4620

aggtgcgaac ggactgccag gtgcagccgg agagcgagga gtcccaggat tcaggggacc 4680

agccggtgct aacggcttgc ctggtgaaaa agggccccct ggtgataggg gaggacccgg 4740

tccagcaggc cctcgtggag ttgctggtga gcctggacgt gacggtttac caggagggcc 4800

aggtttgagg ggtattcccg ggtcccctgg cggtcctgga tcggatggaa aaccagggcc 4860

accaggttcg cagggtgaaa caggacgtcc aggcccaccc ggctcacctg gtccaagggg 4920

tcagcctggt gtcatgggtt tccccggtcc aaagggtaat gacggagcac cgggtaaaaa 4980

tggtgaacgt ggtggcccag gtggtccagg accccaaggt ccagctggaa aaaacggtga 5040

gacaggtcct caaggacctc caggacctac cggtcctagc ggagataagg gagatacggg 5100

accgccagga cctcaaggat tgcaaggttt gcctggtaca tctggccctc ccggagaaaa 5160

tggtaagcct ggagagccag gaccaaaagg cgaagctgga gccccaggta tccccggagg 5220

taagggagac tcaggtgctc cgggtgagcg tggtcctccg ggtgccggtg gtccacctgg 5280

acctagaggt ggtgccgggc cgccaggtcc tgaaggtggt aaaggtgctg ctggtccacc 5340

gggaccgcct ggctctgctg gtactcctgg cttgcaggga atgccaggag agagaggtgg 5400

acctggaggt cccggtccga agggtgataa aggggagcca ggatcatccg gtgttgacgg 5460

cgcacctggt aaagacggac caaggggacc aacgggtcca atcggaccac caggacccgc 5520

tggccagcca ggagataaag gcgagtccgg agcacccggt gttcctggta tagctggacc 5580

caggggtggt cccggtgaaa gaggtgaaca gggcccaccg ggtcccgccg gtttccctgg 5640

cgcccctggt caaaatggag aaccaggtgc aaagggcgag agaggagccc caggagaaaa 5700

gggtgaggga ggaccacccg gtgctgccgg tccagctggg ggttcaggtc ctgctggacc 5760

accaggtcca cagggcgtta aaggtgagag aggaagtcca ggtggtcctg gagctgctgg 5820

attcccaggt ggccgtggac ctcctggtcc ccctggatcg aatggtaatc ctggtccgcc 5880

aggtagttcg ggtgctcctg ggaaggacgg tccacctggc cccccaggta gtaacggtgc 5940

acctggtagt ccaggtatat ccggacctaa aggagattcc ggtccaccag gcgaaagagg 6000

ggccccaggc ccacagggtc caccaggagc ccccggtcct ctgggtattg ctggtcttac 6060

tggtgcacgt ggactggccg gtccacccgg aatgcctgga gcaagaggtt cacctggacc 6120

acaaggtatt aaaggagaga acggtaaacc tggaccttcc ggtcaaaacg gagagcgggg 6180

acccccaggc ccccaaggtc tgccaggact agctggtacc gcaggggaac caggaagaga 6240

tggaaatcca ggttcagacg gactacccgg tagagatggt gcaccggggg ccaagggcga 6300

caggggtgag aatggatctc ctggtgcgcc aggggcacca ggccacccag gtcccccagg 6360

tcctgtgggc cctgctggaa agtcaggtga caggggagag acaggcccgg ctggtccatc 6420

tggcgcaccc ggaccagctg gttccagagg cccacctggt ccgcaaggcc ctagaggtga 6480

caagggagag actggagaac gaggtgctat gggtatcaag ggtcatagag gttttccggg 6540

taatcccggc gccccaggtt ctcctggtcc agctggccat caaggtgcag tcggatcgcc 6600

cggcccagcc ggtcccaggg gccctgttgg tccatccggt cctccaggaa aggatggtgc 6660

ttctggacac ccaggaccta tcggacctcc gggtcctaga ggtaatagag gagaacgtgg 6720

atccgagggt agtcctggtc accctggtca acctggccca ccagggcctc caggtgcacc 6780

cggtccatgt tgtggtgcag gcggtgtggc tgcaattgct ggtgtgggtg ctgaaaaggc 6840

cggcggtttc gctccatatt atggtgatgg ttacattcct gaagctccta gagacggaca 6900

agcatacgtt agaaaggacg gtgagtgggt gttgctgtcc accttcttag gttctggttc 6960

tggttctgat tacaaggatg acgacgataa gggatcgtgt tgcccgggct gctgtggcaa 7020

accaatacct aaccctttac tgggccttga cagtacgtat ccgtatgatg tgccggatta 7080

tgcgcatcac catcatcacc atagatctta atcaagagga tgtcagaatg ccatttgcct 7140

gagagatgca ggcttcattt ttgatacttt tttatttgta acctatatag tataggattt 7200

tttttgtcat tttgtttctt ctcgtacgag cttgctcctg atcagcctat ctcgcagctg 7260

atgaatatct tgtggtaggg gtttgggaaa atcattcgag tttgatgttt ttcttggtat 7320

ttcccactcc tcttcagagt acagaagatt aagtgagacg ttcgtttgtg ctccgga 7377

<210> 15

<211> 951

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 15

atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60

cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120

tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180

aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240

tctctcgaga aaagagaggc cgaagctgtg ctgtcaaagt cctgtgtcag tcactttaga 300

aatgttggat ccttgaatag tagggatgtc aatctgaaag atgacttttc ctatgctaat 360

attgatgatc cctataacaa gcctttcgtc ctaaataacc taataaaccc taccaagtgt 420

caagagatca tgcaatttgc caatggcaag ttgtttgact cccaagtcct gagtggcacg 480

gacaagaaca tacgtaactc tcaacaaatg tggatatcca agaacaaccc tatggtaaaa 540

cccattttcg agaacatatg caggcagttt aacgtaccct ttgataatgc cgaggaccta 600

caggtcgtcc gttacttgcc taatcaatat tataatgagc atcatgactc atgctgtgac 660

tcctccaagc aatgcagtga atttatagag aggggcggtc agaggattct gaccgtttta 720

atttacctaa acaacgagtt ctcagatgga cacacgtact ttcctaattt aaaccaaaag 780

ttcaagccca agactggtga tgctttggtt ttttaccctt tagccaacaa ctctaataaa 840

tgtcacccat acagtctaca cgcaggtatg cccgtcacgt caggagagaa gtggattgct 900

aatctgtggt ttcgtgagcg taagttctcc caccaccacc accaccacta a 951

<210> 16

<211> 316

<212> PRT

<213> 人工序列

<220>

<223> 合成肽

<400> 16

Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser

1 5 10 15

Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln

20 25 30

Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe

35 40 45

Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu

50 55 60

Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val

65 70 75 80

Ser Leu Glu Lys Arg Glu Ala Glu Ala Val Leu Ser Lys Ser Cys Val

85 90 95

Ser His Phe Arg Asn Val Gly Ser Leu Asn Ser Arg Asp Val Asn Leu

100 105 110

Lys Asp Asp Phe Ser Tyr Ala Asn Ile Asp Asp Pro Tyr Asn Lys Pro

115 120 125

Phe Val Leu Asn Asn Leu Ile Asn Pro Thr Lys Cys Gln Glu Ile Met

130 135 140

Gln Phe Ala Asn Gly Lys Leu Phe Asp Ser Gln Val Leu Ser Gly Thr

145 150 155 160

Asp Lys Asn Ile Arg Asn Ser Gln Gln Met Trp Ile Ser Lys Asn Asn

165 170 175

Pro Met Val Lys Pro Ile Phe Glu Asn Ile Cys Arg Gln Phe Asn Val

180 185 190

Pro Phe Asp Asn Ala Glu Asp Leu Gln Val Val Arg Tyr Leu Pro Asn

195 200 205

Gln Tyr Tyr Asn Glu His His Asp Ser Cys Cys Asp Ser Ser Lys Gln

210 215 220

Cys Ser Glu Phe Ile Glu Arg Gly Gly Gln Arg Ile Leu Thr Val Leu

225 230 235 240

Ile Tyr Leu Asn Asn Glu Phe Ser Asp Gly His Thr Tyr Phe Pro Asn

245 250 255

Leu Asn Gln Lys Phe Lys Pro Lys Thr Gly Asp Ala Leu Val Phe Tyr

260 265 270

Pro Leu Ala Asn Asn Ser Asn Lys Cys His Pro Tyr Ser Leu His Ala

275 280 285

Gly Met Pro Val Thr Ser Gly Glu Lys Trp Ile Ala Asn Leu Trp Phe

290 295 300

Arg Glu Arg Lys Phe Ser His His His His His His

305 310 315

<210> 17

<211> 4029

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 17

ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60

aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120

cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180

tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240

tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300

gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360

aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420

cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480

atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540

aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600

acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660

gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720

ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780

gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840

gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900

gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960

ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020

ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080

cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140

acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200

taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260

tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320

acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380

gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440

gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500

accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560

gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620

caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680

tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740

ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800

tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860

gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920

tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980

gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040

gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100

ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160

ggccttttgc tcacatgtat ttaaataatg tatctaaacg caaactccga gctggaaaaa 2220

tgttaccggc gatgcgcgga caatttagag gcggcgatca agaaacacct gctgggcgag 2280

cagtctggag cacagtcttc gatgggcccg agatcccacc gcgttcctgg gtaccgggac 2340

gtgaggcagc gcgacatcca tcaaatatac caggcgccaa ccgagtgtct cggaaaacag 2400

cttctggata tcttccgctg gcggcgcaac gacgaataat agtccctgga ggtgacggaa 2460

tatatatgtg tggagggtaa atctgacagg gtgtagcaaa ggtaatattt tcctaaaaca 2520

tgcaatcggc tgccccgcaa cgggaaaaag aatgactttg gcactcttca ccagagtggg 2580

gtgtcccgct cgtgtgtgca aataggctcc cactggtcac cccggatttt gcagaaaaac 2640

agcaagttcc ggggtgtctc actggtgtcc gccaataaga ggagccggca ggcacggagt 2700

ttacatcaag ctgtctccga tacactcgac taccatccgg gtctctcaga gaggggaatg 2760

gcactataaa taccgcctcc ttgcgctctc tgccttcatc aatcaaatca tgagattccc 2820

atctattttc accgctgtct tgttcgctgc ctcctctgca ttggctgccc ctgttaacac 2880

taccactgaa gacgagactg ctcaaattcc agctgaagca gttatcggtt actctgacct 2940

tgagggtgat ttcgacgtcg ctgttttgcc tttctctaac tccactaaca acggtttgtt 3000

gttcattaac accactatcg cttccattgc tgctaaggaa gagggtgtct ctctcgagaa 3060

aagagaggcc gaagctgtgc tgtcaaagtc ctgtgtcagt cactttagaa atgttggatc 3120

cttgaatagt agggatgtca atctgaaaga tgacttttcc tatgctaata ttgatgatcc 3180

ctataacaag cctttcgtcc taaataacct aataaaccct accaagtgtc aagagatcat 3240

gcaatttgcc aatggcaagt tgtttgactc ccaagtcctg agtggcacgg acaagaacat 3300

acgtaactct caacaaatgt ggatatccaa gaacaaccct atggtaaaac ccattttcga 3360

gaacatatgc aggcagttta acgtaccctt tgataatgcc gaggacctac aggtcgtccg 3420

ttacttgcct aatcaatatt ataatgagca tcatgactca tgctgtgact cctccaagca 3480

atgcagtgaa tttatagaga ggggcggtca gaggattctg accgttttaa tttacctaaa 3540

caacgagttc tcagatggac acacgtactt tcctaattta aaccaaaagt tcaagcccaa 3600

gactggtgat gctttggttt tttacccttt agccaacaac tctaataaat gtcacccata 3660

cagtctacac gcaggtatgc ccgtcacgtc aggagagaag tggattgcta atctgtggtt 3720

tcgtgagcgt aagttctccc accaccacca ccaccactaa taatcaagag gatgtcagaa 3780

tgccatttgc ctgagagatg caggcttcat ttttgatact tttttatttg taacctatat 3840

agtataggat tttttttgtc attttgtttc ttctcgtacg agcttgctcc tgatcagcct 3900

atctcgcagc tgatgaatat cttgtggtag gggtttggga aaatcattcg agtttgatgt 3960

ttttcttggt atttcccact cctcttcaga gtacagaaga ttaagtgaga cgttcgtttg 4020

tgctccgga 4029

<210> 18

<211> 50

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 18

ctctgccttc atcaatcaaa tcatgagatt cccatctatt ttcaccgctg 50

<210> 19

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 19

agcttcggcc tctcttttct cgaga 25

<210> 20

<211> 55

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 20

tctcgagaaa agagaggccg aagctgtgct gtcaaagtcc tgtgtcagtc acttt 55

<210> 21

<211> 60

<212> DNA

<213> 人工序列

<220>

<223> 合成核苷酸

<400> 21

gcaaatggca ttctgacatc ctcttgatta gtggtggtgg tggtggtggg agaacttacg 60

相关技术
  • 用于羟基化氨基酸的融合蛋白和产品
  • 羟基化氨基酸用于治疗糖尿病的用途
技术分类

06120112525898