用于羟基化氨基酸的融合蛋白和产品
文献发布时间:2023-06-19 10:22:47
序列表
本申请包含已经以电子方式提交并且全文以引用方式并入的序列表。
技术领域
本文描述了工程化蛋白质及其在发酵中的用途、用于产生蛋白质的方法,以及用于蛋白质的体外和体内羟基化的方法。
背景技术
存在使用微生物来制备用于商业应用的化合物的整个行业。微生物通常用制备这些化合物所必需的DNA来进行工程改造。这些微生物的示例包括酵母和细菌。所制备的化合物包括药物、芳香剂、风味剂、蛋白质等。
融合蛋白通过接合最初制备分离蛋白的两个或更多个基因来产生。在药物开发中产生融合蛋白的一个目的是将每种“亲本”蛋白的特性赋予所得的融合蛋白。
发明内容
在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基;和可溶性蛋白质伴侣。在一些实施方案中,本公开提供了由以下序列编码的融合蛋白:编码脯氨酰4-羟化酶α亚基的DNA序列;以及编码可溶性蛋白质伴侣的DNA序列。
在一些实施方案中,脯氨酰4-羟化酶α亚基选自由以下项组成的组:脯氨酰4-羟化酶α亚基-1、脯氨酰4-羟化酶α亚基-2和脯氨酰4-羟化酶α亚基-3。在一些实施方案中,可溶性蛋白质伴侣选自由以下项组成的组:脯氨酰4-羟化酶β亚基、麦芽糖结合蛋白、小泛素样修饰体、钙调蛋白结合蛋白和谷胱甘肽S-转移酶。在某些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫(C.elegans)。
在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基-1;和脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:编码脯氨酰4-羟化酶α亚基的DNA序列;和编码脯氨酰4-羟化酶β亚基的DNA序列。在某些实施方案中,脯氨酰4-羟化酶α亚基-1位于融合蛋白的N端。在特定实施方案中,脯氨酰4-羟化酶β亚基位于融合蛋白的C端。
在一些实施方案中,本公开提供了融合蛋白,该融合蛋白包含:脯氨酰4-羟化酶α亚基-1;以及脯氨酰4-羟化酶β亚基,其中脯氨酰4-羟化酶α亚基-1位于该融合蛋白的N端,并且脯氨酰4-羟化酶β亚基位于该融合蛋白的C端。
在某些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。在一些实施方案中,脯氨酰4-羟化酶α亚基-1由SEQ ID NO:1的核酸编码,并且脯氨酰4-羟化酶β亚基由SEQ ID NO:2的核酸编码。
在一些实施方案中,本公开提供了包含本文所公开的任何融合蛋白的微生物。在一些实施方案中,本公开提供了微生物,该微生物包含:融合蛋白,该融合蛋白包含脯氨酰4-羟化酶α亚基-1和脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了微生物,该微生物包含:融合蛋白,该融合蛋白包含位于N端的脯氨酰4-羟化酶α亚基-1和位于C端的脯氨酰4-羟化酶β亚基。在一些实施方案中,本公开提供了微生物,该微生物包含:
融合蛋白,该融合蛋白包含脯氨酰4-羟化酶α亚基-1和脯氨酰4-羟化酶β亚基;以及待羟基化的第二蛋白质。在某些实施方案中,微生物选自由以下项组成的组:芽孢杆菌属(Bacillus)、大肠杆菌(Escherichia coli)和丝状真菌。在一些实施方案中,微生物为酵母。在具体的实施方案中,第二蛋白质选自由以下项组成的组:胶原、重组胶原、胶原样蛋白质等。在一些实施方案中,脯氨酰4-羟化酶α亚基-1由SEQ ID NO:1的核酸编码,并且脯氨酰4-羟化酶β亚基由SEQ ID NO:2的核酸编码。
在一些实施方案中,本公开提供了用于向个体的皮肤提供护肤有益效果的方法,该方法包括:将本文所公开的融合蛋白施用到皮肤上。在某些实施方案中,该融合蛋白被配制成组合物,该组合物选自由以下项组成的组:霜、乳、软膏、凝胶、精华以及它们的组合。在一些实施方案中,护肤有益效果选自由以下项组成的组:抗皱、改善皮肤色素沉着、水合作用、减少痤疮、预防痤疮、减少黑头、预防黑头、减少妊娠纹、预防妊娠纹、预防脂肪团、减少脂肪团以及它们的组合。在某些实施方案中,该融合蛋白与其他护肤有益成分组合,所述其他护肤有益成分选自由以下项组成的组:水杨酸、视黄醇、过氧化苯甲酰、维生素C、甘油、α-羟基酸、对苯二酚、曲酸、透明质酸以及它们的组合。
在一些实施方案中,本公开提供了用于羟基化蛋白质的体外方法,该体外方法包括:提供含有待羟基化的蛋白质的微生物;提供本文所公开的融合蛋白;裂解该微生物以产生裂解物;将特定浓度的融合蛋白添加至裂解物;以及在促进蛋白质被融合蛋白羟基化的反应条件下温育裂解物和融合蛋白。在一些实施方案中,裂解物在添加融合蛋白之前纯化。在某些实施方案中,基于待羟基化的约1uM蛋白质,融合蛋白的浓度在约0.05uM至约5uM的范围内。在特定实施方案中,羟基化在约5至约12范围内的pH处进行。在一些实施方案中,羟基化在约16℃至约40℃范围内的温度处进行。在某些实施方案中,羟基化进行约30分钟以上至约1小时。
在一些实施方案中,本公开提供了用于制备羟基化蛋白质的方法,该方法包括:提供本文所公开的微生物;以及使该微生物在培养基中生长足以羟基化第二蛋白质的时间。在某些实施方案中,微生物为酵母。在一个具体实施方案中,酵母为巴斯德毕赤酵母(Pichia pastoris)。在一些实施方案中,微生物生长约50小时至约72小时。
在一些实施方案中,本公开提供了微生物,该微生物包含:编码脯氨酰4-羟化酶α亚基的DNA序列;以及编码可溶性蛋白质伴侣的DNA序列。
附加的方面和实施方案存在于以下的详细描述中。
附图说明
图1示出了MMV-130,其如实施例1中所述用于生成巴斯德毕赤酵母菌株PP153。
图2示出了MMV156,其如实施例3中所述用于生成巴斯德毕赤酵母菌株PP154。
图3MMV-191,其如实施例3中所述用于生成巴斯德毕赤酵母菌株PP268。
图4示出了MMV-290载体,其如实施例1中所述产生并转化到巴斯德毕赤酵母菌株PP153中以生成巴斯德毕赤酵母菌株PP336,并且表达在N端具有P4HA1、在C端具有P4HB且具有接头序列“GSGSGS”的融合蛋白。
图5示出了MMV-289载体,其如实施例2中所述产生并转化到巴斯德毕赤酵母菌株PP153中以生成巴斯德毕赤酵母菌株PP335,并且表达在N端具有P4HB且在C端具有P4HA1的融合蛋白。
图6示出了如实施例4中所述的MMV-400载体,并且该载体含有AB融合蛋白(即,如实施例3中所述的在N端具有P4HA1且在C端具有P4HB的融合蛋白)的DNA序列。
图7示出了如实施例5中所述的MMV-502载体,并且该载体含有AB融合蛋白的DNA序列、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子。
图8示出了如实施例5中所述的MMV-503载体,并且该载体含有P4HB亚基蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子。
图9示出了实施例7中所用的MMV411载体。
图10示出了如实施例1中所述的载体MMV-644。
具体实施方式
与本文所述的那些方法和材料类似或等同的所有方法和材料均可以与本文所述的合适方法和材料一起用于本公开的实践或测试中。本文提及的所有出版物、专利申请、专利和其他参考文献均全文以引用方式并入本文。如发生矛盾,则以本说明书及其所包括的定义为准。另外,除非另外指明,否则材料、方法和实施例仅为说明性的,并非旨在进行限制。
在一些实施方案中,本公开提供了由以下序列编码的融合蛋白:脯氨酰4-羟化酶α亚基的DNA序列和可溶性蛋白质伴侣的DNA序列。在某些实施方案中,该融合蛋白包含脯氨酰4-羟化酶α亚基-1(P4HA1)和脯氨酰4-羟化酶β亚基(P4HB)。在某些实施方案中,单体脯氨酰4-羟化酶α亚基可以在任何实施方案中用于代替本文所公开的融合蛋白。
P4HA基因和P4HB基因编码脯氨酰-4-羟化酶的组成,脯氨酰-4-羟化酶是胶原合成中的关键酶,由两个相同的α亚基和两个β亚基组成(异源四聚体)。P4HA编码的蛋白质是几种不同类型的α亚基之一,并且提供活性酶的催化位点的主要部分。参见例如,Crit RevBiochem Mol Biol.45(2):106–124(2010)。P4HA包含三个结构域:二聚化结构域、底物结合结构域和催化结构域。在一些实施方案中,脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。在某些实施方案中,单体脯氨酰4-羟化酶α亚基来自选自由以下项组成的组的物种:细菌、病毒、真菌和藻类。在某些实施方案中,单体脯氨酰4-羟化酶α亚基来自拟菌病毒(DNA序列:SEQ ID NO:15;蛋白质序列:SEQ ID NO:16)。参见例如,Rutschmann等人,Appl.Microbiol Biotechnol.98:4445-4455(2014)以及Shi等人,Protein J.36:322-331(2017)。在胶原和相关蛋白中,脯氨酰4-羟化酶催化4-羟脯氨酸的形成,这对于新合成的前胶原链的正确三维折叠是重要的。P4HB蛋白也称为二硫化物异构酶。它是人类中由P4HB基因编码的酶。人P4HB基因位于染色体17q25中。该蛋白质是多功能的,不同于其他脯氨酰4-羟化酶家族蛋白质,并且充当氧化还原酶用于二硫化物形成、断裂和异构化。P4HB的活性受到严格调控,二聚体解离和底物结合均可能在催化过程期间增强其酶活性。在一些实施方案中,P4HB来自选自由以下项组成的组的物种:牛、人、大鼠、小鼠、细菌、病毒、鱼和秀丽隐杆线虫。
P4HA的DNA序列(NCBI参考号:XP_005226443.1;UNIPROT:Q1RMU3)、P4HB的DNA序列(基因库:AAI46272.1;UNIPROT:P05307)、P4HA3的DNA序列(UNIPROT:P4HA3)和P4HA2的DNA序列(UNIPROT:G3N2F2)是已知并且可商购获得的。在一些实施方案中,通过从编码第一蛋白质的cDNA序列移除终止密码子,然后通过连接或重叠延伸聚合酶链反应(PCR)将第二蛋白质的DNA序列附连在框中来制备融合蛋白。融合蛋白的DNA序列然后将由细胞表达为单一蛋白。
用于制备融合蛋白的一种技术是连接,它是在酶的作用下接合两个核酸片段。DNA片段接合在一起产生重组DNA分子,诸如在将外来DNA片段插入质粒中时。DNA片段的端部通过在一个DNA末端的3'-羟基与另一个DNA末端的5'-磷酰基之间形成磷酸二酯键而接合在一起。用于制备融合蛋白的另一种技术是重叠延伸PCR,也称为重叠延伸剪接术。重叠延伸PCR用于在序列中的特定点处插入特定突变或用于将较小的DNA片段剪接到较大的多核苷酸中。分泌信号序列(诸如酿酒酵母(Saccharomyces cerevisiae)α交配因子信号)可以被置于单体脯氨酰4-羟化酶α亚基的前面,以将蛋白质从宿主分泌到生产培养基中。
在一些实施方案中,本文所公开的融合蛋白可以由以下组合编码:脯氨酰4-羟化酶α亚基-1(P4HA1)的DNA序列或脯氨酰4-羟化酶α亚基-2(P4HA2)的DNA序列或脯氨酰4-羟化酶α亚基-3(P4HA3)的DNA序列和脯氨酰4-羟化酶β亚基(P4HB)的DNA序列;以及脯氨酰4-羟化酶α亚基-1(P4HA1)的DNA序列或脯氨酰4-羟化酶α亚基-2(P4HA2)的DNA序列或脯氨酰4-羟化酶α亚基-3(P4HA3)的DNA序列,以及选自下列各项的可溶性蛋白质伴侣的DNA序列:脯氨酰4-羟化酶β亚基(P4HB)、麦芽糖结合蛋白、小泛素样修饰体、钙调蛋白结合蛋白、谷胱甘肽S-转移酶等。活性脯氨酰-4-羟化酶复合物可以包括来自诸如牛、人、大鼠、小鼠、秀丽隐杆线虫等物种的P4H亚基。在一个实施方案中,融合蛋白包含P4HA1和P4HB。
当制备本文所述的融合蛋白时,可以制备在N端具有P4HA或P4HB的蛋白。我们惊奇地发现,在游离脯氨酸存在下,在N端具有P4HA的融合蛋白在酵母中形成功能性羟基化酶,而在N端具有P4HB的融合蛋白在酵母中不形成功能性羟基化酶。在某些实施方案中,融合蛋白在N端具有P4HA并且在C端具有第二蛋白质。在一些实施方案中,融合蛋白在N端具有P4HA并且在C端具有P4HB。
可以将编码P4HA1和P4HB的融合蛋白的DNA或者单体脯氨酰4-羟化酶α亚基的DNA转化或转染到生物体中。合适的生物体包括酵母、细菌、真菌等。在一些实施方案中,细菌可以是芽孢杆菌属或大肠杆菌。在一些实施方案中,微生物可以是丝状真菌。在一些实施方案中,生物体可以是酵母。在某些实施方案中,酵母可以是巴斯德毕赤酵母。通常,为了发挥羟基化酶的功能,需要多个转染/转化反应。本文所述的融合蛋白能够实现更有效的过程。本文所述的融合蛋白将转化反应的数目减少至一个而不是两个(例如,一个用于P4HA1,另一个用于P4HB)。如果酶被分别转化,则它们将经历三个反应以形成四聚体,以便成为有效的酶。四聚体由例如两个P4HA亚基和两个P4HB亚基组成。这三个反应如下:1)第一P4HA和第一P4HB组合形成第一二聚体,2)第二P4HA和第二P4HB组合形成第二二聚体,以及3)两个二聚体形成四聚体。当酶被分别转化时,并非所有P4HA和P4HB都会反应形成四聚体。融合蛋白将需要与另一种融合蛋白反应一次以形成有效的四聚体。本公开的有益效果是融合蛋白(两个分子)比分离的蛋白质(四种蛋白质)更有效地形成四聚体。两种融合蛋白将形成一种四聚体。因此,本文所述的融合蛋白提供更有效和高效的羟基化酶。在一些实施方案中,融合蛋白可以用于蛋白质的体外羟基化的方法中。在一些实施方案中,融合蛋白可以用于蛋白质的体内羟基化的方法中。
在一些实施方案中,本文所述的融合蛋白可以用于在体外将蛋白质羟基化。可以将含有蛋白质(诸如胶原)的微生物裂解,从而产生裂解物。可以对裂解物进行加工以产生纯化的蛋白质。可以将融合蛋白添加到纯化的蛋白质样品中或添加到裂解物中。在一些实施方案中,羟基化反应的辅因子可以包括下列中的一种或多种:抗坏血酸、抗坏血酸钠或铁(II),例如FeSO
替代性地,可以将融合蛋白的DNA序列转染到微生物中并用于在细胞内/体内将蛋白质羟基化。转染的微生物可以在适于特定微生物的培养基中,在本领域普通技术人员熟知的条件下生长。在一些实施方案中,适用于反应的培养基可以是例如用于大肠杆菌的LB(溶菌肉汤)、用于毕赤酵母属(Pichia)的BMGY(缓冲型甘油复合培养基)、用于毕赤酵母属的YPD(酵母提取物蛋白胨右旋糖)或用于毕赤酵母属的HMP(六偏磷酸钠)。该培养基的温度可以在约16℃至42℃的范围内。在一些实施方案中,该培养基的温度可以为约16℃、约18℃、约20℃、约22℃、约24℃、约26℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约38℃、约40℃或约42℃。在一些实施方案中,微生物为毕赤酵母属,并且培养基的温度可以在约28℃至约36℃的范围内,例如约32℃。在一些实施方案中,培养基的温度可以为约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃或约36℃。微生物可以生长约50小时至约72小时的范围内(例如约68小时)的时间。在一些实施方案中,微生物可以生长约50小时、约51小时、约52小时、约53小时、约54小时、约55小时、约56小时、约57小时、约58小时、约59小时、约60小时、约61小时、约62小时、约63小时、约64小时、约65小时、约66小时、约67小时、约68小时、约69小时、约70小时、约71小时或约72小时。在某些实施方案中,用于羟基化反应的底物可以选自由以下项组成的组:AKG、分子胶原和分子氧。
在一些实施方案中,融合蛋白的DNA序列可以连同以下序列一起置于载体中:融合蛋白启动子的DNA序列;融合蛋白终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与酵母基因组的同源性的DNA序列(任选地在转化到酵母中时用于提高效率)。在一些实施方案中,载体已插入生物体中(或已成为其附加体)。在一些实施方案中,然后可以通过本领域已知的方法(诸如电穿孔)将载体转化到微生物中。
可以将编码脯氨酰4-羟化酶α亚基-1(P4HA1)和脯氨酰4-羟化酶β亚基(P4HB)的融合蛋白的DNA,以及编码待羟基化的第二蛋白质的DNA可转化到微生物中。羟基化修饰可以在各种氨基酸上进行,这些氨基酸包括但不限于脯氨酸、赖氨酸、天冬酰胺、天冬氨酸和组氨酸。可以被羟基化的合适蛋白质包括胶原等。在本文所述的任何实施方案、任何方法和/或任何反应中,可以使用单体脯氨酰4-羟化酶α亚基来代替融合蛋白。
在一些实施方案中,融合蛋白的DNA序列可以连同以下序列一起置于载体中:融合蛋白启动子的DNA序列;融合蛋白终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与宿主生物体基因组的同源性的DNA序列。在一些实施方案中,待羟基化的第二蛋白质的DNA序列可以连同以下序列一起置于载体上:第二蛋白质启动子的DNA序列;第二蛋白质终止子的DNA序列;选择标记的DNA序列、该选择标记的启动子的DNA序列;该选择标记的终止子的DNA序列;复制起点的DNA序列,该复制起点中的一个是细菌复制起点,另一个是酵母复制起点;和/或含有与宿主生物体基因组的同源性的DNA序列。在一些实施方案中,然后通过本领域已知的方法(诸如电穿孔)将两种载体转化到微生物中。
替代性地,在一些实施方案中,可以使用多合一载体,其中融合蛋白的DNA,包括启动子和终止子;第二蛋白质的DNA,包括启动子和终止子;选择标记的DNA,包括启动子和终止子;和/或与生物体的基因组具有同源性的用于整合到基因组中的DNA包含在该多合一载体中。然后可以通过本领域已知的方法(诸如电穿孔)将该多合一载体转化到微生物中。
本领域已知启动子可以提高蛋白质的产量。启动子是包含在载体中的DNA序列。在本公开中使用的合适启动子包括但不限于AOXl甲醇诱导的启动子、pDF去阻遏启动子、pCAT去阻遏启动子、Dasl-Das2甲醇诱导的双向启动子、pHTXl组成型双向启动子、pGCW14-pGAP1组成型双向启动子以及它们的组合。
在结合到酵母中的载体中利用的每个开放阅读框的末端需要终止子。在一些实施方案中,可以将终止子的DNA序列插入载体中。
复制起点是引发复制所必需的。在一些实施方案中,可以将复制起点的DNA序列插入载体中。
当酵母是微生物时,含有与酵母基因组的同源性的DNA序列是必需的并且可以结合到载体中。
选择标记用于选择已成功转化的生物体。这些标记有时与抗生素抗性相关。这些标记也可以与在具有或不具有某些氨基酸的情况下生长的能力相关(营养缺陷型标记)。合适的营养缺陷型标记包括但不限于ADE、HIS、URA、LEU、LYS、TRP以及它们的组合。在一些实施方案中,可以将选择标记的DNA序列结合到载体中。本公开包括使表达融合蛋白的细胞生长、表达融合蛋白、分离和纯化融合蛋白的方法。本公开还包括如本文所述的融合蛋白的用途。
具体地讲,本文所述的融合蛋白可以用于个人护理组合物。就个人护理组合物而言,可以将融合蛋白施用于皮肤。对于该用途,融合蛋白可以全部或仅一定程度地分离或纯化(例如,至少25%纯化、至少50%纯化、至少65%纯化、至少75%纯化、至少85%纯化、至少90%纯化、至少95%纯化、至少96%纯化、至少97%纯化、至少98%纯化、至少99%纯化或100%纯化)。换句话讲,融合蛋白可以作为纯化蛋白质添加到个人护理产品中,或者可以作为从其中发现该蛋白的级分的一部分添加。融合蛋白可以被制成霜、乳、软膏、凝胶、精华等。
个人护理组合物可以提供适于局部施用于皮肤的配制物。该组合物还可以包含美容上可接受的载剂。美容上可接受的载剂可以占该组合物的约50重量%至约99重量%(例如,占该组合物的约80重量%至约95重量%)。在一些实施方案中,载剂可以为该组合物的约50重量%、约55重量%、约60重量%、约65重量%、约70重量%、约75重量%、约80重量%、约85重量%、约90重量%、约95重量%、约96重量%、约97重量%、约98重量%或约99重量%。这些组合物可以制成各式各样的产品类型,包括但不限于液体组合物,诸如乳、霜、凝胶、棒状物、喷雾、剃刮膏、软膏、卸妆液洗剂和固体棒状物、糊状物、粉末、摩丝、面膜、果皮、化妆品和湿巾。这些产品类型可以包含若干类型的美容上可接受的载剂,包括但不限于溶液、乳液(例如,微乳液和纳米乳液)、凝胶、固体和脂质体。以下是此类载剂的非限制性示例。其他载剂可以由本领域的普通技术人员配制。
可用于本公开的局部用组合物可以配制为溶液。溶液通常包含水性溶剂(例如,约50%至约99%或约90%至约95%的美容上可接受的水性溶剂)。在一些实施方案中,溶液可以具有约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、约96%、约97%、约98%或约99的美容上可接受的水性溶剂。局部用组合物可以配制为包含润肤剂的溶液。此类组合物优选地含有约2%至约50%的润肤剂。在一些实施方案中,组合物可以包含约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约12%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%的润肤剂。如本文所用,“润肤剂”是指用于预防或缓解干燥以及用于保护皮肤的材料。各式各样的合适润肤剂是已知的,并且可以用于个人护理组合物中。参见International Cosmetic IngredientDictionary and Handbook,Wenninger和McEwen编辑,(The Cosmetic,Toiletry,andFragrance Assoc.,Washington,D.C.,第7版,1997)(下文称为“CTFAs手册”),其包含合适材料的许多示例。
乳可以由这种溶液制成。乳通常包含约1%至约20%(例如,约5%至约10%)的润肤剂和约50%至约90%(例如,约60%至约80%)的水。在一些实施方案中,乳可以具有约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%或约20%的润肤剂。在一些实施方案中,乳可以具有约50%、约55%、约60%、约65%、约70%、约75%或约80%的水。
可以由溶液配制的另一类产品可以是霜。霜通常包含约5%至约50%(例如,约10%至约20%)的润肤剂和约45%至约85%(例如,约50%至约75%)的水。在一些实施方案中,霜可以具有约5%、约6%、约7%、约8%、约9%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%的润肤剂。在一些实施方案中,霜可以具有约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%或约85%的水。
可以由溶液配制的又一类产品可以是软膏。软膏可以包含动物油或植物油或者半固体烃类的简单基料。软膏可以包含约2%至约10%的润肤剂,加上约0.1%至约2%的增稠剂。在一些实施方案中,软膏可以具有约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%或约10%的润肤剂。在一些实施方案中,软膏可以具有约0.1%、约0.2%、约0.3%、约0.4%、约0.6%、约0.8%、约1.0%、约1.2%、约1.4%、约1.6%、约1.8%或约2.0%的增稠剂。可用于本文的增稠剂或增粘剂的更完整的公开可以在CTFA手册中找到。
这些个人护理组合物可以配制为乳液。如果载剂可以是乳液,则该约1%至约10%(例如,约2%至约5%)的载剂包含乳化剂。在一些实施方案中,约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%或约10%的载剂包含乳化剂。乳化剂可以为非离子乳化剂、阴离子乳化剂或阳离子乳化剂。合适的乳化剂公开于例如CTFA手册中。
乳和霜可以配制为乳液。通常,此类乳包含0.5%至约5%的乳化剂。此类霜将通常包含约1%至约20%(例如,约5%至约10%)的润肤剂;约20%至约80%(例如,30%至约70%)的水;和约1%至约10%(例如,约2%至约5%)的乳化剂。
水包油型和油包水型的单一乳液护肤组合物(诸如乳和霜)是美容领域熟知的,并且可用于个人护理组合物。多相乳液组合物(诸如水包油包水型)也是可用的。一般来讲,此类单相或多相乳液含有水、润肤剂和乳化剂作为基本成分。
本公开的个人护理组合物还可以配制为凝胶(例如,使用合适的胶凝剂的含水凝胶)。用于含水凝胶的合适胶凝剂包括但不限于天然树胶、丙烯酸的聚合物和共聚物、丙烯酸酯的聚合物和共聚物,以及纤维素衍生物(例如,羟甲基纤维素和羟丙基纤维素)。用于油(诸如矿物油)的合适胶凝剂包括但不限于氢化丁烯/乙烯/苯乙烯共聚物和氢化乙烯/丙烯/苯乙烯共聚物。此类凝胶通常包含介于约0.1重量%和5重量%之间的此类胶凝剂。在一些实施方案中,凝胶包含约0.1重量%、约0.2重量%、约0.3重量%、约0.4重量%、约0.5重量%、约1.0重量%、约1.5重量%、约2.0重量%、约2.5重量%、约3.0重量%、约3.5重量%、约4.0重量%、约4.5重量%或约5.0重量%的此类胶凝剂。
除前述组分以外,可用于本公开中的个人护理组合物还可以含有各式各样的附加的油溶性材料和/或水溶性材料,这些材料按照惯例以其领域既定的含量用于在皮肤上使用的组合物中。
可以根据需要和/或作为常规方案的一部分,将个人护理组合物施用于皮肤或施用在皮肤上,该常规方案涉及的范围从每周施用一次直到每天施用一次或多次(例如,每天两次)。用量将随最终使用者的年龄和身体状况、处理持续时间,所采用的具体化合物、产品或组合物,所利用的特定的美容上可接受的载剂等因素而变化。
本文所述的融合蛋白可以在个人护理应用中用于实现护肤有益效果,诸如抗皱、改善皮肤色素沉着、水合作用、减少痤疮、预防痤疮、减少黑头、预防黑头、减少妊娠纹、预防妊娠纹、预防脂肪团、减少脂肪团等。所谓改善皮肤色素沉着,是指使皮肤色素沉着均匀或减少皮肤色素沉着,以提供白皙的皮肤。
本文所述的融合蛋白还可以与其他护肤有益成分组合,这些成分诸如但不限于水杨酸、视黄醇、过氧化苯甲酰、维生素C、甘油、α-羟基酸、对苯二酚、曲酸、透明质酸等。
胶原脯氨酰4羟化酶含有与脯氨酰羟化酶结构域蛋白(PHD)(包括PHD1、PHD2、PHD3、PHD4等)相似的保守结构域。这些PHD起到调节缺氧诱导因子(HIF)的羟基化的关键作用。HIF是在缺氧条件下与特定核辅因子相互作用的DNA结合转录因子,HIF反式激活一系列缺氧相关基因以触发适应性应答。由于其在细胞中的作用,HIF与许多细胞功能(诸如体内稳态、血管形成和厌氧代谢等)相关联。细胞中HIF的上调和下调可以引起癌细胞的血管生成或增殖,因此HIF和脯氨酰羟化酶由于其治疗潜能而被越来越多地研究。因此,本文所述的融合蛋白可以适用于脯氨酰羟化酶结构域蛋白。
在本说明书的上下文中,如果没有另外指明,则本文提及的所有出版物、专利申请、专利和其他参考文献均全文以引用方式明确地并入本文以用于所有目的,如同被完全阐述一样,并且其全文应当被认为是本公开的一部分。
除非另外限定,否则本文所使用的所有技术术语和科学术语均具有与本公开所属领域的普通技术人员所通常理解的相同的含义。如发生矛盾,则以本说明书及其所包括的定义为准。
当数量、浓度或者其他值或参数以范围给出或通过列出上限值和下限值而给出时,其应当理解为具体地公开由任何成对的任何范围上限和下限所形成的所有范围,而不管范围是否被单独地公开。当本文中引用数值范围时,除非另外规定,否则该范围旨在包括其端点,以及该范围内的所有的整数和分数。当限定范围时,不旨在将本公开的范围限制于所列举的具体值。
另外,除非另外明确相反地规定,否则当提供一个或多个范围或项目清单时,这应当理解为明确地公开这种范围或清单中的任何单个指定的值或项目,以及它们与相同的清单或任何其他清单中的任何其他单个值或项目的任何组合。
如本文所用,术语“包含”、“包括”、“具有”或它们的任何其他变型旨在涵盖非排他性的包括。例如,包括要素清单的过程、方法、制品或设备不必仅限于那些要素,而是可以包括未明确列出的或者此类过程、方法、制品或设备所固有的其他要素。
另外,除非明确相反地规定,否则“或”和“和/或”是指包含性的而不是排他性的。例如,以下任何一种情况都满足条件A或B,或者A和/或B:A为真(或存在)且B为假(或不存在)、A为假(或不存在)且B为真(或存在),以及A和B均为真(或存在)。
使用“一个”或“一种”来描述本文的各种要素和组成仅仅是为了方便起见,并且用于给出本公开的一般意义。该描述应当被解读为包括一个/种或至少一个/种,并且单数也包括复数,除非明显地另有所指。
以上书面描述提供了制备和使用该描述的方式和过程,使得本领域的任何技术人员均能够制备和使用该描述,该可据以实施性具体地是针对构成原始描述的一部分的所附权利要求书的主题提供的。
如本文所用,短语“选自由以下项组成的组”、“选自”等包括指定材料的混合物。
当特征或要素在本文中被称为“在”另一个特征或要素“之上”时,它可以直接位于其他特征或要素之上,或者还可以存在居间的特征和/或要素。相比之下,当特征或要素被称为“直接在”另一个特征或要素“之上”时,不存在居间的特征或要素。还应当理解,当特征或要素被称为“连接”、“附接”或“联接”到另一个特征或要素时,它可以直接连接、附接或联接到其他特征或要素,或者可以存在居间的特征或要素。相比之下,当特征或要素被称为“直接连接”、“直接附接”或“直接联接”到另一个特征或要素时,不存在居间的特征或要素。尽管是相对于一个实施方案描述或示出的,但如此描述或示出的特征和元件可应用于其他实施方案。本领域技术人员还将认识到,提及与另一个特征“相邻”设置的结构或特征可以具有与相邻特征重叠或位于相邻特征之下的部分。
为了便于描述,可以在本文中使用空间相对术语,诸如“在…下方”、“在…之下”、“下部”、“在…上方”、“上部”等来描述如附图所展示的一种要素或特征与另一种要素或特征的关系。应当理解,除了描绘于附图中的取向以外,空间相对术语还旨在涵盖使用或操作中的装置的不同取向。例如,如果附图中的装置是倒置的,则被描述为在其他要素或特征“下方”或“下面”的要素将取向为在其他要素或特征“上方”。因此,示例性术语“在…下方”可以涵盖“在…上方”和“在…下方”这两种取向。可按另外的方式来取向装置(旋转90度或呈其他取向),并且相应地解释本文所使用的空间相对描述词。类似地,仅出于解释的目的,在本文中使用术语“向上”、“向下”、“竖直”、“水平”等,除非另外明确指明。
尽管术语“第一”和“第二”可以在本文中用于描述各种特征/要素,但是这些特征/要素不应当受这些术语限制,除非上下文另外指明。这些术语可用于将一个特征/元件与另一个特征/元件区分开。因此,以下讨论的第一特征/要素可以被称为第二特征/要素,并且类似地,以下讨论的第二特征/要素可以被称为第一特征/要素,而不脱离本公开的教导内容。
当使用术语“约”时,其用于表示可以在一定的公差内获得一定的效果或结果,并且技术人员知道如何获得公差。当术语“约”用于描述值或范围的端点时,本公开应当被理解为包括所提及的具体的值或端点。在实施方案中,“约”可以指至多10%(即,±10%)的范围。
本文所列举的任何数值范围均旨在包括其中所包含的所有子范围。
本文包括的实施例和例证通过说明而非限制的方式示出其中可以实践主题的具体实施方案。如所提及的,可使用并从其中得到其他实施方案,使得可在不脱离本公开的范围的情况下做出结构和逻辑上的替代和变化。本发明主题的此类实施方案可以在本文中仅出于方便而单独或共同地提及,并非旨在自动将本申请的范围限制于任何单个发明构思(如果事实上公开多于一个的话)。因此,尽管在本文中已说明并且描述了具体实施方案,但是旨在实现相同目的的任何布置均可替代所示出的具体实施方案。本公开旨在涵盖各种实施方案的任何和所有改型或变型。对于本领域技术人员而言,在审阅以上描述后,以上实施方案的组合以及本文中未具体描述的其他实施方案将变得显而易见。
呈现以上描述是为了使本领域的技术人员能够制备和使用本文所公开的所有融合蛋白,并且以上描述是在特定应用及其要求的上下文中提供的。对优选实施方案的各种修改对于本领域的技术人员来说将是显而易见的,并且在不脱离本公开的实质和范围的情况下,本文所定义的一般原理可以应用于其他实施方案和应用。因此,本公开并非旨在限于所示的实施方案,而是要符合与本文所公开的原理和特征一致的最宽范围。
已经一般性地描述了本公开,可以通过参考某些具体实施例来获得进一步的理解,这些具体实施例在本文中仅出于说明的目的而提供,并且除非另外指明,则并非旨在进行限制。
从DNA 2.0获得牛P4HA1的DNA序列(SEQ ID NO:1)和牛P4HB的DNA序列(SEQ IDNO:2)。使用DNA序列作为模板通过引物MM-1090(SEQ ID NO:3)、MM-750(SEQ ID NO:4)、MM-0782(SEQ ID NO:5)、MM-0783(SEQ ID NO:6)、MM-0784(SEQ ID NO:7)、MM-0785(SEQ IDNO:8)进行聚合酶链反应,然后Gibson组装到载体MMV290(SEQ ID NO:9)中(Gibson DG,Young L,Chuang RY,Venter JC,Hutchison CA,Smith HO.Enzymatic assembly of DNAmolecules up to several hundred kilobases.NatMethods.2009;6:343–5.)。最终载体MMV290(图4)通过测序确认并且转化到巴斯德毕赤酵母菌株PP153中,以生成在N端具有P4HA1并且在C端具有P4HB的菌株PP336。
通过用Pme I消化MMV-130(图1)并且转化到PP1中而生成PP153。PP153包含由pDF启动子驱动的野生型胶原。
从IDT获得单体脯氨酰4-羟化酶α的DNA序列(SEQ ID NO:15)。使用DNA序列作为模板通过引物MM-0579(SEQ ID NO:18)、MM-0580(SEQ ID NO:19)、MM-1569(SEQ ID NO:20)、MM-1570(SEQ ID NO:21)、MM-0784(SEQ ID NO:7)进行聚合酶链反应,然后Gibson组装到载体MMV-644(SEQ ID NO:17)中。最终载体MMV-644(图10)通过测序确认并且转化到巴斯德毕赤酵母菌株PP97中,以生成菌株PP765。
通过用Swa I消化MMV-644(图10)并且转化到PP97中而生成PP765。PP765包含由pDF启动子驱动的在C端具有6X His标签的单体脯氨酰4-羟化酶和来自酿酒酵母α交配因子的分泌信号。
从DNA 2.0获得牛P4HA1的DNA序列和牛P4HB的DNA序列。使用DNA序列作为模板通过引物MM-1090、MM-750、MM-779、MM-780、MM-781、MM-369进行聚合酶链反应,然后Gibson组装到载体MMV289(SEQ ID NO:10)中。最终载体MMV289(图5)通过测序确认并且转化到酵母菌株PP153中,以生成在N端具有P4HB并且在C端具有P4HA1的菌株PP335。
将菌株PP336接种在具有2mL BMGY培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。将细胞快速离心,然后在800uL裂解缓冲液中通过Qiagen组织裂解仪裂解。用以下组分制备裂解缓冲液:2.5mL1M HEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mL Triton X-100;最终浓度1%并且42mLMillipure水。上清液含有在N端具有P4HA1并且在C端具有P4HB的融合蛋白(AB融合蛋白),将其上样于SDS PAGE凝胶上并且转移至PVDF膜。在蛋白质印迹中用P4HB抗体探测融合蛋白。
将菌株PP765接种在具有2mL BMGY培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。将细胞快速离心并且收集培养基。将含有单体脯氨酰4-羟化酶的上清液上样于SDS PAGE凝胶上并且转移至PVDF膜。在蛋白质印迹中用His标签抗体探测融合蛋白。
使用菌株PP335进行上述相同程序以生成在N端具有P4HB并且在C端具有P4HA1的融合蛋白(BA融合蛋白)。
对于AB22融合蛋白,我们通过考马斯染色和蛋白质印迹均检测到分子量为约120kDa的融合蛋白。对于BA融合蛋白,我们不能同时通过这两种方法检测到融合蛋白。
将菌株PP336接种在具有2mL BMGY发酵培养基的24孔板中,并且在30℃处伴随以900rpm振荡而生长48小时。同时,让分别具有胶原的DNA序列、P4HA的DNA序列和P4HB的DNA序列的基准酵母菌株PP268在相同条件下生长。
通过用Bam HI消化MMV156(图2)并且转化到PP153中以生成PP154,来生成PP268,然后用Bam HI消化MMV-191(图3)并且转化到PP154中以生成PP268。
按照以下程序通过胃蛋白酶测定来分析样品PP336和PP268,以评估胶原三聚体对胃蛋白酶的敏感性。PP336将具有与PP268类似的胃蛋白酶耐受性。
通过氨基酸分析对PP336和PP268的脯氨酸羟基化进行分析。PP336将具有与针对PP268观察到的相似或更好的脯氨酸羟基化。
胃蛋白酶测定用以下程序进行:
1.在胃蛋白酶处理之前,根据Thermo Scientific方案进行二辛可宁酸(BCA)测定以获得每个样品的总蛋白。对于所有样品,将总蛋白标准化为最低浓度。
2.将100uL裂解物放入微量离心管中。
3.产生含有以下物质的主混合物:
a.37%HCl(每l00mL含有0.6mL酸)和
b.胃蛋白酶(在去离子水中的原液为l mg/mL,并且胃蛋白酶的最终添加应当为1:25比率的胃蛋白酶:总蛋白(重量:重量)。
c.基于步骤#1,即总蛋白的标准化,胃蛋白酶的量将随最终添加而变化,使用创建的电子表格进行调整。
4.添加胃蛋白酶之后,用吸移管混合3次,然后使样品在室温处温育一小时,以进行胃蛋白酶反应。
5.一小时之后,向每个样品中添加1:1体积的含有β-巯基乙醇的LDS加载缓冲液,然后使其在70℃处温育7分钟。
6.然后以14,000rpm旋转1分钟以除去浊度。
将不含胶原和融合蛋白的DNA的酵母菌株PP97在YPD培养基和80mM脯氨酸中生长过夜,以产生生长的培养物。用5mL生长的培养物接种20mL YPD培养基和80mM脯氨酸,并且在30℃处以300rpm温育1小时。在4℃处以5000rpm离心5分钟来收获细胞并用无菌水洗涤两次,然后与10mL转化缓冲液混合并在25℃处与10mM DDT一起温育25分钟。收获细胞并用冷山梨醇洗涤两次,然后用电穿孔转化含有AB融合蛋白的DNA的MMV400(SEQ ID NO:11和图6)。细胞在80mM脯氨酸在整个持续时间内存在的博莱霉素500板上温育三小时之后进行铺板。将板在30℃处温育两天,然后按照实施例3中所述的程序筛选菌落。结果显示,融合蛋白在脯氨酸的存在下转化到空宿主细胞中。
在YPD培养基中不存在脯氨酸的情况下,没有菌落或仅形成了几个菌落。当通过蛋白质印迹来分析这些菌落时,所有菌落对于AB融合蛋白均为阴性。在将80mM脯氨酸添加到YPD培养基的实验中,通过蛋白质印迹来分析6/6菌落,所有菌落对于AB融合蛋白均为阳性。
用BglII和MluI将载体MMV290(图4)(SEQ ID NO:9)消化,然后与插入序列(SEQ IDNO:12)一起进行Gibson组装,该插入序列涵盖AB融合蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子,从而生成载体MMV502(图7)。
用BglII和MluI将载体MMV156(图2)(SEQ ID NO:13)消化,然后与插入序列(SEQID NO:12)一起进行Gibson组装,该插入序列涵盖P4HB亚基蛋白的C端、代表组氨酸的六个连续氨基酸(His标签)的核苷酸序列、两个终止密码子和AOX1转录终止子,从而生成载体MMV503(图8)。
将MMV502转化到PP153中,从而生成菌株PP548。对该菌株进行培养、裂解并使用各种方法(包括蛋白质印迹和考马斯染色凝胶)测定蛋白含量。蛋白质印迹确认存在AB融合蛋白。考马斯染色凝胶确认了具有His标签的AB融合蛋白的分子量(119kDa)。将PP548菌株的高表达变体在摇瓶和发酵罐中生长。一旦汇合,就将细胞离心成沉淀并洗涤。然后在800uL裂解缓冲液中通过Qiagen组织裂解仪将细胞裂解。用以下组分制备裂解缓冲液:2.5mL 1MHEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mLTriton X-100;最终浓度1%并且42mL Millipure水。将裂解物离心,并且将可溶性级分与镍-NTA琼脂糖珠一起温育。将澄清的裂解物-珠混合物施加到保留珠的柱上。随后用不同浓度的咪唑(可能包括其他化学品,诸如1,10-菲咯啉和EDTA)洗涤镍-NTA珠。然后通过用300mM咪唑洗涤来洗脱由质粒MMV502编码的具有His标签的AB融合蛋白。将这些洗脱液合并或保持分离,然后使用Amico Ultra-15过滤柱进行缓冲液交换以除去残余咪唑。然后将AB融合蛋白用于后续测定。
将MMV503转化到PP153中,从而生成菌株PP549。对该菌株进行培养、裂解并使用各种方法(包括蛋白质印迹和考马斯染色凝胶)测定蛋白含量。蛋白质印迹确认存在P4HA酶和P4HB酶。考马斯染色凝胶确认了P4HA酶的分子量(61kDa)和P4HB酶的分子量(57kDa)。将PP549菌株的高表达变体在摇瓶和发酵罐中生长。一旦汇合,就将细胞离心成沉淀并洗涤。然后在800uL裂解缓冲液中通过Qiagen组织裂解仪将细胞裂解。用以下组分制备裂解缓冲液:2.5mL 1M HEPES;最终浓度50mM,438.3mg NaCl;最终浓度150mM,5ml甘油;最终浓度10%,0.5mL Triton X-100;最终浓度1%并且42mL Millipure水。将裂解物离心,并且将可溶性级分与镍-NTA琼脂糖珠一起温育。将澄清的裂解物-珠混合物施加到保留珠的柱上。随后用不同浓度的咪唑(可能包括其他化学品,诸如1,10-菲咯啉和EDTA)洗涤镍-NTA珠。然后通过用300mM咪唑洗涤来洗脱由质粒MMV503编码的具有His标签的P4HA和P4HB。将洗脱液合并或保持分离,然后使用Amico Ultra-15过滤柱进行缓冲液交换以除去残余咪唑。然后将P4HA蛋白和P4HB蛋白用于后续测定。
通过对基于α-酮戊二酸羟基化偶联脱羧的方法的改进,确认了来自PP548的融合蛋白酶活性(Kivirikko,K.I.和Myllyla
来自PP548的P4HA和P4HB酶活性通过与上文相同的测定法来确认。
结果显示,与具有天然的P4HA蛋白和P4HB蛋白的样品相比,在具有AB融合蛋白的样品中存在较少的α-酮戊二酸。这表明AB融合蛋白比天然的P4HA蛋白和P4HB蛋白具有更大的活性。
通过用Pme I消化MMV411(SEQ ID NO:14和图9)并且转化到PP97中而生成PP434。
将单个菌落接种在50mL BMGY培养基中,同时在30℃处以250rpm恒定振荡过夜。第二天,用1L锥形瓶中过夜生长的培养物接种500mL新鲜的BMGY培养基,并且在30℃处伴随以250rpm恒定振荡生长2天。
将PP434细胞重悬(1g湿细胞重量(wcw))在5.667ml磷酸盐缓冲液(50mM,pH 7.4)中。在珠磨器中使用Matrix D珠将细胞裂解5个循环(每两个循环之间冷却1分钟)以生成全细胞裂解物。然后将全细胞裂解物置于若干个1.5ml微量离心管中并且在70℃处加热30分钟,每5分钟轻轻混合一次。然后将全细胞裂解物在4℃处以21000*g快速离心5分钟。将上清液置于冰上10分钟。将Ni-NTA树脂(对于1g wcw,0.5ml床体积)用去离子水平衡3次,通过在4℃处以800*g离心2分钟将乙醇除去。将澄清的裂解物添加到平衡的Ni-NTA树脂中,并且在4℃处上下颠倒旋转温育60分钟。通过在4℃处以800*g离心5分钟来收集上清液。用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、20mM咪唑通过在4℃处以800*g离心2分钟来洗涤树脂。然后用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、250mM咪唑通过在4℃处以800*g离心2分钟来洗涤树脂。在4℃处将蛋白质与洗脱缓冲液一起温育5分钟(上下颠倒旋转)之后,通过在4℃处以800*g离心2分钟,来用5ml 50mM磷酸盐缓冲液(pH 7.4)、500mM咪唑将蛋白质洗脱3次。在SDSPAGE上分析样品(上清液和沉淀两者,连同全细胞裂解物)。然后将样品在50mMTris(pH 8.0)、100mM NaCl中用至少一次缓冲液更换进行透析(在至少100倍样品体积中透析)。
将载体MMV363修饰为包括22kD小Pre-Pro-Col3以及相关联的启动子pDF和终止子AOX1TT、Flag标签和HA标签、用于标记表达的DNA序列以及相关联的启动子和终止子、用于细菌和酵母的复制起点的DNA序列,以及用于整合的与酵母基因组具有同源性的DNA序列。载体MMV88是Pre-Pro-Col3结构域的来源DNA。载体MMV130是Col3A1结构域加上HA标签和Flag标签的来源DNA。Col3A1多肽的总长度为190个氨基酸(aa)。将3个片段Gibson组装在一起,所得的质粒为MMV383。
使用Aox着陆垫进行整合,将MMV383转化到PP97中。所得的毕赤酵母属菌株为PP414。随后的蛋白质印迹显示分泌了小的22kD Col3分子。
用MMV502(MMV290的带His标签的版本)转化PP414,以生成PP547
将PP97的单个菌落接种在具有80mM脯氨酸的15ml YPD培养基中,并且在30℃处伴随振荡(250rpm)生长过夜。第二天,用具有80mM脯氨酸的新鲜YPD将培养基的体积加倍,并且在30℃处伴随振荡(250rpm)再生长一小时。将细胞以3,500g快速离心5分钟;用无菌水洗涤两次,重悬于10ml转化缓冲液(10mM Tris-Cl(pH 7.5)、100mM LiAc、0.6M山梨醇)中,添加10mM二硫苏糖醇(DTT)并且充分混合。将重悬液在室温处温育30分钟。将细胞以3,500×g快速离心5分钟并且将沉淀重悬于5ml冰冷的1M山梨醇中,并且以3,500×g再次快速离心5分钟。用5ml 1M山梨醇重复洗涤两次。将洗涤过的沉淀重悬于500μl冰冷的1M山梨醇中,取100μl该重悬液等分到预冷却的0.2cm电穿孔比色皿中。将MMV502的线性化DNA序列(图7)和MMV503的线性化DNA序列(图8)添加至细胞(在单独的比色皿中),并且通过吸移进行混合。还设置了阴性对照,其中将水而不是线性化DNA序列添加至细胞混合物。将混合物在冰上温育10分钟。温育之后,使用毕赤酵母属-WU方案(1500v,25uF,200W)通过脉冲进行电穿孔,使用Bio-Rad Gene Pulser Xcell
挑取在温育2天后出现在板上的菌落并且接种在含有500μg/ml的G418的BMGY培养基中。接种在2ml培养物中进行,并且以24孔的形式进行。将板在30℃处伴随振荡(900rpm)温育2天。将每个2ml培养物快速离心,将100mg沉淀重悬于1ml裂解缓冲液(50mM磷酸钠、5%甘油和1%EDTA,pH 7.5)中。使用组织裂解仪和Y基质珠裂解15分钟。将裂解物与SDS Licor负载染料以5:1的比率混合,在90℃处加热10分钟,然后上样在4%至12%Bis-Tris凝胶上。将凝胶转移到PVDF膜上。使用抗His抗体和抗胶原抗体进行蛋白质印迹分析。由于P4H带His标签,所以融合P4H在红色通道中显示为110kDa蛋白,而双向表达的P4HA/B在红色通道中在59kDa处出现。在印迹中没有观察到胶原条带,确认P4H质粒已转化,此时无胶原。示出融合P4H的高表达的克隆被确认为PP635,并且示出双向表达P4H的高表达的克隆被确认为PP636。
将每种菌株的单个菌落分别接种在50mL BMGY培养基中,同时在30℃处以250rpm恒定振荡过夜。第二天,用1L锥形瓶中过夜生长的培养物接种500mL新鲜的BMGY培养基,并且在30℃处伴随以250rpm恒定振荡生长2天。
将细胞(0.45g wcw(湿细胞重量))重悬于0.65ml裂解缓冲液(25mM Tris(pH7.5)、50mM NaCl、20mM咪唑)中,以获得45%悬液。在珠磨器中使用Matrix D珠将细胞裂解5个循环(在每两个循环之间冷却1分钟)以生成裂解物。将裂解物快速离心,以澄清上清液和沉淀(4℃,10分钟,16000*g)。移出澄清的裂解物并置于冰上。用2倍wcw的裂解缓冲液重悬沉淀,并且以16000*g离心10分钟,以收集更澄清的裂解物。将澄清的裂解物合并在一起。将Ni-NTA树脂(对于1g wcw为约0.025ml床体积并且适当放大)在去离子水中平衡三次,通过在4℃处以800*g离心2分钟将乙醇除去。将澄清的裂解物添加到平衡的Ni-NTA树脂中,并且在4℃处上下颠倒旋转温育过夜。通过在4℃处以800*g离心5分钟来收集上清液。用10倍柱体积的含有50mM咪唑的裂解缓冲液通过在4℃处以800*g离心2分钟来洗涤树脂。然后用10倍柱体积的50mM磷酸盐缓冲液(pH 7.4)、250mM咪唑通过在4℃处以800*g离心5分钟来洗涤树脂。在4℃处将蛋白质与洗脱缓冲液一起温育5分钟(上下颠倒旋转)之后,通过在4℃处以800*g离心5分钟,来用5ml含有300mM咪唑的裂解缓冲液将蛋白质洗脱。再进行2次洗脱(总共3次)。在SDSPAGE上分析样品(上清液和沉淀两者,连同全细胞裂解物)。将样品在50mMTris(pH 8.0)、100mM NaCl中用至少一次缓冲液更换进行透析(在至少100倍样品体积中透析),以生成经纯化的胶原裂解物。
1)按照下表制备用于40个反应的反应混合物(每个反应250ul)。
2)对于250ul反应物,将20ul上述混合物等分到每个管中(每种反应物一式三份地进行)。
3)添加1g/L BSA、0.1g/L过氧化氢酶和水,以将最终体积补足至250uL
4)添加5uM融合蛋白
5)添加2uM胶原样品
6)将反应物在32℃处温育2分钟
7)添加2.5ul的0.4M 2-氧化戊二酸并充分混合
8)在32℃处温育1小时
9)将100ul的每种反应物转移到新的管中,并且移交样品用于羟脯氨酸测定
1.制备以下溶液:
用Milli-Q水补足至100mL
1.41g 氯胺T
10mL 异丙醇
10mL Milli-Q水
4g 对二甲基苯甲醛(DMAB)
6mL 盐酸
14mL 异丙醇
4mL 氯胺T(来自上文)
16mL 柠檬酸盐/乙酸盐缓冲液(来自上文)
2.
a.将100uL含有胶原的体外羟基化反应物放入琥珀色玻璃小瓶中。
b.添加500uL浓HCl,并将小瓶盖紧。
c.将小瓶在加热块中在125℃处温育至少18小时。
d.使用快速真空将样品干燥。
e.用225uL Milli-Q水将干燥样品重悬于小瓶中。
f.以10,000X g将样品离心5分钟以除去析出物和碎片,并且取出上清液以用于测定。
3.
a.制备1000ug/mL的羟脯氨酸原液
b.使用该原液制备50ug/mL的最高标准浓度
c.使用50ug/mL溶液,使标准曲线具有以下浓度:25ug/mL、18.75ug/mL、12.5ug/mL、6.25ug/mL、3.125ug/mL
d.0ug/mL=水
e.将这些标准物置于96孔板中的孔A1至A7中,其平行样置于孔B1至B7中。
4.
a.按照步骤2a至2d,但是使用400uL的III型胶原(Abcam,ab7528)代替含有胶原的体外羟基化反应物
b.重悬于400uL Milli-Q水中
c.将内参置于96孔板的A8和B8中
5.
a.从III型胶原的原液小瓶中取出50uL等分试样,以在qSDS上运行。
b.使用由qSDS获得的浓度来计算内参的羟基化百分比。
6.
a.添加50uL标准物并且一式四份地取样(2个平行样将为其中不添加氯胺T的空白样)
b.对于待分析的每个反应物(包括标准曲线孔),添加100uL氯胺T/柠檬酸盐-乙酸盐溶液
c.对于
d.将板密封,并且在30℃处伴随振荡温育25分钟
e.添加100uL的埃尔利希氏溶液并将每个孔充分混合,直到孔澄清为止
f.将板密封,并且在65℃处伴随振荡温育25分钟
g.将板从热源移走,并且测量所有样品/空白样在560nm处的吸光度。
h.通过获得所用胶原的分子量来计算羟基化百分比。还需要所使用的所述胶原的螺旋区中的羟脯氨酸位点和脯氨酸的数目。
i.
PP685胶原的分子量=94,752g/mol
羟脯氨酸的分子量=131.13g/mol
螺旋区中的羟脯氨酸位点的数目=145
螺旋区中的脯氨酸位点的数目=246
IVOH反应中的PP685胶原浓度=0.084g/L
a.从IVOH反应的标准曲线获得的羟脯氨酸浓度
·3.91ug/mL
·使用乘法因子校正=3.1×3.91ug/mL=12.1ug/mL
b.以微克(ug)表示的羟脯氨酸浓度
·每孔使用50uL样品
·(50uL×12.1ug/mL)除以1000=0.607ug羟脯氨酸
c.IVOH反应中所使用的胶原的微克数
·每孔使用50uL样品
·(50uL×0.084g/L)乘以1×10
d.PP685胶原的nmol
·(4.2ug/1×10
·(4.2×10
mol
·4.4×10
e.羟脯氨酸的nmol
·(0.607ug/131.13g/mol)×1000=4.6nmol羟脯氨酸
f.脯氨酸的nmol
·0.044nmol胶原×246=10.8nmol脯氨酸
g.羟脯氨酸的百分比%
·(4.6nmol/10.8nmol)×100=42%羟基化
结果表明,在存在必要辅因子和适当反应条件(温度和pH)的情况下,两种菌株(PP547和PP635)中的融合蛋白均能够将胶原底物羟基化至比含有非融合蛋白的PP636菌株更高的%。PP547和PP635的不同之处在于前者中存在胶原的小片段,该小片段最初被认为是菌株以及蛋白质的稳定性所必需的。这表明融合蛋白是稳定的,并且与非融合蛋白相比可以在体外作为更好的双加氧酶起作用,从而提供优于非融合对应物的优点。P4HA和P4HB这两者的融合产生化学计算量的蛋白质,从而产生有助于蛋白质的结构和稳定性的功能性四聚体。%羟基化结果通过质谱确认。
-使用NaPO
对于体内羟基化,胶原是在粗面内质网中在几种分子伴侣和酶的帮助下合成的。胶原的折叠机制由蛋白质二硫键异构酶(PDI)辅助,PDI是本文所用的菌株中存在的P4HA-B融合蛋白的一部分。PDI有助于在蛋白质的非胶原性N端和C端中正确地形成二硫键,之后由该融合蛋白的P4HA部分将脯氨酸残基羟基化。参与形成羟基化反应的辅因子存在于ER(内质网)中,从而使ER成为体内羟基化的重要细胞器。一旦胶原被合成,它就被ER中存在的分子伴侣稳定并且被P4HA-B融合蛋白羟基化,其中B亚基进一步稳定和/或有助于三聚反应,而A亚基使用其双加氧酶活性将脯氨酸残基羟基化。
按照上述教导内容,本公开的许多修改和变型是可能的。因此,应当理解,在所附权利要求书的范围内,本公开可以以不同于本文具体描述的方式实施。
序列表
<110> Modern Meadow, Inc.
<120> 用于羟基化氨基酸的融合蛋白和产品
<130> 514761WO
<160> 21
<170> PatentIn版本3.5
<210> 1
<211> 1612
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 1
atgatttggt atatcctagt cgttggtatt ttgttgccac agtcactggc tcacccaggc 60
ttcttcactt ctataggaca gatgactgat ttgattcaca cagaaaaaga cctagttaca 120
agccttaaag actatatcaa agctgaagag gataagttgg agcaaatcaa aaagtgggca 180
gagaaactcg atagattgac tagtactgca acaaaagatc ctgagggttt tgtgggtcac 240
ccagtgaatg ctttcaagct gatgaagaga cttaatacag agtggtcaga attggaaaac 300
ttggtactta aagatatgag tgatggattc atttctaact taacaattca aagacaatac 360
tttccaaacg atgaggacca agtaggagca gcaaaagctt tgttgcgatt gcaggacaca 420
tacaatttgg acaccgacac gatatcgaag ggtgatttac ctggtgtgaa gcataagtcc 480
ttcctcactg tggaagattg ttttgaattg ggaaaagtcg catatacaga agccgactac 540
tatcacacag aattatggat ggagcaagct ctgcgtcagt tggacgaagg tgaagtttct 600
accgttgata aggtttcagt tttggattac ttatcatacg ctgtttacca gcaaggtgat 660
ctggacaaag ctctactttt aactaaaaag ttgttggagc tggacccgga gcatcaaaga 720
gctaacggta atctgaaata ctttgaatac atcatggcta aggaaaagga cgcaaataag 780
tcctcgtccg atgaccaatc cgatcaaaag accactctga aaaaaaaagg tgcagctgtt 840
gactacctcc cagagagaca aaagtatgaa atgctgtgta gaggagaggg tatcaagatg 900
actccaagga gacagaaaaa gctgttctgt agatatcatg atgggaaccg taacccaaaa 960
ttcattcttg ctccagcgaa acaggaagat gaatgggaca agcctagaat cattcgtttt 1020
catgacatca tctccgatgc agaaatagag gttgtgaaag acttggccaa accaagattg 1080
agtagggcta ccgtccatga ccctgagact ggaaaattga ctaccgcaca atatcgtgtc 1140
tctaaatcag catggttgtc cggttacgag aatcccgtgg tcagccgtat caatatgcgt 1200
attcaagatt tgactggtct tgacgtaagc actgctgagg aactacaagt tgccaactat 1260
ggtgtgggcg gtcagtatga accccacttt gatttcgcca gaaaggacga gcctgatgct 1320
tttaaggagc taggtactgg aaatagaatc gcaacgtggt tgttctatat gtccgatgtg 1380
cttgctggag gagccacagt tttccctgag gtaggtgctt ctgtttggcc taaaaagggc 1440
acggccgtat tttggtacaa tctgtttgca tctggagaag gtgattacag cactagacat 1500
gctgcttgtc ccgtcttagt cggtaataag tgggtttcca ataagtggct gcatgagaga 1560
ggtcaagagt ttaggaggcc atgcacattg tcagaattag aatgataatt tt 1612
<210> 2
<211> 1750
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 2
aaaatgagat tcccatctat tttcaccgct gtcttgttcg ctgcctcctc tgcattggct 60
gcccctgtta acactaccac tgaagacgag actgctcaaa ttccagctga agcagttatc 120
ggttactctg accttgaggg tgatttcgac gtcgctgttt tgcctttctc taactccact 180
aacaacggtt tgttgttcat taacaccact atcgcttcca ttgctgctaa ggaagagggt 240
gtctctctcg agaaaagaga ggccgaagct gcacccgatg aggaagatca tgttttagta 300
ttgcataaag gaaatttcga tgaagctttg gccgctcaca aatatctgct cgtcgagttt 360
tacgctccct ggtgcggtca ttgtaaggcc cttgcaccag agtacgccaa ggcagctggt 420
aagttaaagg ccgaaggttc agagatcaga ttagcaaaag ttgatgctac agaagagtcc 480
gatcttgctc aacaatacgg ggttcgagga tacccaacaa ttaagttttt caaaaatggt 540
gatactgctt ccccaaagga atatactgct ggtagagagg cagacgacat agtcaactgg 600
ctcaaaaaga gaacgggccc agctgcgtct acattaagcg acggagcagc agccgaagct 660
cttgtggaat ctagtgaagt tgctgtaatc ggtttcttta aggacatgga atctgattca 720
gctaaacagt tccttttagc agctgaagca atcgatgaca tccctttcgg aatcacctca 780
aatagtgacg tgttcagcaa gtaccaactt gacaaagatg gagtggtctt gttcaaaaag 840
tttgacgaag gcagaaacaa tttcgagggt gaggttacaa aggagaaact gcttgatttc 900
attaaacata accaactacc cttagttatc gaattcactg aacaaactgc tcctaagatt 960
ttcggtggag aaatcaaaac acatatcttg ttgtttttgc caaagtccgt atcggattat 1020
gaaggtaaac tctccaattt caaaaaggcc gctgagagct ttaagggcaa gattttgttc 1080
atctttattg actcagacca cacagacaat cagaggattt tggagttttt cggtttgaaa 1140
aaggaggaat gtccagcagt ccgtttgatc accttggagg aggagatgac caaatacaaa 1200
ccagagtcgg atgagttgac tgccgagaag ataacagaat tttgtcacag atttctggaa 1260
ggtaagatca agcctcatct tatgtctcaa gagttgcctg atgactggga taagcaacca 1320
gttaaagtat tggtgggtaa aaactttgag gaagtggcct tcgacgagaa aaaaaatgtc 1380
tttgttgaat tctatgctcc gtggtgtggt cactgtaagc agctggcacc aatttgggat 1440
aaactgggtg aaacttacaa agatcacgaa aacattgtta ttgcaaagat ggacagtact 1500
gctaacgaag tggaggctgt gaaagttcac tccttcccta cgctgaagtt ctttcctgca 1560
tctgctgaca gaactgttat cgactataat ggagagagga cattggatgg ttttaaaaag 1620
tttcttgaat ccggaggtca agacggagct ggtgacgacg atgatttgga agatctggag 1680
gaggctgagg aacctgatct tgaggaggat gacgaccaga aggcagtcaa agatgaactg 1740
tgataagggg 1750
<210> 3
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 3
ctcaattgtt gtttatatca ttgctattta aatcaggtga acccacctaa ctattttt 58
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 4
ttttgttgtt gagtgaagcg agtgacggaa 30
<210> 5
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 5
ttccgtcact cgcttcactc aacaacaaaa atgatttggt atatcctagt cgttggtatt 60
<210> 6
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 6
ttctaattct gacaatgtgc atggcctcct 30
<210> 7
<211> 84
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 7
aggaggccat gcacattgtc agaattagaa ggttctggct ctggttctgg ctctatgaga 60
ttcccatcta ttttcaccgc tgtc 84
<210> 8
<211> 69
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 8
ctgcaacaaa agaaacaaga cattactgaa gggccggccg cacaaacgaa ggtctcactt 60
aatcttctg 69
<210> 9
<211> 10109
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 9
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600
cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660
gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720
ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780
tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840
gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900
cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960
attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020
tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080
cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140
gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200
tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260
aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320
gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380
tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440
tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500
gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560
tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620
tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680
gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740
atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800
attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcatcagaat 1860
tggttaattg gttgtaacac tgacccctat ttgtttattt ttctaaatac attcaaatat 1920
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagaa 1980
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 2040
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 2100
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 2160
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 2220
ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 2280
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 2340
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 2400
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 2460
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 2520
gcctgtagcg atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 2580
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 2640
ctcggccctt ccggctggct ggtttattgc tgataaatcc ggagccggtg agcgtggttc 2700
tcgcggtatc atcgcagcgc tggggccaga tggtaagccc tcccgtatcg tagttatcta 2760
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 2820
ctcactgatt aagcattggt aactgcagga aaagggtacc actgagcgtc agaccccgta 2880
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 2940
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 3000
tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 3060
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 3120
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggaccca 3180
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 3240
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 3300
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 3360
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 3420
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 3480
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 3540
gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt ttgtaagtaa 3600
acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta tatatcaggc 3660
atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg atataggtat 3720
gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg caggaggaaa 3780
agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt aaacacatgg 3840
ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga tcattcgagt 3900
ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt tcatctgggt 3960
ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca gatgaggagg 4020
atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac aaagtagacc 4080
tgtcactcaa ttgttgttta tatcattgct atttaaataa tgtatctaaa cgcaaactcc 4140
gagctggaaa aatgttaccg gcgatgcgcg gacaatttag aggcggcgat caagaaacac 4200
ctgctgggcg agcagtctgg agcacagtct tcgatgggcc cgagatccca ccgcgttcct 4260
gggtaccggg acgtgaggca gcgcgacatc catcaaatat accaggcgcc aaccgagtgt 4320
ctcggaaaac agcttctgga tatcttccgc tggcggcgca acgacgaata atagtccctg 4380
gaggtgacgg aatatatatg tgtggagggt aaatctgaca gggtgtagca aaggtaatat 4440
tttcctaaaa catgcaatcg gctgccccgc aacgggaaaa agaatgactt tggcactctt 4500
caccagagtg gggtgtcccg ctcgtgtgtg caaataggct cccactggtc accccggatt 4560
ttgcagaaaa acagcaagtt ccggggtgtc tcactggtgt ccgccaataa gaggagccgg 4620
caggcacgga gtttacatca agctgtctcc gatacactcg actaccatcc gggtctctca 4680
gagaggggaa tggcactata aataccgcct ccttgcgctc tctgccttca tcaatcaaat 4740
catgctgagg actcgaattc gacctctgtt gcctctttgt tggacgaacc attcaccggt 4800
gtcttgtact taaagggcag tggtatcact gaagacttcc agtccctaaa gggtaagaag 4860
atcggttacg ttggtgactt cggtaagatc caaatcgatg aattgaccaa gcactacggt 4920
atgaagccag aagactacac cgccgtcaga tgtggtatga atgtcgccaa gtacatcatc 4980
gaaggtaaga ttgatgccgg tattggtatc gaatgtatgc aacaagtcga attggaagag 5040
tacttggcca agcaaggcag accagcttct gatgctaaaa tgttgagaat tgacaagttg 5100
gcttgcttgg gttgctgttg cttctgtacc gttctttaca tctgcaacga tgaatttttg 5160
aagaagaacc ctgaaaaggt cagaaagttc ttgaaagcca tcaagaaggc aaccgactac 5220
gttctagccg accctgtgaa ggcttggaaa gaatacatcg acttcaagcc tcaattgaac 5280
aacgatctat cctacaagca ataccaaaga tgttacgctt acttctcttc atctttgtac 5340
aatgttcacc gtgactggaa gaaggttacc ggttacggta agagattagc catcttgcca 5400
ccagactatg tctcgaacta cactaatgaa tacttgtcct ggccagaacc agaagaggtt 5460
tctgatcctt tggaagctca aagattgatg gctattcatc aagaaaaatg cagacaggaa 5520
ggtactttca agagattggc tcttccagct taagcggccg cgagtcgtga gtaatcaaga 5580
ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac ttttttattt 5640
gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac gagcttgctc 5700
ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg aaaatcattc 5760
gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag attaagtgag 5820
acgttcgttt gtgctccgga caggtgaacc cacctaacta tttttaactg ggatccagtg 5880
agctcgctgg gtgaaagcca accatctttt gtttcgggga accgtgctcg ccccgtaaag 5940
ttaatttttt tttcccgcgc agctttaatc tttcggcaga gaaggcgttt tcatcgtagc 6000
gtgggaacag aataatcagt tcatgtgcta tacaggcaca tggcagcagt cactattttg 6060
ctttttaacc ttaaagtcgt tcatcaatca ttaactgacc aatcagattt tttgcatttg 6120
ccacttatct aaaaatactt ttgtatctcg cagatacgtt cagtggtttc caggacaaca 6180
cccaaaaaaa ggtatcaatg ccactaggca gtcggtttta tttttggtca cccacgcaaa 6240
gaagcaccca cctcttttag gttttaagtt gtgggaacag taacaccgcc tagagcttca 6300
ggaaaaacca gtacctgtga ccgcaattca ccatgatgca gaatgttaat ttaaacgagt 6360
gccaaatcaa gatttcaaca gacaaatcaa tcgatccata gttacccatt ccagcctttt 6420
cgtcgtcgag cctgcttcat tcctgcctca ggtgcataac tttgcatgaa aagtccagat 6480
tagggcagat tttgagttta aaataggaaa tataaacaaa tataccgcga aaaaggtttg 6540
tttatagctt ttcgcctggt gccgtacggt ataaatacat actctcctcc cccccctggt 6600
tctctttttc ttttgttact tacattttac cgttccgtca ctcgcttcac tcaacaacaa 6660
aaatgatttg gtatatccta gtcgttggta ttttgttgcc acagtcactg gctcacccag 6720
gcttcttcac ttctatagga cagatgactg atttgattca cacagaaaaa gacctagtta 6780
caagccttaa agactatatc aaagctgaag aggataagtt ggagcaaatc aaaaagtggg 6840
cagagaaact cgatagattg actagtactg caacaaaaga tcctgagggt tttgtgggtc 6900
acccagtgaa tgctttcaag ctgatgaaga gacttaatac agagtggtca gaattggaaa 6960
acttggtact taaagatatg agtgatggat tcatttctaa cttaacaatt caaagacaat 7020
actttccaaa cgatgaggac caagtaggag cagcaaaagc tttgttgcga ttgcaggaca 7080
catacaattt ggacaccgac acgatatcga agggtgattt acctggtgtg aagcataagt 7140
ccttcctcac tgtggaagat tgttttgaat tgggaaaagt cgcatataca gaagccgact 7200
actatcacac agaattatgg atggagcaag ctctgcgtca gttggacgaa ggtgaagttt 7260
ctaccgttga taaggtttca gttttggatt acttatcata cgctgtttac cagcaaggtg 7320
atctggacaa agctctactt ttaactaaaa agttgttgga gctggacccg gagcatcaaa 7380
gagctaacgg taatctgaaa tactttgaat acatcatggc taaggaaaag gacgcaaata 7440
agtcctcgtc cgatgaccaa tccgatcaaa agaccactct gaaaaaaaaa ggtgcagctg 7500
ttgactacct cccagagaga caaaagtatg aaatgctgtg tagaggagag ggtatcaaga 7560
tgactccaag gagacagaaa aagctgttct gtagatatca tgatgggaac cgtaacccaa 7620
aattcattct tgctccagcg aaacaggaag atgaatggga caagcctaga atcattcgtt 7680
ttcatgacat catctccgat gcagaaatag aggttgtgaa agacttggcc aaaccaagat 7740
tgagtagggc taccgtccat gaccctgaga ctggaaaatt gactaccgca caatatcgtg 7800
tctctaaatc agcatggttg tccggttacg agaatcccgt ggtcagccgt atcaatatgc 7860
gtattcaaga tttgactggt cttgacgtaa gcactgctga ggaactacaa gttgccaact 7920
atggtgtggg cggtcagtat gaaccccact ttgatttcgc cagaaaggac gagcctgatg 7980
cttttaagga gctaggtact ggaaatagaa tcgcaacgtg gttgttctat atgtccgatg 8040
tgcttgctgg aggagccaca gttttccctg aggtaggtgc ttctgtttgg cctaaaaagg 8100
gcacggccgt attttggtac aatctgtttg catctggaga aggtgattac agcactagac 8160
atgctgcttg tcccgtctta gtcggtaata agtgggtttc caataagtgg ctgcatgaga 8220
gaggtcaaga gtttaggagg ccatgcacat tgtcagaatt agaaggttct ggctctggtt 8280
ctggctctat gagattccca tctattttca ccgctgtctt gttcgctgcc tcctctgcat 8340
tggctgcacc cgatgaggaa gatcatgttt tagtattgca taaaggaaat ttcgatgaag 8400
ctttggccgc tcacaaatat ctgctcgtcg agttttacgc tccctggtgc ggtcattgta 8460
aggcccttgc accagagtac gccaaggcag ctggtaagtt aaaggccgaa ggttcagaga 8520
tcagattagc aaaagttgat gctacagaag agtccgatct tgctcaacaa tacggggttc 8580
gaggataccc aacaattaag tttttcaaaa atggtgatac tgcttcccca aaggaatata 8640
ctgctggtag agaggcagac gacatagtca actggctcaa aaagagaacg ggcccagctg 8700
cgtctacatt aagcgacgga gcagcagccg aagctcttgt ggaatctagt gaagttgctg 8760
taatcggttt ctttaaggac atggaatctg attcagctaa acagttcctt ttagcagctg 8820
aagcaatcga tgacatccct ttcggaatca cctcaaatag tgacgtgttc agcaagtacc 8880
aacttgacaa agatggagtg gtcttgttca aaaagtttga cgaaggcaga aacaatttcg 8940
agggtgaggt tacaaaggag aaactgcttg atttcattaa acataaccaa ctacccttag 9000
ttatcgaatt cactgaacaa actgctccta agattttcgg tggagaaatc aaaacacata 9060
tcttgttgtt tttgccaaag tccgtatcgg attatgaagg taaactctcc aatttcaaaa 9120
aggccgctga gagctttaag ggcaagattt tgttcatctt tattgactca gaccacacag 9180
acaatcagag gattttggag tttttcggtt tgaaaaagga ggaatgtcca gcagtccgtt 9240
tgatcacctt ggaggaggag atgaccaaat acaaaccaga gtcggatgag ttgactgccg 9300
agaagataac agaattttgt cacagatttc tggaaggtaa gatcaagcct catcttatgt 9360
ctcaagagtt gcctgatgac tgggataagc aaccagttaa agtattggtg ggtaaaaact 9420
ttgaggaagt ggccttcgac gagaaaaaaa atgtctttgt tgaattctat gctccgtggt 9480
gtggtcactg taagcagctg gcaccaattt gggataaact gggtgaaact tacaaagatc 9540
acgaaaacat tgttattgca aagatggaca gtactgctaa cgaagtggag gctgtgaaag 9600
ttcactcctt ccctacgctg aagttctttc ctgcatctgc tgacagaact gttatcgact 9660
ataatggaga gaggacattg gatggtttta aaaagtttct tgaatccgga ggtcaagacg 9720
gagctggtga cgacgatgat ttggaagatc tggaggaggc tgaggaacct gatcttgagg 9780
aggatgacga ccagaaggca gtcaaagatg aactgtgata aggggtcaag aggatgtcag 9840
aatgccattt gcctgagaga tgcaggcttc atttttgata cttttttatt tgtaacctat 9900
atagtatagg attttttttg tcattttgtt tcttctcgta cgagcttgct cctgatcagc 9960
ctatctcgca gcagatgaat atcttgtggt aggggtttgg gaaaatcatt cgagtttgat 10020
gtttttcttg gtatttccca ctcctcttca gagtacagaa gattaagtga gaccttcgtt 10080
tgtgcggttc tggctctggt tctggctct 10109
<210> 10
<211> 10075
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 10
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600
cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660
gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720
ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780
tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840
gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900
cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960
attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020
tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080
cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140
gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200
tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260
aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320
gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380
tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440
tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500
gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560
tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620
tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680
gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740
atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800
attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcatcagaat 1860
tggttaattg gttgtaacac tgacccctat ttgtttattt ttctaaatac attcaaatat 1920
gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa aaaggaagaa 1980
tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat tttgccttcc 2040
tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc agttgggtgc 2100
acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga gttttcgccc 2160
cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg cggtattatc 2220
ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc agaatgactt 2280
ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag taagagaatt 2340
atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc tgacaacgat 2400
cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg taactcgcct 2460
tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg acaccacgat 2520
gcctgtagcg atggcaacaa cgttgcgcaa actattaact ggcgaactac ttactctagc 2580
ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac cacttctgcg 2640
ctcggccctt ccggctggct ggtttattgc tgataaatcc ggagccggtg agcgtggttc 2700
tcgcggtatc atcgcagcgc tggggccaga tggtaagccc tcccgtatcg tagttatcta 2760
cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg agataggtgc 2820
ctcactgatt aagcattggt aactgcagga aaagggtacc actgagcgtc agaccccgta 2880
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 2940
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 3000
tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 3060
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 3120
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggaccca 3180
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 3240
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 3300
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 3360
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 3420
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 3480
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 3540
gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt ttgtaagtaa 3600
acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta tatatcaggc 3660
atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg atataggtat 3720
gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg caggaggaaa 3780
agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt aaacacatgg 3840
ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga tcattcgagt 3900
ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt tcatctgggt 3960
ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca gatgaggagg 4020
atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac aaagtagacc 4080
tgtcactcaa ttgttgttta tatcattgct atttaaataa tgtatctaaa cgcaaactcc 4140
gagctggaaa aatgttaccg gcgatgcgcg gacaatttag aggcggcgat caagaaacac 4200
ctgctgggcg agcagtctgg agcacagtct tcgatgggcc cgagatccca ccgcgttcct 4260
gggtaccggg acgtgaggca gcgcgacatc catcaaatat accaggcgcc aaccgagtgt 4320
ctcggaaaac agcttctgga tatcttccgc tggcggcgca acgacgaata atagtccctg 4380
gaggtgacgg aatatatatg tgtggagggt aaatctgaca gggtgtagca aaggtaatat 4440
tttcctaaaa catgcaatcg gctgccccgc aacgggaaaa agaatgactt tggcactctt 4500
caccagagtg gggtgtcccg ctcgtgtgtg caaataggct cccactggtc accccggatt 4560
ttgcagaaaa acagcaagtt ccggggtgtc tcactggtgt ccgccaataa gaggagccgg 4620
caggcacgga gtttacatca agctgtctcc gatacactcg actaccatcc gggtctctca 4680
gagaggggaa tggcactata aataccgcct ccttgcgctc tctgccttca tcaatcaaat 4740
catgctgagg actcgaattc gacctctgtt gcctctttgt tggacgaacc attcaccggt 4800
gtcttgtact taaagggcag tggtatcact gaagacttcc agtccctaaa gggtaagaag 4860
atcggttacg ttggtgactt cggtaagatc caaatcgatg aattgaccaa gcactacggt 4920
atgaagccag aagactacac cgccgtcaga tgtggtatga atgtcgccaa gtacatcatc 4980
gaaggtaaga ttgatgccgg tattggtatc gaatgtatgc aacaagtcga attggaagag 5040
tacttggcca agcaaggcag accagcttct gatgctaaaa tgttgagaat tgacaagttg 5100
gcttgcttgg gttgctgttg cttctgtacc gttctttaca tctgcaacga tgaatttttg 5160
aagaagaacc ctgaaaaggt cagaaagttc ttgaaagcca tcaagaaggc aaccgactac 5220
gttctagccg accctgtgaa ggcttggaaa gaatacatcg acttcaagcc tcaattgaac 5280
aacgatctat cctacaagca ataccaaaga tgttacgctt acttctcttc atctttgtac 5340
aatgttcacc gtgactggaa gaaggttacc ggttacggta agagattagc catcttgcca 5400
ccagactatg tctcgaacta cactaatgaa tacttgtcct ggccagaacc agaagaggtt 5460
tctgatcctt tggaagctca aagattgatg gctattcatc aagaaaaatg cagacaggaa 5520
ggtactttca agagattggc tcttccagct taagcggccg cgagtcgtga gtaatcaaga 5580
ggatgtcaga atgccatttg cctgagagat gcaggcttca tttttgatac ttttttattt 5640
gtaacctata tagtatagga ttttttttgt cattttgttt cttctcgtac gagcttgctc 5700
ctgatcagcc tatctcgcag ctgatgaata tcttgtggta ggggtttggg aaaatcattc 5760
gagtttgatg tttttcttgg tatttcccac tcctcttcag agtacagaag attaagtgag 5820
acgttcgttt gtgctccgga caggtgaacc cacctaacta tttttaactg ggatccagtg 5880
agctcgctgg gtgaaagcca accatctttt gtttcgggga accgtgctcg ccccgtaaag 5940
ttaatttttt tttcccgcgc agctttaatc tttcggcaga gaaggcgttt tcatcgtagc 6000
gtgggaacag aataatcagt tcatgtgcta tacaggcaca tggcagcagt cactattttg 6060
ctttttaacc ttaaagtcgt tcatcaatca ttaactgacc aatcagattt tttgcatttg 6120
ccacttatct aaaaatactt ttgtatctcg cagatacgtt cagtggtttc caggacaaca 6180
cccaaaaaaa ggtatcaatg ccactaggca gtcggtttta tttttggtca cccacgcaaa 6240
gaagcaccca cctcttttag gttttaagtt gtgggaacag taacaccgcc tagagcttca 6300
ggaaaaacca gtacctgtga ccgcaattca ccatgatgca gaatgttaat ttaaacgagt 6360
gccaaatcaa gatttcaaca gacaaatcaa tcgatccata gttacccatt ccagcctttt 6420
cgtcgtcgag cctgcttcat tcctgcctca ggtgcataac tttgcatgaa aagtccagat 6480
tagggcagat tttgagttta aaataggaaa tataaacaaa tataccgcga aaaaggtttg 6540
tttatagctt ttcgcctggt gccgtacggt ataaatacat actctcctcc cccccctggt 6600
tctctttttc ttttgttact tacattttac cgttccgtca ctcgcttcac tcaacaacaa 6660
aaatgagatt cccatctatt ttcaccgctg tcttgttcgc tgcctcctct gcattggctg 6720
cacccgatga ggaagatcat gttttagtat tgcataaagg aaatttcgat gaagctttgg 6780
ccgctcacaa atatctgctc gtcgagtttt acgctccctg gtgcggtcat tgtaaggccc 6840
ttgcaccaga gtacgccaag gcagctggta agttaaaggc cgaaggttca gagatcagat 6900
tagcaaaagt tgatgctaca gaagagtccg atcttgctca acaatacggg gttcgaggat 6960
acccaacaat taagtttttc aaaaatggtg atactgcttc cccaaaggaa tatactgctg 7020
gtagagaggc agacgacata gtcaactggc tcaaaaagag aacgggccca gctgcgtcta 7080
cattaagcga cggagcagca gccgaagctc ttgtggaatc tagtgaagtt gctgtaatcg 7140
gtttctttaa ggacatggaa tctgattcag ctaaacagtt ccttttagca gctgaagcaa 7200
tcgatgacat ccctttcgga atcacctcaa atagtgacgt gttcagcaag taccaacttg 7260
acaaagatgg agtggtcttg ttcaaaaagt ttgacgaagg cagaaacaat ttcgagggtg 7320
aggttacaaa ggagaaactg cttgatttca ttaaacataa ccaactaccc ttagttatcg 7380
aattcactga acaaactgct cctaagattt tcggtggaga aatcaaaaca catatcttgt 7440
tgtttttgcc aaagtccgta tcggattatg aaggtaaact ctccaatttc aaaaaggccg 7500
ctgagagctt taagggcaag attttgttca tctttattga ctcagaccac acagacaatc 7560
agaggatttt ggagtttttc ggtttgaaaa aggaggaatg tccagcagtc cgtttgatca 7620
ccttggagga ggagatgacc aaatacaaac cagagtcgga tgagttgact gccgagaaga 7680
taacagaatt ttgtcacaga tttctggaag gtaagatcaa gcctcatctt atgtctcaag 7740
agttgcctga tgactgggat aagcaaccag ttaaagtatt ggtgggtaaa aactttgagg 7800
aagtggcctt cgacgagaaa aaaaatgtct ttgttgaatt ctatgctccg tggtgtggtc 7860
actgtaagca gctggcacca atttgggata aactgggtga aacttacaaa gatcacgaaa 7920
acattgttat tgcaaagatg gacagtactg ctaacgaagt ggaggctgtg aaagttcact 7980
ccttccctac gctgaagttc tttcctgcat ctgctgacag aactgttatc gactataatg 8040
gagagaggac attggatggt tttaaaaagt ttcttgaatc cggaggtcaa gacggagctg 8100
gtgacgacga tgatttggaa gatctggagg aggctgagga acctgatctt gaggaggatg 8160
acgaccagaa ggcagtcaaa gatgaactgg gttctggctc tggttctggc tctatgattt 8220
ggtatatcct agtcgttggt attttgttgc cacagtcact ggctcaccca ggcttcttca 8280
cttctatagg acagatgact gatttgattc acacagaaaa agacctagtt acaagcctta 8340
aagactatat caaagctgaa gaggataagt tggagcaaat caaaaagtgg gcagagaaac 8400
tcgatagatt gactagtact gcaacaaaag atcctgaggg ttttgtgggt cacccagtga 8460
atgctttcaa gctgatgaag agacttaata cagagtggtc agaattggaa aacttggtac 8520
ttaaagatat gagtgatgga ttcatttcta acttaacaat tcaaagacaa tactttccaa 8580
acgatgagga ccaagtagga gcagcaaaag ctttgttgcg attgcaggac acatacaatt 8640
tggacaccga cacgatatcg aagggtgatt tacctggtgt gaagcataag tccttcctca 8700
ctgtggaaga ttgttttgaa ttgggaaaag tcgcatatac agaagccgac tactatcaca 8760
cagaattatg gatggagcaa gctctgcgtc agttggacga aggtgaagtt tctaccgttg 8820
ataaggtttc agttttggat tacttatcat acgctgttta ccagcaaggt gatctggaca 8880
aagctctact tttaactaaa aagttgttgg agctggaccc ggagcatcaa agagctaacg 8940
gtaatctgaa atactttgaa tacatcatgg ctaaggaaaa ggacgcaaat aagtcctcgt 9000
ccgatgacca atccgatcaa aagaccactc tgaaaaaaaa aggtgcagct gttgactacc 9060
tcccagagag acaaaagtat gaaatgctgt gtagaggaga gggtatcaag atgactccaa 9120
ggagacagaa aaagctgttc tgtagatatc atgatgggaa ccgtaaccca aaattcattc 9180
ttgctccagc gaaacaggaa gatgaatggg acaagcctag aatcattcgt tttcatgaca 9240
tcatctccga tgcagaaata gaggttgtga aagacttggc caaaccaaga ttgagtaggg 9300
ctaccgtcca tgaccctgag actggaaaat tgactaccgc acaatatcgt gtctctaaat 9360
cagcatggtt gtccggttac gagaatcccg tggtcagccg tatcaatatg cgtattcaag 9420
atttgactgg tcttgacgta agcactgctg aggaactaca agttgccaac tatggtgtgg 9480
gcggtcagta tgaaccccac tttgatttcg ccagaaagga cgagcctgat gcttttaagg 9540
agctaggtac tggaaataga atcgcaacgt ggttgttcta tatgtccgat gtgcttgctg 9600
gaggagccac agttttccct gaggtaggtg cttctgtttg gcctaaaaag ggcacggccg 9660
tattttggta caatctgttt gcatctggag aaggtgatta cagcactaga catgctgctt 9720
gtcccgtctt agtcggtaat aagtgggttt ccaataagtg gctgcatgag agaggtcaag 9780
agtttaggag gccatgcaca ttgtcagaat tagaatgata attttacggg aagtctttac 9840
agttttagtt aggagccctt atatatgaca gtaatgctag tacgttttgt tttgtttaat 9900
taataactta gtttatgtta gcctagtata gactccatca attttttttg ttattacgta 9960
agccgcgatg ataatatctg atgaaaaatt cctatcagaa aataatttat caaaagtttc 10020
atgcgatatg agactaagta gaatagggac tcccaaagtg tcagtcacaa gggtc 10075
<210> 11
<211> 8413
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 11
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc ctctagaatg ggtaaggaaa agactcacgt ttcgaggccg 600
cgattaaatt ccaacatgga tgctgattta tatgggtata aatgggctcg cgataatgtc 660
gggcaatcag gtgcgacaat ctatcgattg tatgggaagc ccgatgcgcc agagttgttt 720
ctgaaacatg gcaaaggtag cgttgccaat gatgttacag atgagatggt cagactaaac 780
tggctgacgg aatttatgcc tcttccgacc atcaagcatt ttatccgtac tcctgatgat 840
gcatggttac tcaccactgc gatccccggc aaaacagcat tccaggtatt agaagaatat 900
cctgattcag gtgaaaatat tgttgatgcg ctggcagtgt tcctgcgccg gttgcattcg 960
attcctgttt gtaattgtcc ttttaacagc gatcgcgtat ttcgtctcgc tcaggcgcaa 1020
tcacgaatga ataacggttt ggttgatgcg agtgattttg atgacgagcg taatggctgg 1080
cctgttgaac aagtctggaa agaaatgcat aagcttttgc cattctcacc ggattcagtc 1140
gtcactcatg gtgatttctc acttgataac cttatttttg acgaggggaa attaataggt 1200
tgtattgatg ttggacgagt cggaatcgca gaccgatacc aggatcttgc catcctatgg 1260
aactgcctcg gtgagttttc tccttcatta cagaaacggc tttttcaaaa atatggtatt 1320
gataatcctg atatgaataa attgcagttt catttgatgc tcgatgagtt tttctaaaat 1380
tgacacctta cgattattta gagagtattt attagtttta ttgtatgtat acggatgttt 1440
tattatctat ttatgccctt atattctgta actatccaaa agtcctatct tatcaagcca 1500
gcaatctatg tccgcgaacg tcaactaaaa ataagctttt tatgctgttc tctctttttt 1560
tcccttcggt ataattatac cttgcatcca cagattctcc tgccaaattt tgcataatcc 1620
tttacaacat ggctatatgg gagcacttag cgccctccaa aacccatatt gcctacgcat 1680
gtataggtgt tttttccaca atattttctc tgtgctctct ttttattaaa gagaagctct 1740
atatcggaga agcttctgtg gccgttatat tcggccttat cgtgggacca cattgcctga 1800
attggtttgc cccggaagat tggggaaact tggatctgat taccttagct gcattaccaa 1860
tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 1920
tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagcgct 1980
gcgatgatac cgcgagaacc acgctcaccg gctccggatt tatcagcaat aaaccagcca 2040
gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 2100
aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 2160
gccatcgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 2220
ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 2280
tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 2340
atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 2400
ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 2460
ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 2520
ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 2580
atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 2640
gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 2700
tgttgaatac tcatattctt cctttttcaa tattattgaa gcatttatca gggttattgt 2760
ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggtcagtgtt 2820
acaaccaatt aaccaattct gaaaggaaga atctgcagga aaagggtacc actgagcgtc 2880
agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg 2940
ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct 3000
accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct 3060
tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct 3120
cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg 3180
gttggaccca agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc 3240
gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga 3300
gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg 3360
cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta 3420
tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg 3480
ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg 3540
ctggcctttt gctcacatgt tttgttcgat tattctccag ataaaatcaa caatagttgt 3600
ttgtaagtaa acgaatcaag atactgaaaa tagtttcaaa agcagatcat ctgggattta 3660
tatatcaggc atcctgcttt agttcttttt tgaacccaaa ggctatctga tgaaaagttg 3720
atataggtat gaagaccaga atttgcctag aggctaaccg agacctgagg ctaaaaaagg 3780
caggaggaaa agtcctgcca aagataggta tttgaacttg ttcgaaaaag gcggaagttt 3840
aaacacatgg ttggagcaag cggcggaata gcggagggat gatacgcagc aaggctggga 3900
tcattcgagt ttcaaggaac gttagctcaa cattcattga ctggtaagcg acaactggtt 3960
tcatctgggt ggagttagtc tggtgttggg atgctagttg ttccccacaa ttgaaggcca 4020
gatgaggagg atggtgtggt gataagagat gcaaacagat ggttatggcc ttttgagaac 4080
aaagtagacc tgtcactcaa ttgttgttta tatcattgct atttaaatca ggtgaaccca 4140
cctaactatt tttaactggc atccagtgag ctcgctgggt gaaagccaac catcttttgt 4200
ttcggggaac cgtgctcgcc ccgtaaagtt aatttttttt tcccgcgcag ctttaatctt 4260
tcggcagaga aggcgttttc atcgtagcgt gggaacagaa taatcagttc atgtgctata 4320
caggcacatg gcagcagtca ctattttgct ttttaacctt aaagtcgttc atcaatcatt 4380
aactgaccaa tcagattttt tgcatttgcc acttatctaa aaatactttt gtatctcgca 4440
gatacgttca gtggtttcca ggacaacacc caaaaaaagg tatcaatgcc actaggcagt 4500
cggttttatt tttggtcacc cacgcaaaga agcacccacc tcttttaggt tttaagttgt 4560
gggaacagta acaccgccta gagcttcagg aaaaaccagt acctgtgacc gcaattcacc 4620
atgatgcaga atgttaattt aaacgagtgc caaatcaaga tttcaacaga caaatcaatc 4680
gatccatagt tacccattcc agccttttcg tcgtcgagcc tgcttcattc ctgcctcagg 4740
tgcataactt tgcatgaaaa gtccagatta gggcagattt tgagtttaaa ataggaaata 4800
taaacaaata taccgcgaaa aaggtttgtt tatagctttt cgcctggtgc cgtacggtat 4860
aaatacatac tctcctcccc cccctggttc tctttttctt ttgttactta cattttaccg 4920
ttccgtcact cgcttcactc aacaacaaaa atgttctctc caattttgtc cttggaaatt 4980
attttagctt tggctacttt gcaatctgtc ttcgctcacc caggcttctt cacttctata 5040
ggacagatga ctgatttgat tcacacagaa aaagacctag ttacaagcct taaagactat 5100
atcaaagctg aagaggataa gttggagcaa atcaaaaagt gggcagagaa actcgataga 5160
ttgactagta ctgcaacaaa agatcctgag ggttttgtgg gtcacccagt gaatgctttc 5220
aagctgatga agagacttaa tacagagtgg tcagaattgg aaaacttggt acttaaagat 5280
atgagtgatg gattcatttc taacttaaca attcaaagac aatactttcc aaacgatgag 5340
gaccaagtag gagcagcaaa agctttgttg cgattgcagg acacatacaa tttggacacc 5400
gacacgatat cgaagggtga tttacctggt gtgaagcata agtccttcct cactgtggaa 5460
gattgttttg aattgggaaa agtcgcatat acagaagccg actactatca cacagaatta 5520
tggatggagc aagctctgcg tcagttggac gaaggtgaag tttctaccgt tgataaggtt 5580
tcagttttgg attacttatc atacgctgtt taccagcaag gtgatctgga caaagctcta 5640
cttttaacta aaaagttgtt ggagctggac ccggagcatc aaagagctaa cggtaatctg 5700
aaatactttg aatacatcat ggctaaggaa aaggacgcaa ataagtcctc gtccgatgac 5760
caatccgatc aaaagaccac tctgaaaaaa aaaggtgcag ctgttgacta cctcccagag 5820
agacaaaagt atgaaatgct gtgtagagga gagggtatca agatgactcc aaggagacag 5880
aaaaagctgt tctgtagata tcatgatggg aaccgtaacc caaaattcat tcttgctcca 5940
gcgaaacagg aagatgaatg ggacaagcct agaatcattc gttttcatga catcatctcc 6000
gatgcagaaa tagaggttgt gaaagacttg gccaaaccaa gattgagtag ggctaccgtc 6060
catgaccctg agactggaaa attgactacc gcacaatatc gtgtctctaa atcagcatgg 6120
ttgtccggtt acgagaatcc cgtggtcagc cgtatcaata tgcgtattca agatttgact 6180
ggtcttgacg taagcactgc tgaggaacta caagttgcca actatggtgt gggcggtcag 6240
tatgaacccc actttgattt cgccagaaag gacgagcctg atgcttttaa ggagctaggt 6300
actggaaata gaatcgcaac gtggttgttc tatatgtccg atgtgcttgc tggaggagcc 6360
acagttttcc ctgaggtagg tgcttctgtt tggcctaaaa agggcacggc cgtattttgg 6420
tacaatctgt ttgcatctgg agaaggtgat tacagcacta gacatgctgc ttgtcccgtc 6480
ttagtcggta ataagtgggt ttccaataag tggctgcatg agagaggtca agagtttagg 6540
aggccatgca cattgtcaga attagaaggt tctggctctg gttctggctc tatgagattc 6600
ccatctattt tcaccgctgt cttgttcgct gcctcctctg cattggctgc acccgatgag 6660
gaagatcatg ttttagtatt gcataaagga aatttcgatg aagctttggc cgctcacaaa 6720
tatctgctcg tcgagtttta cgctccctgg tgcggtcatt gtaaggccct tgcaccagag 6780
tacgccaagg cagctggtaa gttaaaggcc gaaggttcag agatcagatt agcaaaagtt 6840
gatgctacag aagagtccga tcttgctcaa caatacgggg ttcgaggata cccaacaatt 6900
aagtttttca aaaatggtga tactgcttcc ccaaaggaat atactgctgg tagagaggca 6960
gacgacatag tcaactggct caaaaagaga acgggcccag ctgcgtctac attaagcgac 7020
ggagcagcag ccgaagctct tgtggaatct agtgaagttg ctgtaatcgg tttctttaag 7080
gacatggaat ctgattcagc taaacagttc cttttagcag ctgaagcaat cgatgacatc 7140
cctttcggaa tcacctcaaa tagtgacgtg ttcagcaagt accaacttga caaagatgga 7200
gtggtcttgt tcaaaaagtt tgacgaaggc agaaacaatt tcgagggtga ggttacaaag 7260
gagaaactgc ttgatttcat taaacataac caactaccct tagttatcga attcactgaa 7320
caaactgctc ctaagatttt cggtggagaa atcaaaacac atatcttgtt gtttttgcca 7380
aagtccgtat cggattatga aggtaaactc tccaatttca aaaaggccgc tgagagcttt 7440
aagggcaaga ttttgttcat ctttattgac tcagaccaca cagacaatca gaggattttg 7500
gagtttttcg gtttgaaaaa ggaggaatgt ccagcagtcc gtttgatcac cttggaggag 7560
gagatgacca aatacaaacc agagtcggat gagttgactg ccgagaagat aacagaattt 7620
tgtcacagat ttctggaagg taagatcaag cctcatctta tgtctcaaga gttgcctgat 7680
gactgggata agcaaccagt taaagtattg gtgggtaaaa actttgagga agtggccttc 7740
gacgagaaaa aaaatgtctt tgttgaattc tatgctccgt ggtgtggtca ctgtaagcag 7800
ctggcaccaa tttgggataa actgggtgaa acttacaaag atcacgaaaa cattgttatt 7860
gcaaagatgg acagtactgc taacgaagtg gaggctgtga aagttcactc cttccctacg 7920
ctgaagttct ttcctgcatc tgctgacaga actgttatcg actataatgg agagaggaca 7980
ttggatggtt ttaaaaagtt tcttgaatcc ggaggtcaag acggagctgg tgacgacgat 8040
gatttggaag atctggagga ggctgaggaa cctgatcttg aggaggatga cgaccagaag 8100
gcagtcaaag atgaactgtg ataagggggg ccgcgagtcg tgagtaatca agaggatgtc 8160
agaatgccat ttgcctgaga gatgcaggct tcatttttga tactttttta tttgtaacct 8220
atatagtata ggattttttt tgtcattttg tttcttctcg tacgagcttg ctcctgatca 8280
gcctatctcg cagctgatga atatcttgtg gtaggggttt gggaaaatca ttcgagtttg 8340
atgtttttct tggtatttcc cactcctctt cagagtacag aagattaagt gagacgttcg 8400
tttgtgctcc gga 8413
<210> 12
<211> 714
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 12
gtttcttgaa tccggaggtc aagacggagc tggtgacgac gatgatttgg aagatctgga 60
ggaggctgag gaacctgatc ttgaggagga tgacgaccag aaggcagtca aagatgaact 120
gcatcatcat catcatcatt gataaggggt caagaggatg tcagaatgcc atttgcctga 180
gagatgcagg cttcattttt gatacttttt tatttgtaac ctatatagta taggattttt 240
tttgtcattt tgtttcttct cgtacgagct tgctcctgat cagcctatct cgcagcagat 300
gaatatcttg tggtaggggt ttgggaaaat cattcgagtt tgatgttttt cttggtattt 360
cccactcctc ttcagagtac agaagattaa gtgagacctt cgtttgtgcg gttctggctc 420
tggttctggc tctggatcct tcagtaatgt cttgtttctt ttgttgcagt ggtgagccat 480
tttgacttcg tgaaagtttc tttagaatag ttgtttccag aggccaaaca ttccacccgt 540
agtaaagtgc aagcgtagga agaccaagac tggcataaat caggtataag tgtcgagcac 600
tggcaggtga tcttctgaaa gtttctacta gcagataaga tccagtagtc atgcatatgg 660
caacaatgta ccgtgtggat ctaagaacgc gtcctactaa ccttcgcatt cgtt 714
<210> 13
<211> 7605
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 13
tgcaggtacc actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct 60
ttttttctgc gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt 120
tgtttgccgg atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg 180
cagataccaa atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct 240
gtagcaccgc ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc 300
gataagtcgt gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg 360
tcgggctgaa cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa 420
ctgagatacc tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg 480
gacaggtatc cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg 540
ggaaacgcct ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga 600
tttttgtgat gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt 660
ttacggttcc tggccttttg ctggcctttt gctcacatgt tctttcctgc ggtacccaga 720
tccaattccc gctttgactg cctgaaatct ccatcgccta caatgatgac atttggattt 780
ggttgactca tgttggtatt gtgaaataga cgcagatcgg gaacactgaa aaatacacag 840
ttattattca tttcagaagc gatagagaga ctgcgctaag cattaatgag attatttttg 900
agcattcgtc aatcaatacc aaacaagaca aacggtatgc cgacttttgg aagtttcttt 960
ttgaccaact ggccgttagc atttcaacga accaaactta gttcatcttg gatgagatca 1020
cgcttttgtc atattaggtt ccaagacagc gtttaaactg tcagttttgg gccatttggg 1080
gaacatgaaa ctatttgacc ccacactcag aaagccctca tctggagtga tgttcgggtg 1140
taatgcggag cttgttgcat tcggaaataa acaaacatga acctcgccag gggggccagg 1200
atagacaggc taataaagtc atggtgttag tagcctaata gaaggaattg gaataaatga 1260
cccttgtgac tgacactttg ggagtcccta ttctacttag tctcatatcg catgaaactt 1320
ttgataaatt attttctgat aggaattttt catcagatat tatcatcgcg gcttacgtaa 1380
taacaaaaaa aattgatgga gtctatacta ggctaacata aactaagtta ttaattaaac 1440
aaaacaaaac gtactagcat tactgtcata tataagggct cctaactaaa actgtaaaga 1500
cttcccgtaa aattatcatt ctaattctga caatgtgcat ggcctcctaa actcttgacc 1560
tctctcatgc agccacttat tggaaaccca cttattaccg actaagacgg gacaagcagc 1620
atgtctagtg ctgtaatcac cttctccaga tgcaaacaga ttgtaccaaa atacggccgt 1680
gcccttttta ggccaaacag aagcacctac ctcagggaaa actgtggctc ctccagcaag 1740
cacatcggac atatagaaca accacgttgc gattctattt ccagtaccta gctccttaaa 1800
agcatcaggc tcgtcctttc tggcgaaatc aaagtggggt tcatactgac cgcccacacc 1860
atagttggca acttgtagtt cctcagcagt gcttacgtca agaccagtca aatcttgaat 1920
acgcatattg atacggctga ccacgggatt ctcgtaaccg gacaaccatg ctgatttaga 1980
gacacgatat tgtgcggtag tcaattttcc agtctcaggg tcatggacgg tagccctact 2040
caatcttggt ttggccaagt ctttcacaac ctctatttct gcatcggaga tgatgtcatg 2100
aaaacgaatg attctaggct tgtcccattc atcttcctgt ttcgctggag caagaatgaa 2160
ttttgggtta cggttcccat catgatatct acagaacagc tttttctgtc tccttggagt 2220
catcttgata ccctctcctc tacacagcat ttcatacttt tgtctctctg ggaggtagtc 2280
aacagctgca cctttttttt tcagagtggt cttttgatcg gattggtcat cggacgagga 2340
cttatttgcg tccttttcct tagccatgat gtattcaaag tatttcagat taccgttagc 2400
tctttgatgc tccgggtcca gctccaacaa ctttttagtt aaaagtagag ctttgtccag 2460
atcaccttgc tggtaaacag cgtatgataa gtaatccaaa actgaaacct tatcaacggt 2520
agaaacttca ccttcgtcca actgacgcag agcttgctcc atccataatt ctgtgtgata 2580
gtagtcggct tctgtatatg cgacttttcc caattcaaaa caatcttcca cagtgaggaa 2640
ggacttatgc ttcacaccag gtaaatcacc cttcgatatc gtgtcggtgt ccaaattgta 2700
tgtgtcctgc aatcgcaaca aagcttttgc tgctcctact tggtcctcat cgtttggaaa 2760
gtattgtctt tgaattgtta agttagaaat gaatccatca ctcatatctt taagtaccaa 2820
gttttccaat tctgaccact ctgtattaag tctcttcatc agcttgaaag cattcactgg 2880
gtgacccaca aaaccctcag gatcttttgt tgcagtacta gtcaatctat cgagtttctc 2940
tgcccacttt ttgatttgct ccaacttatc ctcttcagct ttgatatagt ctttaaggct 3000
tgtaactagg tctttttctg tgtgaatcaa atcagtcatc tgtcctatag aagtgaagaa 3060
gcctgggtga gccagtgact gtggcaacaa aataccaacg actaggatat accaaatcat 3120
gcggcctgtt gtagttttaa tatagtttga gtatgagatg gaactcagaa cgaaggaatt 3180
atcaccagtt tatatattct gaggaaaggg tgtgtcctaa attggacagt cacgatggca 3240
ataaacgctc agccaatcag aatgcaggag ccataaattg ttgtattatt gctgcaagat 3300
ttatgtgggt tcacattcca ctgaatggtt ttcactgtag aattggtgtc ctagttgtta 3360
tgtttcgaga tgttttcaag aaaaactaaa atgcacaaac tgaccaataa tgtgccgtcg 3420
cgcttggtac aaacgtcagg attgccacca cttttttcgc actctggtac aaaagttcgc 3480
acttcccact cgtatgtaac gaaaaacaga gcagtctatc cagaacgaga caaattagcg 3540
cgtactgtcc cattccataa ggtatcatag gaaacgagag tcctcccccc atcacgtata 3600
tataaacaca ctgatatccc acatccgctt gtcaccaaac taatacatcc agttcaagtt 3660
acctaaacaa atcaaagcat gagattccca tctattttca ccgctgtctt gttcgctgcc 3720
tcctctgcat tggctgcacc cgatgaggaa gatcatgttt tagtattgca taaaggaaat 3780
ttcgatgaag ctttggccgc tcacaaatat ctgctcgtcg agttttacgc tccctggtgc 3840
ggtcattgta aggcccttgc accagagtac gccaaggcag ctggtaagtt aaaggccgaa 3900
ggttcagaga tcagattagc aaaagttgat gctacagaag agtccgatct tgctcaacaa 3960
tacggggttc gaggataccc aacaattaag tttttcaaaa atggtgatac tgcttcccca 4020
aaggaatata ctgctggtag agaggcagac gacatagtca actggctcaa aaagagaacg 4080
ggcccagctg cgtctacatt aagcgacgga gcagcagccg aagctcttgt ggaatctagt 4140
gaagttgctg taatcggttt ctttaaggac atggaatctg attcagctaa acagttcctt 4200
ttagcagctg aagcaatcga tgacatccct ttcggaatca cctcaaatag tgacgtgttc 4260
agcaagtacc aacttgacaa agatggagtg gtcttgttca aaaagtttga cgaaggcaga 4320
aacaatttcg agggtgaggt tacaaaggag aaactgcttg atttcattaa acataaccaa 4380
ctacccttag ttatcgaatt cactgaacaa actgctccta agattttcgg tggagaaatc 4440
aaaacacata tcttgttgtt tttgccaaag tccgtatcgg attatgaagg taaactctcc 4500
aatttcaaaa aggccgctga gagctttaag ggcaagattt tgttcatctt tattgactca 4560
gaccacacag acaatcagag gattttggag tttttcggtt tgaaaaagga ggaatgtcca 4620
gcagtccgtt tgatcacctt ggaggaggag atgaccaaat acaaaccaga gtcggatgag 4680
ttgactgccg agaagataac agaattttgt cacagatttc tggaaggtaa gatcaagcct 4740
catcttatgt ctcaagagtt gcctgatgac tgggataagc aaccagttaa agtattggtg 4800
ggtaaaaact ttgaggaagt ggccttcgac gagaaaaaaa atgtctttgt tgaattctat 4860
gctccgtggt gtggtcactg taagcagctg gcaccaattt gggataaact gggtgaaact 4920
tacaaagatc acgaaaacat tgttattgca aagatggaca gtactgctaa cgaagtggag 4980
gctgtgaaag ttcactcctt ccctacgctg aagttctttc ctgcatctgc tgacagaact 5040
gttatcgact ataatggaga gaggacattg gatggtttta aaaagtttct tgaatccgga 5100
ggtcaagacg gagctggtga cgacgatgat ttggaagatc tggaggaggc tgaggaacct 5160
gatcttgagg aggatgacga ccagaaggca gtcaaagatg aactgtgata aggggtcaag 5220
aggatgtcag aatgccattt gcctgagaga tgcaggcttc atttttgata cttttttatt 5280
tgtaacctat atagtatagg attttttttg tcattttgtt tcttctcgta cgagcttgct 5340
cctgatcagc ctatctcgca gcagatgaat atcttgtggt aggggtttgg gaaaatcatt 5400
cgagtttgat gtttttcttg gtatttccca ctcctcttca gagtacagaa gattaagtga 5460
gaccttcgtt tgtgcggatc cttcagtaat gtcttgtttc ttttgttgca gtggtgagcc 5520
attttgactt cgtgaaagtt tctttagaat agttgtttcc agaggccaaa cattccaccc 5580
gtagtaaagt gcaagcgtag gaagaccaag actggcataa atcaggtata agtgtcgagc 5640
actggcaggt gatcttctga aagtttctac tagcagataa gatccagtag tcatgcatat 5700
ggcaacaatg taccgtgtgg atctaagaac gcgtcctact aaccttcgca ttcgttggtc 5760
cagtttgttg ttatcgatca acgtgacaag gttgtcgatt ccgcgtaagc atgcataccc 5820
aaggacgcct gttgcaattc caagtgagcc agttccaaca atctttgtaa tattagagca 5880
cttcattgtg ttgcgcttga aagtaaaatg cgaacaaatt aagagataat ctcgaaaccg 5940
cgacttcaaa cgccaatatg atgtgcggca cacaataagc gttcatatcc gctgggtgac 6000
tttctcgctt taaaaaatta tccgaaaaaa ttttctagag tgttgacact ttatacttcc 6060
ggctcgtata atacgacaag gtgtaaggag gactaaacca tgggtaaaaa gcctgaactc 6120
accgcgacgt ctgtcgagaa gtttctgatc gaaaagttcg acagcgtctc cgacctgatg 6180
cagctctcgg agggcgaaga atctcgtgct ttcagcttcg atgtaggagg gcgtggatat 6240
gtcctgcggg taaatagctg cgccgatggt ttctacaaag atcgttatgt ttatcggcac 6300
tttgcatcgg ccgcgctccc gattccggaa gtgcttgaca ttggggaatt cagcgagagc 6360
ctgacctatt gcatctcccg ccgtgcacag ggtgtcacgt tgcaagacct gcctgaaacc 6420
gaactgcccg ctgttctgca gccggtcgcg gaggccatgg atgcgatcgc tgcggccgat 6480
cttagccaga cgagcgggtt cggcccattc ggaccgcaag gaatcggtca atacactaca 6540
tggcgtgatt tcatatgcgc gattgctgat ccccatgtgt atcactggca aactgtgatg 6600
gacgacaccg tcagtgcgtc cgtcgcgcag gctctcgatg agctgatgct ttgggccgag 6660
gactgccccg aagtccggca cctcgtgcac gcggatttcg gctccaacaa tgtcctgacg 6720
gacaatggcc gcataacagc ggtcattgac tggagcgagg cgatgttcgg ggattcccaa 6780
tacgaggtcg ccaacatctt cttctggagg ccgtggttgg cttgtatgga gcagcagacg 6840
cgctacttcg agcggaggca tccggagctt gcaggatcgc cgcggctccg ggcgtatatg 6900
ctccgcattg gtcttgacca actctatcag agcttggttg acggcaattt cgatgatgca 6960
gcttgggcgc agggtcgatg cgacgcaatc gtccgatccg gagccgggac tgtcgggcgt 7020
acacaaatcg cccgcagaag cgcggccgtc tggaccgatg gctgtgtaga agtactcgcc 7080
gatagtggaa accgacgccc cagcactcgt ccgagggcaa aggaataaca attgacacct 7140
tacgattatt tagagagtat ttattagttt tattgtatgt atacggatgt tttattatct 7200
atttatgccc ttatattctg taactatcca aaagtcctat cttatcaagc cagcaatcta 7260
tgtccgcgaa cgtcaactaa aaataagctt tttatgctct tctctctttt tttcccttcg 7320
gtataattat accttgcatc cacagattct cctgccaaat tttgcataat cctttacaac 7380
atggctatat gggagcactt agcgccctcc aaaacccata ttgcctacgc atgtataggt 7440
gttttttcca caatattttc tctgtgctct ctttttatta aagagaagct ctatatcgga 7500
gaagcttctg tggccgttat attcggcctt atcgtgggac cacattgcct gaattggttt 7560
gccccggaag attggggaaa cttggatctg attaccttag ctgca 7605
<210> 14
<211> 7377
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 14
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgttt cagaagcgat agagagactg cgctaagcat taatgagatt 2220
atttttgagc attcgtcaat caataccaaa caagacaaac ggtatgccga cttttggaag 2280
tttctttttg accaactggc cgttagcatt tcaacgaacc aaacttagtt catcttggat 2340
gagatcacgc ttttgtcata ttaggttcca agacagcgtt taaactgtca gttttgggcc 2400
atttggggaa catgaaacta tttgacccca cactcagaaa gccctcatct ggagtgatgt 2460
tcgggtgtaa tgcggagctt gttgcattcg gaaataaaca aacatgaacc tcgccagggg 2520
ggccaggata gacaggctaa taaagtcatg gtgttagtag cctaatagaa ggaattggaa 2580
ataatgtatc taaacgcaaa ctccgagctg gaaaaatgtt accggcgatg cgcggacaat 2640
ttagaggcgg cgatcaagaa acacctgctg ggcgagcagt ctggagcaca gtcttcgatg 2700
ggcccgagat cccaccgcgt tcctgggtac cgggacgtga ggcagcgcga catccatcaa 2760
atataccagg cgccaaccga gtctctcgga aaacagcttc tggatatctt ccgctggcgg 2820
cgcaacgacg aataatagtc cctggaggtg acggaatata tatgtgtgga gggtaaatct 2880
gacagggtgt agcaaaggta atattttcct aaaacatgca atcggctgcc ccgcaacggg 2940
aaaaagaatg actttggcac tcttcaccag agtggggtgt cccgctcgtg tgtgcaaata 3000
ggctcccact ggtcaccccg gattttgcag aaaaacagca agttccgggg tgtctcactg 3060
gtgtccgcca ataagaggag ccggcaggca cggagtctac atcaagctgt ctccgataca 3120
ctcgactacc atccgggtct ctcagagagg ggaatggcac tataaatacc gcctccttgc 3180
gctctctgcc ttcatcaatc aaatcatgtt ctctccaatt ttgtccttgg aaattatttt 3240
agctttggct actttgcaat ctgtcttcgc tcaacaggaa gcagtagatg gtggttgctc 3300
acatttaggt caatcttacg cagatagaga tgtatggaaa cctgaaccat gtcaaatttg 3360
cgtgtgtgac tcaggttcag tgctctgcga cgatatcata tgtgacgacc aggaattgga 3420
ctgtccaaac ccagagatac cattcggtga atgttgtgct gtttgtccac agccaccaac 3480
tgctcctaca agacctccaa acggtcaagg tccacaaggt cctaaaggtg atccgggtcc 3540
acctggtatt cctggtagaa atggtgaccc tggacctccc ggttccccag gtagcccagg 3600
atcacctggg cctcctggaa tatgtgaatc ctgcccaact ggtggtcaga actatagccc 3660
acaatacgag gcctacgacg tcaaatctgg tgttgctgga ggaggtattg caggctaccc 3720
tggtcccgca gggcccccag gtccgccggg tccgcccgga acatcaggtc atcccggagc 3780
ccctggtgca ccaggttatc agggaccgcc cggagagcct ggacaagctg gtcccgctgg 3840
accccctggt ccaccaggtg ctattggacc aagtggtcct gccggaaaag acggtgaatc 3900
cggtagacct ggtagacccg gcgaaagggg tttcccaggt cctcccggaa tgaagggtcc 3960
agccggtatg cccggttttc ctgggatgaa gggtcacaga ggatttgatg gtagaaacgg 4020
agagaaaggc gaaaccggtg ctcccggact gaagggtgaa aacggtgtcc ctggtgagaa 4080
cggcgctcct ggacctatgg gtccacgtgg tgctccagga gaaagaggca gaccaggatt 4140
gcctggtgca gctggtgcta gaggtaacga tggtgcccgt ggttccgatg gacaacccgg 4200
gccacccggc cctccaggta ccgctggatt tcctggaagc cctggtgcta agggggaggt 4260
tggtccggct ggtagtcccg gaagtagcgg tgccccaggt caaagaggcg aaccaggccc 4320
tcagggtcac gcaggagcac ctggaccgcc tggtcctcct ggttcgaatg gttcgcctgg 4380
aggaaaaggt gaaatggggc ccgcaggaat ccccggtgcg cctggtctta ttggtgccag 4440
gggtcctcca ggcccgccag gtacaaatgg tgtacccgga cagcgaggag cagctggtga 4500
acctggtaaa aacggtgcca aaggagatcc aggtcctcgt ggagagcgtg gtgaagctgg 4560
ctctcccggt atcgccggtc caaaaggtga ggacggtaag gacggttccc ctggtgagcc 4620
aggtgcgaac ggactgccag gtgcagccgg agagcgagga gtcccaggat tcaggggacc 4680
agccggtgct aacggcttgc ctggtgaaaa agggccccct ggtgataggg gaggacccgg 4740
tccagcaggc cctcgtggag ttgctggtga gcctggacgt gacggtttac caggagggcc 4800
aggtttgagg ggtattcccg ggtcccctgg cggtcctgga tcggatggaa aaccagggcc 4860
accaggttcg cagggtgaaa caggacgtcc aggcccaccc ggctcacctg gtccaagggg 4920
tcagcctggt gtcatgggtt tccccggtcc aaagggtaat gacggagcac cgggtaaaaa 4980
tggtgaacgt ggtggcccag gtggtccagg accccaaggt ccagctggaa aaaacggtga 5040
gacaggtcct caaggacctc caggacctac cggtcctagc ggagataagg gagatacggg 5100
accgccagga cctcaaggat tgcaaggttt gcctggtaca tctggccctc ccggagaaaa 5160
tggtaagcct ggagagccag gaccaaaagg cgaagctgga gccccaggta tccccggagg 5220
taagggagac tcaggtgctc cgggtgagcg tggtcctccg ggtgccggtg gtccacctgg 5280
acctagaggt ggtgccgggc cgccaggtcc tgaaggtggt aaaggtgctg ctggtccacc 5340
gggaccgcct ggctctgctg gtactcctgg cttgcaggga atgccaggag agagaggtgg 5400
acctggaggt cccggtccga agggtgataa aggggagcca ggatcatccg gtgttgacgg 5460
cgcacctggt aaagacggac caaggggacc aacgggtcca atcggaccac caggacccgc 5520
tggccagcca ggagataaag gcgagtccgg agcacccggt gttcctggta tagctggacc 5580
caggggtggt cccggtgaaa gaggtgaaca gggcccaccg ggtcccgccg gtttccctgg 5640
cgcccctggt caaaatggag aaccaggtgc aaagggcgag agaggagccc caggagaaaa 5700
gggtgaggga ggaccacccg gtgctgccgg tccagctggg ggttcaggtc ctgctggacc 5760
accaggtcca cagggcgtta aaggtgagag aggaagtcca ggtggtcctg gagctgctgg 5820
attcccaggt ggccgtggac ctcctggtcc ccctggatcg aatggtaatc ctggtccgcc 5880
aggtagttcg ggtgctcctg ggaaggacgg tccacctggc cccccaggta gtaacggtgc 5940
acctggtagt ccaggtatat ccggacctaa aggagattcc ggtccaccag gcgaaagagg 6000
ggccccaggc ccacagggtc caccaggagc ccccggtcct ctgggtattg ctggtcttac 6060
tggtgcacgt ggactggccg gtccacccgg aatgcctgga gcaagaggtt cacctggacc 6120
acaaggtatt aaaggagaga acggtaaacc tggaccttcc ggtcaaaacg gagagcgggg 6180
acccccaggc ccccaaggtc tgccaggact agctggtacc gcaggggaac caggaagaga 6240
tggaaatcca ggttcagacg gactacccgg tagagatggt gcaccggggg ccaagggcga 6300
caggggtgag aatggatctc ctggtgcgcc aggggcacca ggccacccag gtcccccagg 6360
tcctgtgggc cctgctggaa agtcaggtga caggggagag acaggcccgg ctggtccatc 6420
tggcgcaccc ggaccagctg gttccagagg cccacctggt ccgcaaggcc ctagaggtga 6480
caagggagag actggagaac gaggtgctat gggtatcaag ggtcatagag gttttccggg 6540
taatcccggc gccccaggtt ctcctggtcc agctggccat caaggtgcag tcggatcgcc 6600
cggcccagcc ggtcccaggg gccctgttgg tccatccggt cctccaggaa aggatggtgc 6660
ttctggacac ccaggaccta tcggacctcc gggtcctaga ggtaatagag gagaacgtgg 6720
atccgagggt agtcctggtc accctggtca acctggccca ccagggcctc caggtgcacc 6780
cggtccatgt tgtggtgcag gcggtgtggc tgcaattgct ggtgtgggtg ctgaaaaggc 6840
cggcggtttc gctccatatt atggtgatgg ttacattcct gaagctccta gagacggaca 6900
agcatacgtt agaaaggacg gtgagtgggt gttgctgtcc accttcttag gttctggttc 6960
tggttctgat tacaaggatg acgacgataa gggatcgtgt tgcccgggct gctgtggcaa 7020
accaatacct aaccctttac tgggccttga cagtacgtat ccgtatgatg tgccggatta 7080
tgcgcatcac catcatcacc atagatctta atcaagagga tgtcagaatg ccatttgcct 7140
gagagatgca ggcttcattt ttgatacttt tttatttgta acctatatag tataggattt 7200
tttttgtcat tttgtttctt ctcgtacgag cttgctcctg atcagcctat ctcgcagctg 7260
atgaatatct tgtggtaggg gtttgggaaa atcattcgag tttgatgttt ttcttggtat 7320
ttcccactcc tcttcagagt acagaagatt aagtgagacg ttcgtttgtg ctccgga 7377
<210> 15
<211> 951
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 15
atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60
cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120
tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180
aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240
tctctcgaga aaagagaggc cgaagctgtg ctgtcaaagt cctgtgtcag tcactttaga 300
aatgttggat ccttgaatag tagggatgtc aatctgaaag atgacttttc ctatgctaat 360
attgatgatc cctataacaa gcctttcgtc ctaaataacc taataaaccc taccaagtgt 420
caagagatca tgcaatttgc caatggcaag ttgtttgact cccaagtcct gagtggcacg 480
gacaagaaca tacgtaactc tcaacaaatg tggatatcca agaacaaccc tatggtaaaa 540
cccattttcg agaacatatg caggcagttt aacgtaccct ttgataatgc cgaggaccta 600
caggtcgtcc gttacttgcc taatcaatat tataatgagc atcatgactc atgctgtgac 660
tcctccaagc aatgcagtga atttatagag aggggcggtc agaggattct gaccgtttta 720
atttacctaa acaacgagtt ctcagatgga cacacgtact ttcctaattt aaaccaaaag 780
ttcaagccca agactggtga tgctttggtt ttttaccctt tagccaacaa ctctaataaa 840
tgtcacccat acagtctaca cgcaggtatg cccgtcacgt caggagagaa gtggattgct 900
aatctgtggt ttcgtgagcg taagttctcc caccaccacc accaccacta a 951
<210> 16
<211> 316
<212> PRT
<213> 人工序列
<220>
<223> 合成肽
<400> 16
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Glu Lys Arg Glu Ala Glu Ala Val Leu Ser Lys Ser Cys Val
85 90 95
Ser His Phe Arg Asn Val Gly Ser Leu Asn Ser Arg Asp Val Asn Leu
100 105 110
Lys Asp Asp Phe Ser Tyr Ala Asn Ile Asp Asp Pro Tyr Asn Lys Pro
115 120 125
Phe Val Leu Asn Asn Leu Ile Asn Pro Thr Lys Cys Gln Glu Ile Met
130 135 140
Gln Phe Ala Asn Gly Lys Leu Phe Asp Ser Gln Val Leu Ser Gly Thr
145 150 155 160
Asp Lys Asn Ile Arg Asn Ser Gln Gln Met Trp Ile Ser Lys Asn Asn
165 170 175
Pro Met Val Lys Pro Ile Phe Glu Asn Ile Cys Arg Gln Phe Asn Val
180 185 190
Pro Phe Asp Asn Ala Glu Asp Leu Gln Val Val Arg Tyr Leu Pro Asn
195 200 205
Gln Tyr Tyr Asn Glu His His Asp Ser Cys Cys Asp Ser Ser Lys Gln
210 215 220
Cys Ser Glu Phe Ile Glu Arg Gly Gly Gln Arg Ile Leu Thr Val Leu
225 230 235 240
Ile Tyr Leu Asn Asn Glu Phe Ser Asp Gly His Thr Tyr Phe Pro Asn
245 250 255
Leu Asn Gln Lys Phe Lys Pro Lys Thr Gly Asp Ala Leu Val Phe Tyr
260 265 270
Pro Leu Ala Asn Asn Ser Asn Lys Cys His Pro Tyr Ser Leu His Ala
275 280 285
Gly Met Pro Val Thr Ser Gly Glu Lys Trp Ile Ala Asn Leu Trp Phe
290 295 300
Arg Glu Arg Lys Phe Ser His His His His His His
305 310 315
<210> 17
<211> 4029
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 17
ggatccttca gtaatgtctt gtttcttttg ttgcagtggt gagccatttt gacttcgtga 60
aagtttcttt agaatagttg tttccagagg ccaaacattc cacccgtagt aaagtgcaag 120
cgtaggaaga ccaagactgg cataaatcag gtataagtgt cgagcactgg caggtgatct 180
tctgaaagtt tctactagca gataagatcc agtagtcatg catatggcaa caatgtaccg 240
tgtggatcta agaacgcgtc ctactaacct tcgcattcgt tggtccagtt tgttgttatc 300
gatcaacgtg acaaggttgt cgattccgcg taagcatgca tacccaagga cgcctgttgc 360
aattccaagt gagccagttc caacaatctt tgtaatatta gagcacttca ttgtgttgcg 420
cttgaaagta aaatgcgaac aaattaagag ataatctcga aaccgcgact tcaaacgcca 480
atatgatgtg cggcacacaa taagcgttca tatccgctgg gtgactttct cgctttaaaa 540
aattatccga aaaaattttc tagagtgttg ttactttata cttccggctc gtataatacg 600
acaaggtgta aggaggacta aaccatggct aaactcacct ctgctgttcc agtcctgact 660
gctcgtgatg ttgctggtgc tgttgagttc tggactgata ggctcggttt ctcccgtgac 720
ttcgtagagg acgactttgc cggtgttgta cgtgacgacg ttaccctgtt catctccgca 780
gttcaggacc aggttgtgcc agacaacact ctggcatggg tatgggttcg tggtctggac 840
gaactgtacg ctgagtggtc tgaggtcgtg tctaccaact tccgtgatgc atctggtcca 900
gctatgaccg agatcggtga acagccctgg ggtcgtgagt ttgcactgcg tgatccagct 960
ggtaactgcg tgcatttcgt cgcagaagag caggactaac aattgacacc ttacgattat 1020
ttagagagta tttattagtt ttattgtatg tatacggatg ttttattatc tatttatgcc 1080
cttatattct gtaactatcc aaaagtccta tcttatcaag ccagcaatct atgtccgcga 1140
acgtcaacta aaaataagct ttttatgctc ttctctcttt ttttcccttc ggtataatta 1200
taccttgcat ccacagattc tcctgccaaa ttttgcataa tcctttacaa catggctata 1260
tgggagcact tagcgccctc caaaacccat attgcctacg catgtatagg tgttttttcc 1320
acaatatttt ctctgtgctc tctttttatt aaagagaagc tctatatcgg agaagcttct 1380
gtggccgtta tattcggcct tatcgtggga ccacattgcc tgaattggtt tgccccggaa 1440
gattggggaa acttggatct gattacctta gctgcagaaa agggtaccac tgagcgtcag 1500
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 1560
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 1620
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgttcttc 1680
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 1740
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 1800
tggacccaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 1860
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 1920
tatgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 1980
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 2040
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 2100
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 2160
ggccttttgc tcacatgtat ttaaataatg tatctaaacg caaactccga gctggaaaaa 2220
tgttaccggc gatgcgcgga caatttagag gcggcgatca agaaacacct gctgggcgag 2280
cagtctggag cacagtcttc gatgggcccg agatcccacc gcgttcctgg gtaccgggac 2340
gtgaggcagc gcgacatcca tcaaatatac caggcgccaa ccgagtgtct cggaaaacag 2400
cttctggata tcttccgctg gcggcgcaac gacgaataat agtccctgga ggtgacggaa 2460
tatatatgtg tggagggtaa atctgacagg gtgtagcaaa ggtaatattt tcctaaaaca 2520
tgcaatcggc tgccccgcaa cgggaaaaag aatgactttg gcactcttca ccagagtggg 2580
gtgtcccgct cgtgtgtgca aataggctcc cactggtcac cccggatttt gcagaaaaac 2640
agcaagttcc ggggtgtctc actggtgtcc gccaataaga ggagccggca ggcacggagt 2700
ttacatcaag ctgtctccga tacactcgac taccatccgg gtctctcaga gaggggaatg 2760
gcactataaa taccgcctcc ttgcgctctc tgccttcatc aatcaaatca tgagattccc 2820
atctattttc accgctgtct tgttcgctgc ctcctctgca ttggctgccc ctgttaacac 2880
taccactgaa gacgagactg ctcaaattcc agctgaagca gttatcggtt actctgacct 2940
tgagggtgat ttcgacgtcg ctgttttgcc tttctctaac tccactaaca acggtttgtt 3000
gttcattaac accactatcg cttccattgc tgctaaggaa gagggtgtct ctctcgagaa 3060
aagagaggcc gaagctgtgc tgtcaaagtc ctgtgtcagt cactttagaa atgttggatc 3120
cttgaatagt agggatgtca atctgaaaga tgacttttcc tatgctaata ttgatgatcc 3180
ctataacaag cctttcgtcc taaataacct aataaaccct accaagtgtc aagagatcat 3240
gcaatttgcc aatggcaagt tgtttgactc ccaagtcctg agtggcacgg acaagaacat 3300
acgtaactct caacaaatgt ggatatccaa gaacaaccct atggtaaaac ccattttcga 3360
gaacatatgc aggcagttta acgtaccctt tgataatgcc gaggacctac aggtcgtccg 3420
ttacttgcct aatcaatatt ataatgagca tcatgactca tgctgtgact cctccaagca 3480
atgcagtgaa tttatagaga ggggcggtca gaggattctg accgttttaa tttacctaaa 3540
caacgagttc tcagatggac acacgtactt tcctaattta aaccaaaagt tcaagcccaa 3600
gactggtgat gctttggttt tttacccttt agccaacaac tctaataaat gtcacccata 3660
cagtctacac gcaggtatgc ccgtcacgtc aggagagaag tggattgcta atctgtggtt 3720
tcgtgagcgt aagttctccc accaccacca ccaccactaa taatcaagag gatgtcagaa 3780
tgccatttgc ctgagagatg caggcttcat ttttgatact tttttatttg taacctatat 3840
agtataggat tttttttgtc attttgtttc ttctcgtacg agcttgctcc tgatcagcct 3900
atctcgcagc tgatgaatat cttgtggtag gggtttggga aaatcattcg agtttgatgt 3960
ttttcttggt atttcccact cctcttcaga gtacagaaga ttaagtgaga cgttcgtttg 4020
tgctccgga 4029
<210> 18
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 18
ctctgccttc atcaatcaaa tcatgagatt cccatctatt ttcaccgctg 50
<210> 19
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 19
agcttcggcc tctcttttct cgaga 25
<210> 20
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 20
tctcgagaaa agagaggccg aagctgtgct gtcaaagtcc tgtgtcagtc acttt 55
<210> 21
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 合成核苷酸
<400> 21
gcaaatggca ttctgacatc ctcttgatta gtggtggtgg tggtggtggg agaacttacg 60
- 用于羟基化氨基酸的融合蛋白和产品
- 羟基化氨基酸用于治疗糖尿病的用途