工程化磷酸戊糖变位酶变体酶

文献发布时间：2023-06-19 10:27:30

本申请要求2018年7月9日提交的美国临时专利申请系列第62/695,491号的优先权，该申请为了所有目的通过引用以其整体并入。

发明领域

本发明提供了工程化磷酸戊糖变位酶(phosphopentomutase,PPM)酶、具有PPM活性的多肽、和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。还提供了用于产生PPM酶的方法。本发明还提供了包含PPM酶的组合物，以及使用工程化PPM酶的方法。本发明尤其可用于药物化合物的产生。

对序列表、表格或计算机程序的引用

序列表的正式副本作为ASCII格式化文本文件经由EFS-Web与说明书同时提交，文件名为“CX2-171WO2_ST25.txt”，创建日期为2019年7月2日，且大小为2,904千字节。经由EFS-Web提交的序列表为说明书的一部分并且通过引用以其整体并入本文。

发明背景

被称为人类免疫缺陷病毒(HIV)的逆转录病毒是获得性免疫缺陷综合征(AIDS)的病原体，获得性免疫缺陷综合征(AIDS)是一种复杂的疾病，涉及受影响个体的免疫系统的逐渐破坏以及中枢和外周神经系统的退化。逆转录病毒复制的一个共同特征是通过病毒编码的逆转录酶对病毒RNA基因组进行逆转录，以产生病毒复制所需的HIV序列的DNA拷贝。一些化合物诸如MK-8591是已知的逆转录酶抑制剂，并可用于治疗AIDS和类似疾病。虽然存在已知抑制HIV逆转录酶的一些化合物，但是在本领域中仍然需要能够更有效地抑制这种酶并从而改善对AIDS的效果的另外的化合物。

由于其与用于合成DNA的天然核苷的相似性，核苷类似物诸如MK-8591(Merck)是HIV的逆转录酶的有效抑制剂。逆转录酶与这些类似物的结合通过抑制逆转录酶的前进性性质(progressive nature)来使DNA的合成停滞。酶的停滞导致DNA分子的提前终止，使其无效。然而，通过标准化学合成技术产生核苷类似物可能由于其化学复杂性而具有挑战。

发明概述

本发明提供了工程化磷酸戊糖变位酶(PPM)酶、具有PPM活性的多肽、和编码这些酶的多核苷酸、以及包含这些多核苷酸和多肽的载体和宿主细胞。还提供了用于产生PPM酶的方法。本发明还提供了包含PPM酶的组合物，以及使用工程化PPM酶的方法。本发明尤其可用于药物化合物的产生。

本发明提供了工程化磷酸戊糖变位酶，所述工程化磷酸戊糖变位酶包含与SEQ IDNO:2、4、118、266、420、562、656、790和/或846具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列或其功能片段，其中所述工程化磷酸戊糖变位酶包括在所述多肽序列中包含至少一个取代或取代集的多肽，并且其中所述多肽序列的氨基酸位置参照SEQ ID NO:2、4、118、266、420、562、656、790和/或846编号。在一些实施方案中，多肽序列与SEQ ID NO:2具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，并且其中工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：65、77/118/147/154/231/357、98、99、114、117、118/147/154/225/231、118/147/154/225/233/257/357、118/147/154/225/257/357、118/147/154/231/309、118/147/225/231/257/309/357、118/147/225/231/357、118/147/225/234/257/357、118/147/231、118/147/231/257/308、118/147/231/257/309/357、118/154/225/231/357、118/154/225/234/257/357、118/154/231、118/154/231/257/309/357、118/154/231/257/357、118/154/231/309/338/357、118/154/231/357、118/231、118/231/257/357、145、146、147、147/154/225/231/309/357、147/231、147/231/257/357、147/231/309/357、147/231/357、153、153/231、154/231/309、154/231/309/357、154/231/354/357、173、225/231/257/309/357、231、233、314和357，其中所述多肽序列的氨基酸位置参照SEQ ID NO:2编号。在一些实施方案中，工程化磷酸戊糖变位酶的多肽序列与SEQ ID NO:2具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，并且其中工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：65Y、77E/118T/147A/154E/231R/357S、98S、99L、99V、114M、117W、118T/147A/154E/225A/231R、118T/147A/154E/225A/257I/357S、118T/147A/154E/225E/233Y/257I/357S、118T/147A/154E/231R/309F、118T/147A/225A/231R/357S、118T/147A/225A/234S/257I/357S、118T/147A/225E/231R/257I/309F/357S、118T/147A/231R、118T/147A/231R/257I/308A、118T/147A/231R/257I/309F/357S、118T/154E/225A/231R/357S、118T/154E/225A/234S/257I/357S、118T/154E/231R、118T/154E/231R/257I/309F/357S、118T/154E/231R/257I/357S、118T/154E/231R/309Y/338N/357S、118T/154E/231R/357S、118T/231R、118T/231R/257I/357S、145R、146R、147A、147A/154E/225A/231R/309F/357S、147A/231R、147A/231R/257I/357S、147A/231R/309Y/357S、147A/231R/357S、153I/231R、153T、154E/231R/309F/357S、154E/231R/309Y、154E/231R/354C/357S、173A、173G、173T、173V、225E/231R/257I/309Y/357S、231A、231C、231M、231R、231S、233Y、314E和357H，其中所述多肽序列的氨基酸位置参照SEQ ID NO:2编号。在一些实施方案中，工程化磷酸戊糖变位酶的多肽序列与SEQ ID NO:2具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性，并且其中工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：H65Y、D77E/S118T/S147A/D154E/H231R/T357S、T98S、P99L、P99V、W114M、F117W、S118T/S147A/D154E/Q225A/H231R、S118T/S147A/D154E/Q225A/V257I/T357S、S118T/S147A/D154E/Q225E/L233Y/V257I/T357S、S118T/S147A/D154E/H231R/W309F、S118T/S147A/Q225A/H231R/T357S、S118T/S147A/Q225A/A234S/V257I/T357S、S118T/S147A/Q225E/H231R/V257I/W309F/T357S、S118T/S147A/H231R、S118T/S147A/H231R/V257I/S308A、S118T/S147A/H231R/V257I/W309F/T357S、S118T/D154E/Q225A/H231R/T357S、S118T/D154E/Q225A/A234S/V257I/T357S、S118T/D154E/H231R、S118T/D154E/H231R/V257I/W309F/T357S、S118T/D154E/H231R/V257I/T357S、S118T/D154E/H231R/W309Y/D338N/T357S、S118T/D154E/H231R/T357S、S118T/H231R、S118T/H231R/V257I/T357S、C145R、H146R、S147A、S147A/D154E/Q225A/H231R/W309F/T357S、S147A/H231R、S147A/H231R/V257I/T357S、S147A/H231R/W309Y/T357S、S147A/H231R/T357S、L153I/H231R、L153T、D154E/H231R/W309F/T357S、D154E/H231R/W309Y、D154E/H231R/W354C/T357S、D173A、D173G、D173T、D173V、Q225E/H231R/V257I/W309Y/T357S、H231A、H231C、H231M、H231R、H231S、L233Y、D314E和T357H，其中所述多肽序列的氨基酸位置参照SEQ ID NO:2编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:2具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ IDNO:2具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:2具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些实施方案中，本发明提供了一种工程化磷酸戊糖变位酶，该工程化磷酸戊糖变位酶具有与SEQ ID NO:4具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：64/98/99/146/179/231/261/357、65/67/99/114/117/135/147/154/231/233、65/67/99/114/117/135/147/154/231/257、65/67/99/114/135/147/179/231/233、65/67/99/114/135/154/231/263、65/67/99/117/135/147/179/231/233/263、65/67/99/117/135/154/179/231/233、65/97/99/117/135/147/154/231/257、65/97/99/135/154/179/231/233/263、65/97/99/231/257、65/99/114/117/135/154/231、65/99/114/117/135/231、65/99/114/135/147/154/231/233、65/99/114/135/147/154/231/257、65/99/114/135/147/179/231/233/257、65/99/114/135/147/231/233/257/263、65/99/114/135/231/233/263、65/99/114/147/154/179/231、65/99/114/231/233、65/99/135/154/179/231/233/263、67/99/114/117/135/147/231/233、67/99/114/117/135/147/231/257、67/99/114/135/147/179/231/233/263、67/99/114/135/147/231/257/263、67/99/114/135/154/231/257/263、67/99/117/135/154/179/231、98/99/146/153/179/231/357、98/99/146/153/231/261/357、98/99/146/153/231/261/357/397、98/99/146/153/231/357、98/99/146/179/231/261/357、98/99/146/179/231/261/357/397、98/99/146/179/231/357、98/99/146/179/231/357/397、98/99/146/231、98/99/146/231/261/357、98/99/146/231/261/357/397、98/99/146/231/357、98/99/146/261/357/397、98/99/146/357、98/99/231/261/357/397、98/99/231/357/397、98/99/357、98/146/179/231/261/357、98/146/231/357、98/146/231/357/397、98/153/231/357/397、99/146/153/179/231/261/357、99/146/153/231/261/357/397、99/146/179/231/261/357、99/146/179/231/261/357/397、99/146/179/231/357、99/146/231/261/357、99/146/231/261/357/397、99/146/231/357、99/146/261/357/397和100，其中所述多肽序列的氨基酸位置参照SEQ ID NO:70编号。在一些实施方案中，本发明提供了一种工程化磷酸戊糖变位酶，该工程化磷酸戊糖变位酶具有与SEQ ID NO:4具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：64V/98S/99V/146R/179T/231A/261G/357H、65Y/67A/99L/114M/117W/135C/147A/154E/231R/257I、65Y/67A/99L/114M/117W/135C/147A/154E/231S/233Y、65Y/67A/99L/114M/135C/147A/179T/231R/233Y、65Y/67A/99L/114M/135C/154E/231R/263V、65Y/67A/99L/117W/135C/147A/179T/231R/233Y/263V、65Y/67A/99L/117W/135C/154E/179T/231R/233Y、65Y/97A/99L/117W/135C/147A/154E/231R/257I、65Y/97A/99L/135C/154E/179T/231R/233Y/263V、65Y/97A/99L/231R/257I、65Y/99L/114M/117W/135C/154E/231R、65Y/99L/114M/117W/135C/231R、65Y/99L/114M/135C/147A/154E/231R/233Y、65Y/99L/114M/135C/147A/154E/231R/257I、65Y/99L/114M/135C/147A/179T/231R/233Y/257I、65Y/99L/114M/135C/147A/231R/233Y/257I/263V、65Y/99L/114M/135C/231R/233Y/263V、65Y/99L/114M/147A/154E/179T/231R、65Y/99L/114M/231R/233Y、65Y/99L/135C/154E/179T/231R/233Y/263V、67A/99L/114M/117W/135C/147A/231M/257I、67A/99L/114M/117W/135C/147A/231R/233Y、67A/99L/114M/135C/147A/179T/231R/233Y/263V、67A/99L/114M/135C/147A/231M/257I/263V、67A/99L/114M/135C/154E/231M/257I/263V、67A/99L/117W/135C/154E/179T/231R、98S/99L/146R/153T/179T/231R/357H、98S/99L/146R/153T/231A/261G/357H、98S/99L/146R/153T/231R/357H、98S/99L/146R/179Q/231R/261G/357H/397I、98S/99L/146R/179T/231C/357H/397I、98S/99L/146R/179T/231R/261G/357H、98S/99L/146R/179T/231S/261G/357H、98S/99L/146R/179T/231S/357H/397I、98S/99L/146R/231A/357H、98S/99L/146R/231R/261G/357H、98S/99L/146R/231R/261G/357H/397I、98S/99L/146R/231S/261G/357H、98S/99L/146R/231S/357H、98S/99L/146R/261G/357H/397I、98S/99V/146R/153T/231C/261G/357H/397I、98S/99V/146R/153T/231M/261G/357H、98S/99V/146R/153T/231S/357H、98S/99V/146R/179Q/231A/261G/357H/397I、98S/99V/146R/179Q/231R/261G/357H、98S/99V/146R/179Q/231R/261G/357H/397I、98S/99V/146R/179T/231A/357H/397I、98S/99V/146R/179T/231M/261G/357H、98S/99V/146R/179T/231M/357H、98S/99V/146R/179T/231R/261G/357H、98S/99V/146R/179T/231S/261G/357H/397I、98S/99V/146R/179T/231S/357H、98S/99V/146R/231M/261G/357H、98S/99V/146R/231R、98S/99V/146R/231R/357H、98S/99V/146R/261G/357H/397I、98S/99V/146R/357H、98S/99V/231S/261G/357H/397I、98S/99V/231S/357H/397I、98S/99V/357H、98S/146R/179Q/231R/261G/357H、98S/146R/231R/357H、98S/146R/231R/357H/397I、98S/153T/231R/357H/397I、99L/146R/179T/231R/261G/357H、99L/146R/179T/231R/357H、99L/146R/231M/261G/357H/397I、99L/146R/231R/261G/357H、99L/146R/231R/357H、99V/146R/153T/179T/231R/261G/357H、99V/146R/153T/231M/261G/357H/397I、99V/146R/179T/231M/261G/357H、99V/146R/179T/231M/261G/357H/397I、99V/146R/231A/261G/357H、99V/146R/231R/261G/357H、99V/146R/231R/357H、99V/146R/231S/261G/357H、99V/146R/261G/357H/397I和100T，其中所述多肽序列的氨基酸位置参照SEQID NO:4编号。在一些实施方案中，本发明提供了一种工程化磷酸戊糖变位酶，该工程化磷酸戊糖变位酶具有与SEQ ID NO:4具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：A64V/T98S/P99V/H146R/A179T/H231A/A261G/T357H、H65Y/G67A/P99L/W114M/F117W/R135C/S147A/D154E/H231R/V257I、H65Y/G67A/P99L/W114M/F117W/R135C/S147A/D154E/H231S/L233Y、H65Y/G67A/P99L/W114M/R135C/S147A/A179T/H231R/L233Y、H65Y/G67A/P99L/W114M/R135C/D154E/H231R/I263V、H65Y/G67A/P99L/F117W/R135C/S147A/A179T/H231R/L233Y/I263V、H65Y/G67A/P99L/F117W/R135C/D154E/A179T/H231R/L233Y、H65Y/D97A/P99L/F117W/R135C/S147A/D154E/H231R/V257I、H65Y/D97A/P99L/R135C/D154E/A179T/H231R/L233Y/I263V、H65Y/D97A/P99L/H231R/V257I、H65Y/P99L/W114M/F117W/R135C/D154E/H231R、H65Y/P99L/W114M/F117W/R135C/H231R、H65Y/P99L/W114M/R135C/S147A/D154E/H231R/L233Y、H65Y/P99L/W114M/R135C/S147A/D154E/H231R/V257I、H65Y/P99L/W114M/R135C/S147A/A179T/H231R/L233Y/V257I、H65Y/P99L/W114M/R135C/S147A/H231R/L233Y/V257I/I263V、H65Y/P99L/W114M/R135C/H231R/L233Y/I263V、H65Y/P99L/W114M/S147A/D154E/A179T/H231R、H65Y/P99L/W114M/H231R/L233Y、H65Y/P99L/R135C/D154E/A179T/H231R/L233Y/I263V、G67A/P99L/W114M/F117W/R135C/S147A/H231M/V257I、G67A/P99L/W114M/F117W/R135C/S147A/H231R/L233Y、G67A/P99L/W114M/R135C/S147A/A179T/H231R/L233Y/I263V、G67A/P99L/W114M/R135C/S147A/H231M/V257I/I263V、G67A/P99L/W114M/R135C/D154E/H231M/V257I/I263V、G67A/P99L/F117W/R135C/D154E/A179T/H231R、T98S/P99L/H146R/L153T/A179T/H231R/T357H、T98S/P99L/H146R/L153T/H231A/A261G/T357H、T98S/P99L/H146R/L153T/H231R/T357H、T98S/P99L/H146R/A179Q/H231R/A261G/T357H/T397I、T98S/P99L/H146R/A179T/H231C/T357H/T397I、T98S/P99L/H146R/A179T/H231R/A261G/T357H、T98S/P99L/H146R/A179T/H231S/A261G/T357H、T98S/P99L/H146R/A179T/H231S/T357H/T397I、T98S/P99L/H146R/H231A/T357H、T98S/P99L/H146R/H231R/A261G/T357H、T98S/P99L/H146R/H231R/A261G/T357H/T397I、T98S/P99L/H146R/H231S/A261G/T357H、T98S/P99L/H146R/H231S/T357H、T98S/P99L/H146R/A261G/T357H/T397I、T98S/P99V/H146R/L153T/H231C/A261G/T357H/T397I、T98S/P99V/H146R/L153T/H231M/A261G/T357H、T98S/P99V/H146R/L153T/H231S/T357H、T98S/P99V/H146R/A179Q/H231A/A261G/T357H/T397I、T98S/P99V/H146R/A179Q/H231R/A261G/T357H、T98S/P99V/H146R/A179Q/H231R/A261G/T357H/T397I、T98S/P99V/H146R/A179T/H231A/T357H/T397I、T98S/P99V/H146R/A179T/H231M/A261G/T357H、T98S/P99V/H146R/A179T/H231M/T357H、T98S/P99V/H146R/A179T/H231R/A261G/T357H、T98S/P99V/H146R/A179T/H231S/A261G/T357H/T397I、T98S/P99V/H146R/A179T/H231S/T357H、T98S/P99V/H146R/H231M/A261G/T357H、T98S/P99V/H146R/H231R、T98S/P99V/H146R/H231R/T357H、T98S/P99V/H146R/A261G/T357H/T397I、T98S/P99V/H146R/T357H、T98S/P99V/H231S/A261G/T357H/T397I、T98S/P99V/H231S/T357H/T397I、T98S/P99V/T357H、T98S/H146R/A179Q/H231R/A261G/T357H、T98S/H146R/H231R/T357H、T98S/H146R/H231R/T357H/T397I、T98S/L153T/H231R/T357H/T397I、P99L/H146R/A179T/H231R/A261G/T357H、P99L/H146R/A179T/H231R/T357H、P99L/H146R/H231M/A261G/T357H/T397I、P99L/H146R/H231R/A261G/T357H、P99L/H146R/H231R/T357H、P99V/H146R/L153T/A179T/H231R/A261G/T357H、P99V/H146R/L153T/H231M/A261G/T357H/T397I、P99V/H146R/A179T/H231M/A261G/T357H、P99V/H146R/A179T/H231M/A261G/T357H/T397I、P99V/H146R/H231A/A261G/T357H、P99V/H146R/H231R/A261G/T357H、P99V/H146R/H231R/T357H、P99V/H146R/H231S/A261G/T357H、P99V/H146R/A261G/T357H/T397I和S100T，其中所述多肽序列的氨基酸位置参照SEQ ID NO:4编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:4具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:4具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:4具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:118具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：64/99/114/231/357、65、67、87/225、99/114、99/114/147/231/261/397、99/114/147/231/357、99/114/147/257、99/114/147/261、99/114/153、99/114/153/231/357、99/114/153/261、99/114/153/261/357、99/114/231、99/114/231/261、99/114/231/357、99/114/257/261/357、99/114/357、99/231/257/261、99/257、114/231/257/261、114/231/357/397、114/257/357、114/392、154、211、211/316、225、234/310、257、257/261、257/357、263、350、357和359，其中所述多肽序列的氨基酸位置参照SEQ ID NO:118编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:118具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：64V/99L/114M/231A/357H、65E、65P、65T、67P、67R、67T、67V、87T/225H、99L/114M、99L/114M/147A/231A/261G/397I、99L/114M/147A/231A/357H、99L/114M/147A/257I、99L/114M/147A/261G、99L/114M/153T、99L/114M/153T/231M/357H、99L/114M/153T/261G、99L/114M/153T/261G/357H、99L/114M/231M、99L/114M/231M/261G、99L/114M/231M/357H、99L/114M/231S、99L/114M/257I/261G/357H、99L/114M/357H、99L/231M/257I/261G、99L/257I、114M/231M/257I/261G、114M/231M/357H/397I、114M/257I/357H、114M/392T、154P、211A、211A/316V、225P、234T/310A、257I、257I/261G、257I/357H、263V、350M、357V和359S，其中所述多肽序列的氨基酸位置参照SEQ ID NO:118编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:118具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：A64V/V99L/W114M/R231A/T357H、H65E、H65P、H65T、G67P、G67R、G67T、G67V、A87T/Q225H、V99L/W114M、V99L/W114M/S147A/R231A/A261G/T397I、V99L/W114M/S147A/R231A/T357H、V99L/W114M/S147A/V257I、V99L/W114M/S147A/A261G、V99L/W114M/L153T、V99L/W114M/L153T/R231M/T357H、V99L/W114M/L153T/A261G、V99L/W114M/L153T/A261G/T357H、V99L/W114M/R231M、V99L/W114M/R231M/A261G、V99L/W114M/R231M/T357H、V99L/W114M/R231S、V99L/W114M/V257I/A261G/T357H、V99L/W114M/T357H、V99L/R231M/V257I/A261G、V99L/V257I、W114M/R231M/V257I/A261G、W114M/R231M/T357H/T397I、W114M/V257I/T357H、W114M/A392T、D154P、V211A、V211A/A316V、Q225P、A234T/G310A、V257I、V257I/A261G、V257I/T357H、I263V、C350M、T357V和H359S，其中所述多肽序列的氨基酸位置参照SEQ ID NO:118编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ IDNO:118具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:118具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQID NO:118具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：65/225、65/225/263、97、118、143/194、147、156、160、172、176、188、192、194、207、211、217、225、227、236、238、257、257/261、261、263、306和397，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：65E/225P、65E/225P/263V、97E、118T、143A/194G、147A、147R、156W、160S、172G、176L、188Q、192T、194S、207E、211A、217N、225K、225P、227S、236P、236T、238G、257A、257I、257I/261G、257M、257S、257T、261G、263G、306V和397V，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：H65E/Q225P、H65E/Q225P/I263V、D97E、S118T、G143A/C194G、S147A、S147R、L156W、H160S、A172G、F176L、D188Q、E192T、C194S、N207E、V211A、I217N、Q225K、Q225P、T227S、E236P、E236T、P238G、V257A、V257I、V257I/A261G、V257M、V257S、V257T、A261G、I263G、D306V和T397V，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：116/238、118/147/192/238、118/147/225/257、118/147/238/257/357、118/156/192/194/231/257、118/194/238、118/231/257/357、118/238、118/257/357、147/194/217/225/236/257、147/225/238/357、147/236/238/257、156/192/217/236/257、156/217/236/257/357、156/236/238、192/238、192/238/357、225/238/357、227、231/257、236、236/238/257、238/257和257，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：116H/238G、118T/147A/192T/238G、118T/147A/225K/257A、118T/147A/238G/257A/357H、118T/156W/192T/194S/231S/257A、118T/194S/238G、118T/231M/257A/357H、118T/238G、118T/257A/357H、147A/194S/217N/225K/236T/257M、147A/225K/238G/357H、147A/236P/238G/257A、156W/192T/217N/236P/257A、156W/217N/236T/257M/357H、156W/236P/238G、192T/238G、192T/238G/357H、225K/238G/357H、227S、231M/257A、236T、236T/238G/257A、238G/257A和257A，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：Y116H/P238G、S118T/S147A/E192T/P238G、S118T/S147A/Q225K/V257A、S118T/S147A/P238G/V257A/T357H、S118T/L156W/E192T/C194S/R231S/V257A、S118T/C194S/P238G、S118T/R231M/V257A/T357H、S118T/P238G、S118T/V257A/T357H、S147A/C194S/I217N/Q225K/E236T/V257M、S147A/Q225K/P238G/T357H、S147A/E236P/P238G/V257A、L156W/E192T/I217N/E236P/V257A、L156W/I217N/E236T/V257M/T357H、L156W/E236P/P238G、E192T/P238G、E192T/P238G/T357H、Q225K/P238G/T357H、T227S、R231M/V257A、E236T、E236T/P238G/V257A、P238G/V257A和V257A，其中所述多肽序列的氨基酸位置参照SEQ ID NO:266编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:266具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：12、94、118/147/227/238/257/357、118/151、118/236/357、121、142、148、150、151、172、181、185、186、189、193、199、206、218、235、237、239、256、266、267、281、300、308和383，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：98/151/172/235/256/266/267、98/256、108/235/267、148/150/172/235、148/151/172/235/256、148/151/235/256/301、148/151/235/267、150/151/172/235/260、150/151/235、150/172/235/267/301、150/235、150/267、151、151/172/235、151/172/235/256/301、151/235/260、151/256、151/267/301、172、172/235、172/235/237/256/267、172/267/301/312、235、235/256/267、235/256/267/307、235/260、235/267、235/267/301、256、260、267、267/301、301、307和312，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：12L、94N、94Y、118S/147S/227S/238P/257V/357T、118S/151Q、118S/236P/357T、121H、121P、121R、142T、148P、150A、150Q、151F、172P、172S、181D、185W、186R、186S、189H、193M、199A、199M、199Y、206R、206W、218L、218R、235H、235I、235L、237L、239N、239Q、256A、256T、266F、266K、266S、267R、281V、300A、308N和383A，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：F12L、S94N、S94Y、T118S/A147S/T227S/G238P/A257V/H357T、T118S/V151Q、T118S/E236P/H357T、E121H、E121P、E121R、L142T、S148P、T150A、T150Q、V151F、A172P、A172S、H181D、F185W、G186R、G186S、K189H、L193M、E199A、E199M、E199Y、Y206R、Y206W、G218L、G218R、V235H、V235I、V235L、P237L、A239N、A239Q、S256A、S256T、N266F、N266K、N266S、C267R、L281V、T300A、S308N和T383A，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ IDNO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：98T/151S/172E/235H/256A/266H/267N、98T/256A、108A/235L/267T、148A/150S/172E/235I、148A/151G/235L/256A/301C、148A/151S/172E/235I/256A、148A/151S/235L/267R、150S/172E/235I/267T/301C、150S/235I、150V/151G/172E/235L/260P、150V/151G/235I、150V/267N、151G、151G/235L/260P、151G/256A、151S/172E/235H、151S/172E/235I/256A/301C、151S/267N/301C、172E、172E/235I、172E/235L/237S/256A/267N、172E/267N/301C/312T、235H、235H/256A/267R、235H/256A/267T、235H/256A/267T/307T、235I、235I/267N、235I/267R/301C、235L、235L/260P、256A、260P、267N、267R/301C、267T、267T/301C、301C、307T和312T，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：S98T/V151S/A172E/V235H/S256A/N266H/C267N、S98T/S256A、V108A/V235L/C267T、S148A/T150S/A172E/V235I、S148A/V151G/V235L/S256A/N301C、S148A/V151S/A172E/V235I/S256A、S148A/V151S/V235L/C267R、T150S/A172E/V235I/C267T/N301C、T150S/V235I、T150V/V151G/A172E/V235L/I260P、T150V/V151G/V235I、T150V/C267N、V151G、V151G/V235L/I260P、V151G/S256A、V151S/A172E/V235H、V151S/A172E/V235I/S256A/N301C、V151S/C267N/N301C、A172E、A172E/V235I、A172E/V235L/P237S/S256A/C267N、A172E/C267N/N301C/R312T、V235H、V235H/S256A/C267R、V235H/S256A/C267T、V235H/S256A/C267T/S307T、V235I、V235I/C267N、V235I/C267R/N301C、V235L、V235L/I260P、S256A、I260P、C267N、C267R/N301C、C267T、C267T/N301C、N301C、S307T和R312T，其中所述多肽序列的氨基酸位置参照SEQ ID NO:420编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：21、118、120、151、155、220、225和357，其中所述多肽序列的氨基酸位置参照SEQ ID NO:562编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：21/66/120/155、21/117/120/139、21/117/120/151/155/225、21/117/120/222、21/117/222/225、21/120、21/120/139、21/120/151、21/120/151/155/222/225、21/120/151/222/225、21/120/151/225/316、21/120/155、21/120/222/357、21/139/151/357、21/139/357、21/151/155/222/225、21/225/357、21/357、50/357、117/120/151/155、117/120/151/222、117/120/151/222/225、117/120/225、117/139/151/225、117/151/155/222/357、117/155/222/357、117/220/225、120、120/139、120/139/151、120/139/151/222、120/139/222、120/139/357、120/151/155、120/151/155/222/225、120/151/155/225、120/151/222、120/151/222/225、120/151/225、120/155、120/155/222、120/155/225、120/155/357、120/220、120/220/222/357、120/220/225、120/222、120/225、120/225/357、120/225/401、120/357、139/357、151/155、155/222/225/357、220/357、222/357、298/357、和357和312，其中所述多肽序列的氨基酸位置参照SEQ ID NO:562编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：21W、118R、120G、120L、120R、120T、151L、151T、155A、155S、220P、225R、357E和357Q，其中所述多肽序列的氨基酸位置参照SEQID NO:562编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：E21W、T118R、H120G、H120L、H120R、H120T、V151L、V151T、Q155A、Q155S、K220P、Q225R、H357E和H357Q，其中所述多肽序列的氨基酸位置参照SEQ ID NO:562编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:420具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：21W/66D/120L/155S、21W/117W/120L/151T/155A/225R、21W/117W/120L/222A、21W/117W/120R/139G、21W/117W/222A/225R、21W/120L、21W/120L/151T、21W/120L/151T/155S/222A/225R、21W/120L/151T/225R/316T、21W/120L/155S、21W/120L/222A/357Q、21W/120R、21W/120R/139G、21W/120R/151T/222A/225R、21W/139G/151T/357Q、21W/139G/357Q、21W/151T/155A/222A/225R、21W/225R/357Q、21W/357Q、50T/357Q、117W/120L/151T/155S、117W/120L/151T/222A、117W/120R/151T/222A/225R、117W/120R/225R、117W/139G/151T/225R、117W/151T/155A/222A/357Q、117W/155A/222A/357Q、117W/220P/225R、120L、120L/139G、120L/139G/357Q、120L/151T/155A、120L/151T/155A/222A/225R、120L/151T/225R、120L/155A、120L/155S/225R、120L/155S/357Q、120L/220P/222A/357Q、120L/220P/225R、120L/222A、120L/225R/357Q、120L/357Q、120R、120R/139G/151T、120R/139G/151T/222A、120R/139G/222A、120R/151T/155S/225R、120R/151T/222A、120R/151T/222A/225R、120R/155A/225R、120R/155S/222A、120R/220P、120R/225R、120R/225R/357Q、120R/225R/401A、120R/357Q、139G/357Q、151T/155S、155A/222A/225R/357Q、220P/357Q、222A/357Q、298I/357Q和357Q，其中所述多肽序列的氨基酸位置参照SEQ IDNO:562编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：E21W/E66D/H120L/Q155S、E21W/F117W/H120L/V151T/Q155A/Q225R、E21W/F117W/H120L/G222A、E21W/F117W/H120R/P139G、E21W/F117W/G222A/Q225R、E21W/H120L、E21W/H120L/V151T、E21W/H120L/V151T/Q155S/G222A/Q225R、E21W/H120L/V151T/Q225R/A316T、E21W/H120L/Q155S、E21W/H120L/G222A/H357Q、E21W/H120R、E21W/H120R/P139G、E21W/H120R/V151T/G222A/Q225R、E21W/P139G/V151T/H357Q、E21W/P139G/H357Q、E21W/V151T/Q155A/G222A/Q225R、E21W/Q225R/H357Q、E21W/H357Q、P50T/H357Q、F117W/H120L/V151T/Q155S、F117W/H120L/V151T/G222A、F117W/H120R/V151T/G222A/Q225R、F117W/H120R/Q225R、F117W/P139G/V151T/Q225R、F117W/V151T/Q155A/G222A/H357Q、F117W/Q155A/G222A/H357Q、F117W/K220P/Q225R、H120L、H120L/P139G、H120L/P139G/H357Q、H120L/V151T/Q155A、H120L/V151T/Q155A/G222A/Q225R、H120L/V151T/Q225R、H120L/Q155A、H120L/Q155S/Q225R、H120L/Q155S/H357Q、H120L/K220P/G222A/H357Q、H120L/K220P/Q225R、H120L/G222A、H120L/Q225R/H357Q、H120L/H357Q、H120R、H120R/P139G/V151T、H120R/P139G/V151T/G222A、H120R/P139G/G222A、H120R/V151T/Q155S/Q225R、H120R/V151T/G222A、H120R/V151T/G222A/Q225R、H120R/Q155A/Q225R、H120R/Q155S/G222A、H120R/K220P、H120R/Q225R、H120R/Q225R/H357Q、H120R/Q225R/E401A、H120R/H357Q、P139G/H357Q、V151T/Q155S、Q155A/G222A/Q225R/H357Q、K220P/H357Q、G222A/H357Q、V298I/H357Q和H357Q，其中所述多肽序列的氨基酸位置参照SEQ ID NO:562编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:562具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：6、8、39、46、53、108、133、151、160、192、196、200、217、225、236、239、251、257、272、284、335、341、368、369、391和397，其中所述多肽序列的氨基酸位置参照SEQ ID NO:656编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：6M、8T、39Y、46K、46M、46S、53V、108T、133L、151Q、160S、192D、192T、196V、200M、217V、225N、236A、239G、239V、251A、257L、257V、272A、284V、335T、341L、341V、368L、369L、391I和397L，其中所述多肽序列的氨基酸位置参照SEQ ID NO:656编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：I6M、V8T、A39Y、G46K、G46M、G46S、L53V、V108T、V133L、V151Q、H160S、E192D、E192T、I196V、E200M、I217V、Q225N、E236A、A239G、A239V、H251A、A257L、A257V、K272A、A284V、L335T、I341L、I341V、V368L、Y369L、L391I和T397L，其中所述多肽序列的氨基酸位置参照SEQ ID NO:656编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:656具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：8、8/53、8/53/120/225/257/272、8/53/146/151/225/227/257、8/53/151/192/227/357/369/397、8/53/151/225、8/53/151/225/227、8/53/151/225/227/257/272/369、8/53/151/257/272/357、8/53/151/272/369、8/53/151/357、8/53/257/272/357、8/53/369、8/120/151、8/151、8/151/192/227/257/369、8/151/192/227/357/397、8/151/225/257/357/397、8/151/225/357、8/151/227/257/272、8/151/257/272/397、8/225/257/272、8/225/257/357/369、8/272、8/357、9、53/151、53/151/272、53/151/357、53/151/357/369、53/192、53/257/272/357、53/257/357、53/272、53/397、99、118、120、151/192/257、151/225/357、151/227/257、151/257、151/357/369、172、227/272/357/369、235、238、256、257、257/272、257/357、355、357和357/397，其中所述多肽序列的氨基酸位置参照SEQ ID NO:790编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：8L、8S、8T、8T/53V、8T/53V/120R/225R/257L/272A、8T/53V/146C/151T/225R/227S/257L、8T/53V/151T/192T/227S/357E/369L/397L、8T/53V/151T/225R、8T/53V/151T/225R/227S、8T/53V/151T/225R/227S/257L/272A/369L、8T/53V/151T/257L/272A/357E、8T/53V/151T/272A/369L、8T/53V/151T/357E、8T/53V/257L/272A/357E、8T/53V/369L、8T/120R/151T、8T/151T、8T/151T/192T/227S/257L/369L、8T/151T/192T/227S/357E/397L、8T/151T/225R/257L/357E/397L、8T/151T/225R/357E、8T/151T/227S/257L/272A、8T/151T/257L/272A/397L、8T/225R/257L/272A、8T/225R/257L/357E/369L、8T/272A、8T/357E、9M、53V/151T、53V/151T/272A、53V/151T/357E、53V/151T/357E/369L、53V/192T、53V/257L/272A/357E、53V/257L/357E、53V/272A、53V/397L、99Y、118K、120E、151T/192T/257L、151T/225R/357E、151T/227S/257L、151T/257L、151T/357E/369L、172E、227S/272A/357E/369L、235S、238V、256G、257L、257L/272A、257L/357E、355K、357E、357E/397L、357M、357S和357V，其中所述多肽序列的氨基酸位置参照SEQ ID NO:790编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：V8L、V8S、V8T、V8T/L53V、V8T/L53V/L120R/Q225R/A257L/K272A、V8T/L53V/R146C/V151T/Q225R/T227S/A257L、V8T/L53V/V151T/E192T/T227S/Q357E/Y369L/T397L、V8T/L53V/V151T/Q225R、V8T/L53V/V151T/Q225R/T227S、V8T/L53V/V151T/Q225R/T227S/A257L/K272A/Y369L、V8T/L53V/V151T/A257L/K272A/Q357E、V8T/L53V/V151T/K272A/Y369L、V8T/L53V/V151T/Q357E、V8T/L53V/A257L/K272A/Q357E、V8T/L53V/Y369L、V8T/L120R/V151T、V8T/V151T、V8T/V151T/E192T/T227S/A257L/Y369L、V8T/V151T/E192T/T227S/Q357E/T397L、V8T/V151T/Q225R/A257L/Q357E/T397L、V8T/V151T/Q225R/Q357E、V8T/V151T/T227S/A257L/K272A、V8T/V151T/A257L/K272A/T397L、V8T/Q225R/A257L/K272A、V8T/Q225R/A257L/Q357E/Y369L、V8T/K272A、V8T/Q357E、L9M、L53V/V151T、L53V/V151T/K272A、L53V/V151T/Q357E、L53V/V151T/Q357E/Y369L、L53V/E192T、L53V/A257L/K272A/Q357E、L53V/A257L/Q357E、L53V/K272A、L53V/T397L、L99Y、T118K、L120E、V151T/E192T/A257L、V151T/Q225R/Q357E、V151T/T227S/A257L、V151T/A257L、V151T/Q357E/Y369L、A172E、T227S/K272A/Q357E/Y369L、I235S、G238V、S256G、A257L、A257L/K272A、A257L/Q357E、T355K、Q357E、Q357E/T397L、Q357M、Q357S和Q357V，其中所述多肽序列的氨基酸位置参照SEQ ID NO:790编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:790具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：6、7、9/108/118/172/192/238/355、9/108/118/172/235/238/256/257/355、9/108/118/192/256/257/355、9/108/192/256/257/355、9/118、9/118/172/192/257/355、9/118/172/192/355、9/118/172/235/238/257、9/118/172/256/355、9/118/235/256/355、9/118/355、9/172/192/235/238/256/355、9/172/192/235/256、9/172/192/355、9/192/235/256、9/192/235/355、9/192/355、9/235/238/256/355、9/235/256/257/355、9/256/355、9/355、17、22、22/62、52、58、62、65、68、76、82、87、92、108/118/172/235/238/256/257/355、108/118/172/256/257/355、108/172/192/235/238/256/355、108/172/192/238/256/355、114、118、118/172/235、118/172/256/257、118/235/256/257/355、118/256、118/355、126、133、137、139、151、155、172/192/355、172/235/238/256/257/355、172/256/257/355、172/257/355、180、188、189、192/235/256/355、192/355、200、217、219、221、225、231、235、235/256/257/355、251、257、266、286、287、288、296、308、324、327、332、333、334、335、337、338、341、355、363、389、391和393，其中所述多肽序列的氨基酸位置参照SEQ ID NO:846编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：6L、7I、9M/108T/118K/172E/192T/238V/355K、9M/108T/118K/172E/235S/238V/256G/257L/355K、9M/108T/118K/192T/256G/257L/355R、9M/108T/192T/256G/257L/355K、9M/118K、9M/118K/172E/192T/257L/355R、9M/118K/172E/192T/355R、9M/118K/172E/235S/238V/257L、9M/118K/172E/256G/355K、9M/118K/235S/256G/355R、9M/118K/355R、9M/172E/192T/235S/238V/256G/355R、9M/172E/192T/235S/256G、9M/172E/192T/355R、9M/192T/235S/256G、9M/192T/235S/355K、9M/192T/355R、9M/235S/238V/256G/355R、9M/235S/256G/257L/355K、9M/256G/355K、9M/355K、9M/355R、17A、22K、22K/62T、52K、58K、62G、65A、68A、76L、82P、87G、92L、108T/118K/172E/235S/238V/256G/257L/355R、108T/118K/172E/256G/257L/355R、108T/172E/192T/235S/238V/256G/355R、108T/172E/192T/238V/256G/355R、114F、118K/172E/235S、118K/172E/256G/257L、118K/235S/256G/257L/355K、118K/256G、118K/355K、118P、126K、133E、137G、139K、151E、155E、172E/192T/355K、172E/235S/238V/256G/257L/355K、172E/235S/238V/256G/257L/355R、172E/256G/257L/355K、172E/257L/355K、180A、188E、189R、192T/235S/256G/355R、192T/355R、200I、217V、219E、221P、225K、231H、235S、235S/256G/257L/355K、251G、257V、266G、286L、287E、288A、296S、308L、324Y、327A、332V、333L、334A、335K、337K、338P、341L、355K、355P、355R、363Y、389A、391V和393E，其中所述多肽序列的氨基酸位置参照SEQ ID NO:846编号。在一些另外的实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列，并且其中所述工程化磷酸戊糖变位酶的多肽在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集：I6L、M7I、L9M/V108T/T118K/A172E/E192T/G238V/T355K、L9M/V108T/T118K/A172E/I235S/G238V/S256G/A257L/T355K、L9M/V108T/T118K/E192T/S256G/A257L/T355R、L9M/V108T/E192T/S256G/A257L/T355K、L9M/T118K、L9M/T118K/A172E/E192T/A257L/T355R、L9M/T118K/A172E/E192T/T355R、L9M/T118K/A172E/I235S/G238V/A257L、L9M/T118K/A172E/S256G/T355K、L9M/T118K/I235S/S256G/T355R、L9M/T118K/T355R、L9M/A172E/E192T/I235S/G238V/S256G/T355R、L9M/A172E/E192T/I235S/S256G、L9M/A172E/E192T/T355R、L9M/E192T/I235S/S256G、L9M/E192T/I235S/T355K、L9M/E192T/T355R、L9M/I235S/G238V/S256G/T355R、L9M/I235S/S256G/A257L/T355K、L9M/S256G/T355K、L9M/T355K、L9M/T355R、T17A、R22K、R22K/A62T、N52K、R58K、A62G、H65A、S68A、M76L、V82P、A87G、M92L、V108T/T118K/A172E/I235S/G238V/S256G/A257L/T355R、V108T/T118K/A172E/S256G/A257L/T355R、V108T/A172E/E192T/I235S/G238V/S256G/T355R、V108T/A172E/E192T/G238V/S256G/T355R、M114F、T118K/A172E/I235S、T118K/A172E/S256G/A257L、T118K/I235S/S256G/A257L/T355K、T118K/S256G、T118K/T355K、T118P、Q126K、V133E、N137G、P139K、T151E、Q155E、A172E/E192T/T355K、A172E/I235S/G238V/S256G/A257L/T355K、A172E/I235S/G238V/S256G/A257L/T355R、A172E/S256G/A257L/T355K、A172E/A257L/T355K、C180A、D188E、K189R、E192T/I235S/S256G/T355R、E192T/T355R、E200I、I217V、D219E、A221P、Q225K、R231H、I235S、I235S/S256G/A257L/T355K、H251G、A257V、N266G、I286L、K287E、E288A、T296S、S308L、L324Y、R327A、L332V、M333L、S334A、L335K、R337K、D338P、I341L、T355K、T355P、T355R、H363Y、Q389A、L391V和K393E，其中所述多肽序列的氨基酸位置参照SEQ ID NO:846编号。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含与SEQ ID NO:846具有至少95％、96％、97％、98％、99％或更多序列同一性的多肽序列。

在一些另外的实施方案中，本发明提供了工程化磷酸戊糖变位酶，其中工程化磷酸戊糖变位酶包含与表4.1、5.1、6.1、7.1、8.1、9.1、10.1、12.1、12.2、13.1、14.1和/或15.1中所列的至少一种工程化磷酸戊糖变位酶变体的序列至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同的多肽序列。

在一些另外的实施方案中，本发明提供了工程化磷酸戊糖变位酶，其中工程化磷酸戊糖变位酶包含与SEQ ID NO:2、4、118、266、420、562、656、790和/或846至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同的多肽序列。在一些实施方案中，工程化磷酸戊糖变位酶包含SEQ ID NO:4、118、266、420、562、656、790和/或846中所列的变体工程化磷酸戊糖变位酶。

本发明还提供了工程化磷酸戊糖变位酶，其中工程化磷酸戊糖变位酶包含与SEQID NO:8-1152中偶数编号的序列中所列的至少一种工程化磷酸戊糖变位酶变体的序列至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多相同的多肽序列。

本发明还提供了工程化磷酸戊糖变位酶，其中所述工程化磷酸戊糖变位酶包含与野生型大肠杆菌(E.coli)磷酸戊糖变位酶相比至少一种改进的性质。在一些实施方案中，改进的性质包括改进的对底物的活性。在一些另外的实施方案中，底物包括化合物2和/或化合物3。在一些另外的实施方案中，改进的性质包括改进的化合物1和/或化合物4的产生。在一些另外的实施方案中，底物包括化合物4。在一些另外的实施方案中，改进的性质包括改进的化合物1和/或化合物3的产生。在又一些另外的实施方案中，工程化磷酸戊糖变位酶是纯化的。本发明还提供了组合物，所述组合物包含本文提供的至少一种工程化磷酸戊糖变位酶。本发明还提供了组合物，所述组合物包含本文提供的至少一种工程化磷酸戊糖变位酶。

本发明还提供了多核苷酸序列，所述多核苷酸序列编码本文提供的至少一种工程化磷酸戊糖变位酶。在一些实施方案中，编码至少一种工程化磷酸戊糖变位酶的多核苷酸序列包括与SEQ ID NO:1、3、117、265、419、561、655、789和/或845具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多核苷酸序列。在一些实施方案中，编码至少一种工程化磷酸戊糖变位酶的多核苷酸序列包括与SEQ ID NO:1、3、117、265、419、561、655、789和/或845具有至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多序列同一性的多核苷酸序列，其中所述工程化磷酸戊糖变位酶的多核苷酸序列在一个或更多个位置处包含至少一个取代。在一些另外的实施方案中，编码至少一种工程化磷酸戊糖变位酶或其功能片段的多核苷酸序列包括与SEQ ID NO:1、3、117、265、419、561、655、789和/或845至少85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多的序列同一性。在又一些另外的实施方案中，多核苷酸序列可操作地连接到控制序列。在一些另外的实施方案中，多核苷酸序列是密码子优化的。在又一些另外的实施方案中，多核苷酸序列包括SEQ ID NO:7-1151中奇数编号的序列中所列的多核苷酸序列。

本发明还提供了表达载体，所述表达载体包含本文提供的至少一种多核苷酸序列。本发明还提供了包含本文提供的至少一种表达载体的宿主细胞。在一些实施方案中，本发明提供了包含本文提供的至少一种多核苷酸序列的宿主细胞。

本发明还提供了在宿主细胞中产生工程化磷酸戊糖变位酶的方法，所述方法包括在合适的条件下培养本文提供的宿主细胞，从而产生至少一种工程化磷酸戊糖变位酶。在一些实施方案中，所述方法还包括从培养物和/或宿主细胞回收至少一种工程化磷酸戊糖变位酶。在一些另外的实施方案中，方法还包括纯化所述至少一种工程化磷酸戊糖变位酶的步骤。

发明描述

除非另外定义，本文使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常，本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域中熟知的并且普遍地采用的那些。这样的技术是熟知的，并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物，特此通过引用明确并入本文。

尽管本发明的实践中可使用类似或等同于本文描述的那些的任何合适的方法和材料，本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂，因为这些可以根据本领域技术人员使用它们的情况而改变。因此，下文即将定义的术语通过参考本发明作为整体而被更充分地描述。

应理解，上文的一般描述和下文的详细描述仅是示例性的和说明性的，而不是限制本发明。本文使用的章节标题仅用于组织目的，并且不被解释为限制所描述的主题。数值范围包括限定该范围的数字。因此，本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围，如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制，如同此类较低(或较高)数值限制在本文被清楚地写出。

缩写和定义

用于遗传编码的氨基酸的缩写是常规的，并且如下：丙氨酸(Ala或A)、精氨酸(Arg或R)、天冬酰胺(Asn或N)、天冬氨酸(Asp或D)、半胱氨酸(Cys或C)、谷氨酸(Glu或E)、谷氨酰胺(Gln或Q)、组氨酸(His或H)、异亮氨酸(Ile或I)、亮氨酸(Leu或L)、赖氨酸(Lys或K)、甲硫氨酸(Met或M)、苯丙氨酸(Phe或F)、脯氨酸(Pro或P)、丝氨酸(Ser或S)、苏氨酸(Thr或T)、色氨酸(Trp或W)、酪氨酸(Tyr或Y)和缬氨酸(Val或V)。

当使用三字母缩写时，除非前面具体地有“L”或“D”，或者从使用缩写的上下文清楚看出，否则氨基酸可以是关于α-碳(Cα)的L-构型或D-构型。例如，“Ala”表示丙氨酸而不指定关于α-碳的构型，而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时，大写字母表示关于α-碳的L-构型的氨基酸，并且小写字母表示关于α-碳的D-构型的氨基酸。例如，“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时，根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。

用于遗传编码核苷的缩写是常规的并且如下：腺苷(A)；鸟苷(G)；胞苷(C)；胸苷(T)；和尿苷(U)。除非具体描述，否则缩写的核苷可以是核糖核苷或2'-脱氧核糖核苷。核苷可以基于单独地或基于总体地指定为核糖核苷或2'-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时，序列按照常规惯例呈现为5'至3'方向，并且不示出磷酸。

参考本发明，本文的描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义，除非另有具体定义。因此，以下术语意在具有以下含义。

除非上下文另外清楚地指明，否则如本文使用的单数形式"一(a)"、"一(an)"和"该(the)"包括复数指代物。因此，例如对“多肽(a polypeptide)”的提及包括多于一个多肽。

类似地，“包括(comprise、comprises、comprising)”、“包括(include、includes和including)”是可互换的，而不意图为限制性的。因此，如本文使用的，术语“包括(comprising)”及其同源词以其包括性意义使用(即，等同于术语“包括(including)”及其相应的同源词)。

还应理解，在各种实施方案的描述使用术语“包括(comprising)”的情况下，本领域技术人员将理解，在一些具体实例中，可以可选择地使用“基本上由...组成”或“由...组成”的语言描述实施方案。

如本文使用的，术语“约”意指特定值的可接受误差。在一些实例中，“约”意指在给定值范围的0.05％、0.5％、1.0％或2.0％内。在一些实例中，“约”意指在给定值的1、2、3或4个标准差内。

如本文使用的，“EC”编号是指生物化学和分子生物学国际联合命名委员会(Nomenclature Committee of the International Union of Biochemistry andMolecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。

如本文使用的，“ATCC”是指美国典型培养物保藏中心(American Type CultureCollection)，其生物保藏收集物包括基因和菌株。

如本文使用的，“NCBI”是指美国国家生物技术信息中心(National Center forBiological Information)和其中提供的序列数据库。

如本文使用的，“磷酸戊糖变位酶”(“PPM”)酶是催化核糖1-磷酸可逆异构化为核糖5-磷酸和催化相关化合物诸如脱氧核糖磷酸以及核糖磷酸和脱氧核糖磷酸的类似物的可逆异构化的酶。

如本文使用的，“嘌呤核苷磷酸化酶”(“PNP”)酶是催化嘌呤核糖核苷和相关化合物(例如脱氧核糖核苷以及核糖核苷和脱氧核糖核苷的类似物)可逆磷酸化为游离嘌呤碱基和核糖-1-磷酸(及其类似物)的酶。

“蛋白”、“多肽”和“肽”在本文可互换使用，以表示无论长度或翻译后修饰(例如，糖基化或磷酸化)，通过酰胺键共价连接的至少两个氨基酸的聚合物。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。

“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地，核苷酸可以通过其通常可接受的单字母代码被提及。

如本文使用的，“亲水氨基酸或残基”是指根据Eisenberg等人(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])的归一化共有疏水性标度，具有表现出小于零的疏水性的侧链的氨基酸或残基。遗传编码的亲水氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。

如本文使用的，“酸性氨基酸或残基”是指当氨基酸被包含在肽或多肽中时，具有表现出小于约6的pKa值的侧链的亲水氨基酸或残基。由于氢离子的损失，酸性氨基酸在生理pH通常具有带负电荷的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。

如本文使用的，“碱性氨基酸或残基”是指当氨基酸被包含在肽或多肽中时，具有表现出大于约6的pKa值的侧链的亲水氨基酸或残基。由于与水合氢离子的缔合，碱性氨基酸在生理pH通常具有带正电荷的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。

如本文使用的，“极性氨基酸或残基”是指具有在生理pH不带电荷但具有其中两个原子共同共有的电子对被其中一个原子更紧密地保持(held more closely)的至少一个键的侧链的亲水氨基酸或残基。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。

如本文使用的，“疏水氨基酸或残基”是指根据Eisenberg等人(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])的归一化共有疏水性标度，具有表现出大于零的疏水性的侧链的氨基酸或残基。遗传编码的疏水氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。

如本文使用的，“芳族氨基酸或残基”是指具有包括至少一个芳族或杂芳族环的侧链的亲水或疏水氨基酸或残基。遗传编码的芳族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管由于其杂芳族氮原子的pKa，L-His(H)有时被归类为碱性残基，或因为其侧链包括杂芳族环而被归类为芳族残基，但在本文中，组氨酸被归类为亲水残基或为“受限残基(constrained residue)”(参见下文)。

如本文使用的，“受限氨基酸或残基”是指具有受限几何形状的氨基酸或残基。本文中，受限残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何形状，因为它具有相对小的咪唑环。脯氨酸具有受限的几何形状，因为它也具有五元环。

如本文使用的，“非极性氨基酸或残基”是指具有在生理pH不带电荷并具有其中两个原子共同共有的电子对通常由两个原子各自同等地保持(即侧链不是极性的)的键的侧链的疏水氨基酸或残基。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。

如本文使用的，“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。值得注意的是，半胱氨酸(或“L-Cys”或“[C]”)是不常见的，因为它可以与其他L-Cys(C)氨基酸或其他含磺酰基或巯基的氨基酸形成二硫化物桥。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫化物桥的巯基部分的其他氨基酸。L-Cys(C)(和具有含-SH侧链的其他氨基酸)以还原的游离-SH或氧化的二硫化物桥接形式存在于肽中的能力影响L-Cys(C)对肽贡献净疏水特征还是亲水特征。虽然根据Eisenberg的归一化共有标度(Eisenberg等人，1984年，上文)，L-Cys(C)表现出0.29的疏水性，但是应当理解，为了本公开内容的目的，L-Cys(C)被分类为其自身独特的组。

如本文使用的，“小氨基酸或残基”是指具有包括总计三个或更少的碳和/或杂原子(不包括α-碳和氢)的侧链的氨基酸或残基。根据上述定义，小氨基酸或残基可进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。

如本文使用的，“含羟基的氨基酸或残基”是指含有羟基(-OH)部分的氨基酸。遗传编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。

如本文使用的，“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷酸。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2'脱氧核糖核苷酸(即DNA)或包含核糖核苷酸和2'脱氧核糖核苷酸的混合物。虽然核苷典型地将经由标准磷酸二酯连接连接在一起，但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的，或者可以包括单链区域和双链区域二者。此外，虽然多核苷酸通常包含天然存在的编码核苷碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)，它可以包含一种或更多种经修饰和/或合成的核苷碱基，诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中，这样的经修饰或合成的核苷碱基是编码氨基酸序列的核苷碱基。

如本文使用的，“核苷”是指包含核苷碱基(即含氮碱基)和5-碳糖(例如核糖或脱氧核糖)的糖基胺。核苷的非限制性实例包括胞苷、尿苷、腺苷、鸟苷、胸苷和肌苷。相比之下，术语“核苷酸”是指包含核苷碱基、5-碳糖和一个或更多个磷酸基团的糖基胺。在一些实施方案中，核苷可以被激酶磷酸化以产生核苷酸。

如本文使用的，“核苷二磷酸”是指包含核苷碱基(即含氮碱基)、5-碳糖(例如核糖或脱氧核糖)和二磷酸(即焦磷酸)部分的糖基胺。在本文的一些实施方案中，“核苷二磷酸”缩写为“NDP”。核苷二磷酸的非限制性实例包括胞苷二磷酸(CDP)、尿苷二磷酸(UDP)、腺苷二磷酸(ADP)、鸟苷二磷酸(GDP)、胸苷二磷酸(TDP)和肌苷二磷酸(IDP)。在一些情形中，术语“核苷”和“核苷酸”可互换使用。

如本文使用的，“编码序列”是指核酸(例如基因)编码蛋白质的氨基酸序列的部分。

如本文使用的，术语“生物催化(biocatalysis)”、“生物催化(biocatalytic)”、“生物转化”和“生物合成”是指使用酶来对有机化合物进行化学反应。

如本文使用的，“野生型”和“天然存在的”是指在自然界中发现的形式。例如野生型多肽或多核苷酸序列为生物体中存在的序列，其可从天然来源分离且未通过人为操纵被有意地修饰。

如本文使用的，当关于细胞、核酸或多肽使用时，“重组”、“工程化”、“变体”和“非天然存在的”是指已经以自然界原本不存在的方式修饰的材料或相应于该材料的天然或自然形式的材料。在一些实施方案中，细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同，但由合成材料和/或通过使用重组技术操纵产生或衍生。非限制性实例包括，除其他以外，表达自然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的自然基因的重组细胞。

术语“序列同一性百分比(％)”在本文中用于指多核苷酸或多肽之间的比较，并通过比较比较窗中两条最佳比对的序列确定，其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即，空位)，以用于两个序列的最佳比对。百分比可以通过如下计算：确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性百分比。可选地，百分比可以通过如下计算：确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目，将匹配位置的数目除以比较窗中位置的总数目，并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解，存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以通过任何合适的方法进行，包括但不限于Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981])，通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970])，通过Pearson和Lipman的相似性搜索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988])，通过这些算法的计算机化实现(例如，GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)，或者通过目视检查，如本领域已知的。适用于确定序列同一性百分比和序列相似性的算法的实例包括但不限于BLAST和BLAST 2.0算法，由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990]；和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP)，所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见，Altschul等人，上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列，累积评分使用参数M(用于匹配残基对的奖励评分；总是＞0)和N(用于错配残基的惩罚评分；总是＜0)计算。对于氨基酸序列，评分矩阵用于计算累积评分。在以下情况时，停止字击中在每一个方向的延伸：累积比对评分从其最大达到值下降了量X；由于累积了一个或更多个负评分残基比对，累积得分达到0或小于0；或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值：字长(W)为11、期望值(E)为10、M＝5、N＝-4、以及两条链的比较。对于氨基酸序列，BLASTP程序使用以下作为默认值：字长(W)为3，期望(E)为10和BLOSUM62评分矩阵(参见，Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与％序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序，使用提供的默认参数。

如本文使用的，“参考序列”是指用作序列和/或活性比较的基础的确定序列。参考序列可以是更大序列的子集，例如，全长基因或多肽序列的区段(segment)。通常，参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、至少100个残基的长度或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即，完整序列的一部分)，和(2)还可以包括两个序列之间不同的(divergent)序列，所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中，“参考序列”可以基于一级氨基酸序列(primary amino acid sequence)，其中参考序列是可以在一级序列中具有一个或更多个变化的序列。

如本文使用的，“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段，其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较，并且其中序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比，可以包括20％或更少的添加或缺失(即，空位)以用于两个序列的最佳比对。比较窗可以比20个连续残基更长，并任选地包括30、40、50、100或更长的窗。

如本文使用的，当在对给定氨基酸或多核苷酸序列进行编号的情况中使用时，“对应于”、“参考”或“相对于”是指当给定氨基酸或多核苷酸序列与参考序列相比较时对指定参考序列的残基进行编号。换言之，给定聚合物的残基编号或残基位置关于参考序列被指定，而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如，给定氨基酸序列，诸如工程化磷酸戊糖变位酶的氨基酸序列可以通过引入空位以与参考序列对齐，来优化两个序列之间的残基匹配。在这些情况中，尽管存在空位，对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。

如本文使用的，“大体同一性(substantial identity)”是指在至少20个残基位置的比较窗中、通常在至少30-50个残基的窗中，与参考序列相比，具有至少80％序列同一性、至少85％同一性、至少89％至95％之间的序列同一性，或更通常至少99％序列同一性的多核苷酸或多肽序列，其中序列同一性百分比通过在比较窗中比较参考序列和包含总计为参考序列的20％或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中，术语“大体同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时，两个多肽序列共有至少80％的序列同一性，优选地至少89％的序列同一性、至少95％的序列同一性或更多(例如99％的序列同一性)。在一些实施方案中，在被比较的序列中不相同的残基位置因保守氨基酸取代而有差异。

如本文使用的，“氨基酸差异”和“残基差异”是指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。在一些情况下，参考序列具有组氨酸标签，但相对于没有组氨酸标签的等同参考序列，编号维持不变。本文中氨基酸差异的位置通常被称为“Xn”，其中n是指残基差异所基于的参考序列中的对应位置。例如，“与SEQID NO:4相比位置X93处的残基差异”是指对应于SEQ ID NO:4的位置93的多肽位置处的氨基酸残基的差异。因此，如果SEQ ID NO:4的参考多肽在位置93处具有丝氨酸，则“与SEQ IDNO:4相比位置X93处的残基差异”是指在对应于SEQ ID NO:4的位置93的多肽位置处除了丝氨酸以外的任何残基的氨基酸取代。在本文的大多数实例中，在一个位置处的具体氨基酸残基差异指示为“XnY”，其中“Xn”指定如上文描述的对应位置，并且“Y”是在工程化多肽中发现的氨基酸(即，与参考多肽中不同的残基)的单字母标识符。在一些实例中(例如，在实施例中呈现的表格中)，本发明还提供由常规符号“AnB”表示的具体氨基酸差异，其中A为参考序列中的残基的单字母标识符，“n”为参考序列中的残基位置的编号，并且B为工程化多肽的序列中残基取代的单字母标识符。在一些实例中，本发明的多肽可以相对于参考序列包含一个或更多个氨基酸残基差异，其由相对于参考序列存在残基差异的一列指定位置指示。在一些实施方案中，在多于一个氨基酸可以用于多肽的具体残基位置中时，可以使用的各种氨基酸残基由“/”分开(例如，X307H/X307P或X307H/P)。斜线也可用于指示给定变体内的多于一个取代(即，在给定序列中诸如在组合变体中存在多于一个取代)。在一些实施方案中，本发明包括含有一个或更多个氨基酸差异的工程化多肽序列，所述氨基酸差异包括保守氨基酸取代或非保守氨基酸取代。在一些另外的实施方案中，本发明提供了包含保守氨基酸取代和非保守氨基酸取代两者的工程化多肽序列。

如本文使用的，“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基，并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于，在一些实施方案中，具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如，丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代；具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如，丝氨酸和苏氨酸)取代；具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如，苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代；具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如，赖氨酸和精氨酸)取代；具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如，天冬氨酸或谷氨酸)取代；和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。

如本文使用的，“非保守取代”是指用具有显著不同的侧链性质的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸，并且影响(a)取代区域中的肽骨架的结构(例如，脯氨酸取代甘氨酸)，(b)电荷或疏水性，或(c)侧链体积。例如但不限于，示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸；用小氨基酸取代芳族氨基酸；和用疏水氨基酸取代亲水氨基酸。

如本文使用的，“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10％或多达氨基酸总数的20％，同时保留酶活性和/或保留工程化磷酸戊糖变位酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中，缺失可以包括连续的区段或可以是不连续的。氨基酸序列中的缺失通常用“-”表示。

如本文使用的，“插入”是指通过将一个或更多个氨基酸添加到参考多肽对多肽进行的修饰。插入可以处于多肽的内部部分或者到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段，或被天然存在的多肽中的一个或更多个氨基酸分开。

术语“氨基酸取代集”或“取代集”是指与参考序列相比，多肽序列中的一组氨基酸取代。取代集可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多个氨基酸取代。在一些实施方案中，取代集是指在实施例中提供的表格中列出的任何变体磷酸戊糖变位酶中存在的氨基酸取代的集合。

“功能片段”和“生物活性片段”在本文可互换使用，指如下多肽：所述多肽具有氨基末端缺失和/或羧基末端缺失和/或内部缺失，但其中剩余的氨基酸序列与和它进行比较的序列(例如，本发明的全长工程化磷酸戊糖变位酶)中的对应位置相同，并且保留全长多肽的基本上全部活性。

如本文使用的，“分离的多肽”是指与其天然伴随的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如，宿主细胞内或经由体外合成)中取出或纯化的多肽。重组磷酸戊糖变位酶多肽可以存在于细胞内、存在于细胞培养基中，或以各种形式(诸如裂解物或分离的制品)制备。因此，在一些实施方案中，重组磷酸戊糖变位酶多肽可以是分离的多肽。

如本文使用的，“基本上纯的多肽”或“纯化的蛋白”是指如下组合物，在所述组合物中多肽物质是存在的主要物质(即，在摩尔或重量基础上，它比该组合物中的任何其他单独的大分子物质更丰富)，并且当目标物质构成存在的大分子物质的按摩尔或％重量计至少约50％时，通常是基本上纯化的组合物。然而，在一些实施方案中，包含磷酸戊糖变位酶的组合物包含少于50％纯的(例如，约10％、约20％、约30％、约40％或约50％)的磷酸戊糖变位酶。通常，基本上纯的磷酸戊糖变位酶组合物构成该组合物中存在的所有大分子物质的按摩尔或％重量计约60％或更多、约70％或更多、约80％或更多、约90％或更多、约95％或更多以及约98％或更多。在一些实施方案中，将目标物质纯化至基本同质(即，通过常规检测方法不能在组合物中检测出污染物物质)，其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中，分离的重组磷酸戊糖变位酶多肽是基本上纯的多肽组合物。

如本文使用的，“改进的酶性质”是指酶的至少一种改进的性质。在一些实施方案中，本发明提供了与参考磷酸戊糖变位酶多肽和/或野生型磷酸戊糖变位酶多肽和/或另一种工程化磷酸戊糖变位酶多肽相比表现出在任何酶性质的改进的工程化磷酸戊糖变位酶多肽。因此，可以确定并比较各种磷酸戊糖变位酶多肽，包括野生型以及工程化磷酸戊糖变位酶之间的“改进”的水平。改进的性质包括但不限于诸如以下的性质：增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对蛋白水解活性的耐受性(即，降低的对蛋白水解的敏感性)、降低的聚集、增加的溶解度、和改变的温度谱(temperature profile)。在另外的实施方案中，该术语用于指磷酸戊糖变位酶的至少一种改进的性质。在一些实施方案中，本发明提供了与参考磷酸戊糖变位酶多肽和/或野生型磷酸戊糖变位酶多肽和/或另一种工程化磷酸戊糖变位酶多肽相比表现出在任何酶性质的改进的工程化磷酸戊糖变位酶多肽。因此，可以确定并比较各种磷酸戊糖变位酶多肽，包括野生型以及工程化磷酸戊糖变位酶之间的“改进”的水平。

如本文使用的，“增加的酶活性”和“增强的催化活性”是指工程化多肽的改进的性质，可以被表示为与参考酶相比，比活性(例如产生的产物/时间/重量蛋白)的增加或将底物转化为产物的转化百分比(例如在指定的时间段使用指定量的酶，将起始量的底物转化为产物的转化百分比)的增加。在一些实施方案中，该术语是指本文提供的工程化磷酸戊糖变位酶多肽的改进的性质，可以被表示为与参考磷酸戊糖变位酶相比，比活性(例如，产生的产物/时间/重量蛋白)的增加或将底物转化为产物的百分比(例如使用指定量的磷酸戊糖变位酶，在指定时间段内将起始量的底物转化为产物的转化百分比)的增加。在一些实施方案中，这些术语用于指本文提供的改进的磷酸戊糖变位酶。在实施例中提供了确定本发明的工程化磷酸戊糖变位酶的酶活性的示例性方法。可以影响与酶活性相关的任何性质，包括典型的酶性质K

如本文使用的，“转化”是指一种或多于一种底物酶促转化(或生物转化)为一种或多于一种对应的产物。“转化百分比”是指在指定条件下在一定时间段内被转化为产物的底物的百分比。因此，磷酸戊糖变位酶多肽的“酶活性”或“活性”可以表示为特定时间段内底物转化为产物的“转化百分比”。

具有“通用型性质(generalist properties)”的酶(或“通用型酶(generalistenzymes)”)是指与亲本序列相比，对宽范围的底物表现出改进的活性的酶。通用型酶不必对于每种可能的底物都表现出改进的活性。在一些实施方案中，本发明提供了具有通用型性质的磷酸戊糖变位酶变体，因为相对于亲本基因，它们对宽范围的空间和电子不同的底物表现出相似或改进的活性。此外，本文提供的通用型酶被工程化为跨越宽范围的有差异的分子被改进以增加代谢物/产物的产生。

术语“严格杂交条件”在本文中用于指在该条件下核酸杂交体是稳定的条件。如本领域技术人员已知的，杂交体的稳定性反映在杂交体的解链温度(T

如本文使用的，“杂交严格性”是指核酸杂交中的杂交条件，诸如洗涤条件。通常，杂交反应在较低严格性的条件下进行，随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件，所述互补核酸与靶DNA具有约60％同一性，优选地约75％同一性，约85％同一性，与靶多核苷酸具有大于约90％同一性。示例性中度严格性条件是等同于在50％甲酰胺、5×Denhart溶液、5×SSPE、0.2％SDS中在42℃杂交，随后在0.2×SSPE、0.2％SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度T

如本文使用的，“密码子优化的”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子，使得编码的蛋白在感兴趣的生物体中有效地表达。尽管遗传密码是简并的，即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示，但熟知的是，特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言，这种密码子使用偏倚可能更高。在一些实施方案中，可以对编码磷酸戊糖变位酶的多核苷酸进行密码子优化，用于在选择用于表达的宿主生物体中的优化产生。

如本文使用的，“优选的”、“最佳的”、和“高密码子使用偏倚”密码子在单独或组合使用时，可以互换地指在蛋白编码区中的以高于编码相同氨基酸的其他密码子的频率使用的密码子。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率，或它们的组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用于确定特定生物体中密码子频率(例如密码子使用、相对同义密码子使用)和密码子偏好的各种方法是已知的，包括多变量分析，例如使用聚类分析或相关性分析，和基因中使用的密码子的有效数目(参见例如，GCG CodonPreference,Genetics Computer Group Wisconsin Package；CodonW,Peden,University ofNottingham；McInerney,Bioinform.,14:372-73[1998]；Stenico等人,Nucl.Acids Res.,222437-46[1994]；以及Wright,Gene 87:23-29[1990])。许多不同的生物体的密码子使用表是可用的(参见例如，Wada等人,Nucl.Acids Res.,20:2111-2118[1992]；Nakamura等人,Nucl.Acids Res.,28:292[2000]；Duret等人,上文；Henaut和Danchin,于

如本文使用的，“控制序列”包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于，前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。最低程度而言，控制序列包括启动子以及转录和翻译终止信号。出于引入特定限制性位点的目的，控制序列可以与接头一起提供，所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。

“可操作地连接的”在本文被定义为如下配置：在所述配置中控制序列被适当地放置(即，以功能关系)在相对于感兴趣的多核苷酸的位置处，使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。

“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列，包括突变体、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

短语“合适的反应条件”是指在酶促转化反应溶液中的那些条件(例如，酶载量(enzyme loading)、底物载量、温度、pH、缓冲液、助溶剂等的范围)，在所述条件下本发明的磷酸戊糖变位酶多肽能够将底物转化为期望的产物化合物。一些示例性的“合适的反应条件”在本文中提供。

如本文使用的，“载量”，诸如在“化合物载量”或“酶载量”中，是指在反应起始时组分在反应混合物中的浓度或量。

如本文使用的，在酶促转化反应过程的情况下，“底物”是指由本文提供的工程化酶(例如工程化磷酸戊糖变位酶多肽)作用的化合物或分子。

如本文使用的，由反应产生的产物(例如脱氧核糖磷酸类似物)的“增加”的产率发生在：与相同条件下用相同底物和其他取代物，但不存在感兴趣的组分的情况下进行的反应相比，反应期间存在的特定组分(例如磷酸戊糖变位酶)导致产生更多的产物时。

如果与参与催化反应的其他酶相比，特定酶的量少于约2％、约1％或约0.1％(wt/wt)，则称该反应“基本上不含”该酶。

如本文使用的，“分级分离(fractionating)”液体(例如培养肉汤)是指应用分离工艺(例如盐沉淀、柱色谱法、尺寸排阻和过滤)或这样的工艺的组合来提供一种溶液，其中期望蛋白在溶液中占总蛋白的百分比大于初始液体产物中的百分比。

如本文使用的，“起始组合物”是指包含至少一种底物的任何组合物。在一些实施方案中，起始组合物包含任何合适的底物。

如本文使用的，在酶促转化过程的情况下，“产物”是指从酶多肽对底物的作用而产生的化合物或分子。

如本文使用的，本文使用的“平衡”是指如由化学或酶促反应的正向速率常数和反向速率常数确定的在化学或酶促反应中产生化学物质的稳定状态浓度的过程(例如，两种物质A和B的相互转化)，包括立体异构体的相互转化。

如本文使用的，“烷基”是指具有1个至18个碳原子(包括端点)的，直链的或支链的，更优选地1个至8个碳原子(包括端点)，并且最优选地1个至6个碳原子(包括端点)的饱和烃基团。具有指定数目的碳原子的烷基在括号中表示(例如(C1-C4)烷基是指1个至4个碳原子的烷基)。

如本文使用的，“烯基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个双键但任选地含有多于一个双键的基团。

如本文使用的，“炔基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个三键但任选地含有多于一个三键，并且另外任选地含有一个或更多个双键键合部分的基团。

如本文使用的，“杂烷基”、“杂烯基”和“杂炔基”是指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团代替的如本文定义的烷基、烯基和炔基。可以代替碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRα-、-PH-、-S(O)-、-S(O)2-、-S(O)NRα-、-S(O)2NRα-等，包括它们的组合，其中每个Rα独立地选自氢、烷基、杂烷基、环烷基、杂环烷基、芳基和杂芳基。

如本文使用的，“烷氧基”是指基团-ORβ，其中Rβ是如上文定义的烷基基团，包括还如本文定义的任选地被取代的烷基基团。

如本文使用的，“芳基”是指具有单环(例如苯基)或多于一个稠环(例如萘基或蒽基)的具有6个至12个碳原子(包括端点)的不饱和的芳族碳环基团。示例性芳基包括苯基、吡啶基、萘基等。

如本文使用的，“氨基”是指基团-NH2。被取代的氨基是指基团-NHRδ、NRδRδ和NRδRδRδ，其中每个Rδ独立地选自被取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基(sulfanyl)、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。

如本文使用的，“氧代”是指＝O。

如本文使用的，“氧基”是指二价基团-O-，其可以具有各种取代基以形成不同的氧基基团，包括醚和酯。

如本文使用的，“羧基”是指-COOH。

如本文使用的，“羰基”是指-C(O)-，其可以具有各种取代基以形成不同的羰基基团，包括酸、酰基卤、醛、酰胺、酯和酮。

如本文使用的，“烷氧基羰基”指-C(O)ORε，其中Rε是本文定义的烷基，其可以任选地被取代。

如本文使用的，“氨基羰基”是指-C(O)NH2。被取代的氨基羰基是指-C(O)NRδRδ，其中氨基基团NRδRδ如本文定义的。

如本文使用的，“卤素(halogen)”和“卤代(halo)”是指氟、氯、溴和碘。

如本文使用的，“羟基”是指-OH。

如本文使用的，“氰基”指-CN。

如本文使用的，“杂芳基”是指具有1个至10个碳原子(包括端点)和在环内的选自氧、氮和硫的1个至4个杂原子(包括端点)的芳族杂环基团。这样的杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多于一个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。

如本文使用的，“杂芳基烷基”是指被杂芳基取代的烷基(即杂芳基-烷基-基团)，优选地在烷基部分具有1个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。这样的杂芳基烷基基团通过吡啶基甲基等例示。

如本文使用的，“杂芳基烯基”是指被杂芳基取代的烯基(即杂芳基-烯基-基团)，优选地在烯基部分具有2个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。

如本文使用的，“杂芳基炔基”是指被杂芳基取代的炔基(即杂芳基-炔基-基团)，优选地在炔基部分具有2个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。

如本文使用的，“杂环”、“杂环的”和可互换的“杂环烃基”是指具有单环或多于一个稠环的、具有2个至10个碳环原子(包括端点)和在环内的选自氮、硫或氧的1个至4个杂环原子(包括端点)的饱和的或不饱和基团。这样的杂环基团可以具有单环(例如哌啶基或四氢呋喃基)或多于一个稠环(例如，二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、吩噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、咪唑烷、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、吲哚啉等。

如本文使用的，“元环(membered ring)”意指包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此，例如环己基、吡啶、吡喃和噻喃是6元环，并且环戊基、吡咯、呋喃和噻吩是5元环。

除非另外指明，否则在前述基团中被氢占据的位置可以被例如但不限于以下的取代基进一步取代：羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、甲酰胺基、被取代的甲酰胺基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰胺基(sulfonamido)、被取代的磺酰胺基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基甲酰基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基；并且优选的杂原子是氧、氮和硫。应理解，在这些取代基上存在开放化合价的情况下，它们可以被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代，在碳上存在这些开放化合价的情况下，它们可以被卤素和氧-、氮-或硫-键合的取代基进一步取代，并且在存在多于一个这样的开放化合价的情况下，这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接形成环。还应理解，可以进行上文的取代，条件是用取代基替代氢不会对本发明的分子带来不可接受的不稳定性，并且以其他方式在化学上是合理的。

如本文使用的术语“培养”是指微生物细胞群体在任何合适的条件(例如，使用液体、凝胶或固体培养基)下的生长。

重组多肽可以使用本领域已知的任何合适的方法产生。可以将编码感兴趣的野生型多肽的基因克隆到载体诸如质粒中，并且在期望的宿主诸如大肠杆菌等中表达。重组多肽的变体可以通过本领域已知的各种方法产生。事实上，存在本领域技术人员熟知的各种各样不同的诱变技术。此外，诱变试剂盒还可从许多商业分子生物学供应商获得。方法可用于做出确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变，或整个基因内的随机诱变(例如，饱和诱变)。本领域的技术人员已知产生酶变体的许多合适的方法，包括但不限于，使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组，和化学饱和诱变，或本领域已知的任何其他合适的方法。诱变和定向进化方法可以容易地应用于编码酶的多核苷酸，以产生可以被表达、筛选和测定的变体文库。任何合适的诱变和定向进化方法可用于本发明并且是本领域熟知的(参见例如美国专利第5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326号，以及所有相关的美国以及PCT和非美国的对应申请；Ling等人,Anal.Biochem.,254(2):157-78[1997]；Dale等人,Meth.Mol.Biol.,57:369-74[1996]；Smith,Ann.Rev.Genet.,19:423-462[1985]；Botstein等人,Science,229:1193-1201[1985]；Carter,Biochem.J.,237:1-7[1986]；Kramer等人,Cell,38:879-887[1984]；Wells等人,Gene,34:315-323[1985]；Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999]；Christians等人,Nat.Biotechnol.,17:259-264[1999]；Crameri等人,Nature,391:288-291[1998]；Crameri,等人,Nat.Biotechnol.,15:436-438[1997]；Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997]；Crameri等人,Nat.Biotechnol.,14:315-319[1996]；Stemmer,Nature,370:389-391[1994]；Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994]；WO 95/22625；WO 97/0078；WO 97/35966；WO 98/27230；WO 00/42651；WO 01/75767；和WO 2009/152336，其全部通过引用并入本文)。

在一些实施方案中，诱变处理后获得的酶克隆通过使酶制品经历确定的温度(或其他测定条件)，并测量热处理或其他合适的测定条件之后剩余的酶活性的量来进行筛选。然后将包含编码多肽的多核苷酸的克隆从基因分离，测序以鉴定核苷酸序列的改变(如果有)，并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如，标准生物化学技术，诸如HPLC分析)进行。

在变体产生之后，可以筛选它们的任何期望的性质(例如，高或增加的活性，或者低或降低的活性，增加的热活性，增加的热稳定性，和/或酸性pH稳定性等)。在一些实施方案中，可使用“重组磷酸戊糖变位酶多肽”(在本文中还被称为“工程化磷酸戊糖变位酶多肽”、“变体磷酸戊糖变位酶”、“磷酸戊糖变位酶变体”和“磷酸戊糖变位酶组合变体”)。在一些实施方案中，可使用“重组磷酸戊糖变位酶多肽”(在本文中还被称为“工程化磷酸戊糖变位酶多肽”、“变体磷酸戊糖变位酶”、“磷酸戊糖变位酶变体”和“磷酸戊糖变位酶组合变体”)。

如本文使用的，“载体”是用于将DNA序列引入细胞中的DNA构建体。在一些实施方案中，载体是可操作地连接至能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中，“表达载体”具有可操作地连接至DNA序列(例如，转基因)以驱动在宿主细胞中表达的启动子序列，并且在一些实施方案中，还包含转录终止子序列。

如本文使用的，术语“表达”包括参与多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还涵盖多肽从细胞的分泌。

如本文使用的，术语“产生”是指蛋白和/或其他化合物从细胞的产生。意在该术语涵盖参与多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中，该术语还涵盖多肽从细胞的分泌。

如本文使用的，如果氨基酸或核苷酸序列(例如，启动子序列、信号肽、终止子序列等)与它可操作地连接至的另一个序列在自然界中未缔合，则这两个序列是“异源的”。例如“异源多核苷酸”是通过实验室技术引入宿主细胞中的任何多核苷酸，并且包括从宿主细胞中取出、经历实验室操纵并且然后再引入宿主细胞的多核苷酸。

如本文使用的，术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如，编码磷酸戊糖变位酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中，宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。

术语“类似物”意指与参考多肽具有多于70％序列同一性，但少于100％序列同一性(例如，多于75％、78％、80％、83％、85％、88％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％序列同一性)的多肽。在一些实施方案中，类似物意指如下多肽，所述多肽包含一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸。在一些实施方案中，类似物还包括一个或更多个D-氨基酸残基以及两个或更多个氨基酸残基之间的非肽连接。

术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。

术语“分离的”和“纯化的”用于指从与其天然缔合的至少一种其他组分取出的分子(例如，分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度，而是意在作为相对定义。

如本文使用的，“立体选择性”是指在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的，此时一种立体异构体的形成优于另一种立体异构体，或者立体选择性可以是完全的，此时只形成一种立体异构体。当立体异构体是对映异构体时，立体选择性被称为对映选择性，即两者的总和中一种对映异构体的分数(通常被报告为百分比)。可选择地，本领域通常将其报告为根据下式从中计算的对映异构体过量(“e.e.”)(通常为百分比)：[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。在立体异构体是非对映异构体的情况下，立体选择性被称为非对映选择性，即两种非对映异构体的混合物中一种非对映异构体的分数(通常被报告为百分比)，通常可选择地报告为非对映异构体过量(“d.e.”)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。

如本文使用的，术语“区域选择性”和“区域选择性反应”是指其中键形成或断裂的一个方向优先于所有其他可能的方向发生的反应。如果区别是完全的，则反应可以是完全(100％)区域选择的，如果在一个位点的反应产物优于在其他位点的反应产物，则反应可以是大体上区域选择的(至少75％)，或部分区域选择的(x％，其中百分比依赖于感兴趣的反应进行设置)。

如本文使用的，“化学选择性”是指在化学或酶促反应中一种产物相对于另一种产物的优先形成。

如本文使用的，“pH稳定的”是指与未处理的酶相比，在暴露于高或低的pH(例如4.5-6或8至12)一段时间(例如0.5-24小时)后维持类似活性(例如多于60％至80％)的磷酸戊糖变位酶多肽。

如本文使用的，“热稳定”是指与暴露于升高的温度(例如40℃至80℃)的野生型酶相比，在暴露于相同的升高的温度持续一段时间(例如0.5h-24h)后，维持类似活性(例如多于60％至80％)的磷酸戊糖变位酶多肽。

如本文使用的，“溶剂稳定”是指与暴露于不同浓度(例如5％-99％)的溶剂(乙醇、异丙醇、二甲基亚砜[DMSO]、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)的野生型酶相比，在暴露于相同浓度的相同溶剂持续一段时间(例如0.5h-24h)后，维持类似活性(多于例如60％至80％)的磷酸戊糖变位酶多肽。

如本文使用的，“热稳定且溶剂稳定”是指既热稳定又溶剂稳定的磷酸戊糖变位酶多肽。

如本文使用的，“任选的”和“任选地”意指随后描述的事件或情形可以发生或可以不发生，并且意指该描述包括当该事件或情形发生时的实例和其中该事件或情形没有发生的实例。本领域普通技术人员将理解，对于被描述为包含一个或更多个任选的取代基的任何分子，仅意在包括空间上可实现的和/或合成上可行的化合物。

如本文使用的，“任选地被取代的”是指一种或一系列化学基团中的所有后续修饰对象(modifier)。例如，在术语“任选地被取代的芳基烷基”中，分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代，并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”，烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。

发明详述

在一些实施方案中，本发明提供了适用于产生核苷类似物诸如MK-8591(Merck)的酶。开发本发明是为了解决酶产生这些核苷类似物的潜在用途。然而，已经确定这种方法的一个挑战是野生型酶不太可能是产生所有必需中间体所需的必需底物类似物的最佳选择。此外，合成途径中的每种酶都需要某种工程化，以使其与替代底物和合成期望核苷类似物所用的工艺相容。

在一些实施方案中，本发明提供了可用于产生化合物的酶，最终产生用于化合物(1)所示的非天然核苷类似物的体外酶促合成方法。

非天然核苷是许多重要类别药物包括用于治疗癌症和病毒感染的那些药物的重要构建单元(building block)。市场上或临床试验中有至少十几种核苷类似物药物(Jordheim等人,Nat.Rev.Drug Discovery 12:447-464[2013])。制备化合物(1)的一种方法是通过嘌呤核苷磷酸化酶(PNP)催化的乙炔基核糖-1-磷酸(化合物(3))和氟腺嘌呤(化合物(2))的偶联，如方案I中示出的。

方案I.

脱氧核糖-1-磷酸化合物，诸如化合物(3)，可能难以制备。然而，相应的脱氧核糖-5-磷酸化合物可以通过由酶2-脱氧核糖-5-磷酸醛缩酶(DERA)催化的乙醛和D-甘油醛-3-磷酸(或其类似物)的偶联来制备(Barbas等人,J.Am.Chem.Soc.112:2013-2014[1990])。在脱氧核糖-5-磷酸类似物(4)形成后，它可以通过如以下方案II中示出的酶磷酸戊糖变位酶(PPM)的作用被转化或异构化为方案I所需的相应的脱氧核糖-1-磷酸类似物(3)。

方案II.磷酸戊糖变位酶(PPM)催化的反应

方案I中示出的PNP和PPM反应的平衡位置通常倾向于反应物(化合物2和4)，而不是产物(化合物1和无机磷酸盐)。驱动反应达到更高转化的一种方法是去除偶联步骤中形成的无机磷酸盐。这可以通过使无机磷酸盐与二糖诸如蔗糖经酶蔗糖磷酸化酶(SP)催化进行反应来实现(参见例如，美国专利第7,229,797号)。该反应产生葡萄糖-1-磷酸和果糖，非常有利，并且可以驱动如以下方案III中示出的总体反应。

方案III.产生化合物(1)的总体反应方案

已经从许多来源分离和/或重组表达了磷酸戊糖变位酶，所述来源包括大肠杆菌(Barbas和Wong,Bioorg.Chem.19:261-269[1991])、蜡样芽孢杆菌(Bacillus cereus)(Panosian等人.,Acta Crystallogr.,Sect.F:Struct.Biol.Cryst.Commun.,66:811-814[2010])、球形芽孢杆菌(Bacillus sphaericus)(Horinouchi等人,New Biotechnol.26:75-82[2009])和酿酒酵母(Saccharomyces cerevisiae)(Walther等人,FEBS Lett.586:4114-4118[2012])等等。已经确定了来自蜡样芽孢杆菌的PPM的晶体结构(Panosian等人,Acta Crystallogr.,Sect.F:Struct.Biol.Cryst.Commun.,66:811-814[2010]，Panosian等人,J.Biol.Chem.286:8043-8054[2011])。PPM催化(脱氧)核糖上的磷酸基团从1-位到5-位的相互转化，其中平衡有利位置在(脱氧)核糖-5-磷酸侧。对非天然核糖磷酸类似物使用PPM的描述在文献中是有限的。一个实例是用嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)PPM将双脱氧核糖5-磷酸异构化。在该报道中，该酶对该化合物具有活性，但与核糖5-磷酸相比，活性仅为12％(Hamamoto等人,Biosci.Biotechnol.,Biochem.62:1103-1108[1998])。野生型PPM对非天然底物的低活性限制了它们用于产生非天然核苷诸如化合物(1)的用途。

由于PPM对用于制备非天然和治疗上有用的核苷的非天然底物的活性差，因此需要具有改进的活性并能在典型工业条件下操作的工程化PPM。本发明解决了这一需求，并提供了适合在工业条件下用于这些反应的工程化PPM。

工程化PPM多肽

本发明提供了工程化PPM多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽时，应理解，它还描述了编码该多肽的多核苷酸。在一些实施方案中，本发明提供了与野生型PPM酶相比具有改进的性质的工程化、非天然存在的PPM酶。任何合适的反应条件可用于本发明。在一些实施方案中，使用方法来分析工程化多肽进行异构化反应的改进的性质。在一些实施方案中，如下文和实施例中进一步描述的，根据工程化PPM、一种或更多种底物、一种或更多种缓冲液、一种或更多种溶剂的浓度或量、pH、包括温度和反应时间的条件和/或工程化PPM多肽固定在固体支持物上的条件来改变反应条件。

在一些实施方案中，利用另外的反应组分或另外的技术来补充反应条件。在一些实施方案中，这些包括采取措施来稳定酶或防止酶失活、减少产物抑制、使反应平衡变动到期望的产物形成。

在一些另外的实施方案中，用于将底物化合物转化为产物化合物的任何上文描述的方法还可以包括一个或更多个选自以下的步骤：一种或更多种产物化合物的提取、分离、纯化、结晶、过滤和/或冻干。用于从通过本文提供的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶一种或更多种产物的方法、技术和方案是普通技术人员已知的和/或通过常规实验获得的。此外，在下文的实施例中提供了说明性方法。

编码工程化多肽的工程化PPM多核苷酸、表达载体和宿主细胞

本发明提供了编码本文描述的工程化酶多肽的多核苷酸。在一些实施方案中，多核苷酸可操作地连接至控制基因表达的一个或更多个异源调节序列，以产生能够表达多肽的重组多核苷酸。在一些实施方案中，将包含编码一种或更多种工程化酶多肽的至少一种异源多核苷酸的表达构建体引入适当的宿主细胞中以表达一种或更多种相应的酶多肽。

如对技术人员将是明显的，蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供能够编码主题多肽的所有多核苷酸的描述。遗传密码子的简并性，其中相同氨基酸由可选的或同义的密码子编码，允许制备极大数目的核酸，所有这些核酸编码工程化酶(例如PPM)多肽。因此，本发明提供了通过基于可能的密码子选项来选择组合用于产生编码本文描述的酶多肽的可制备的酶多核苷酸的每种和每一种可能变化形式的方法和组合物，并且所有这样的变化形式都被认为是针对本文描述的任何多肽具体公开的，包括实施例中(例如，各个表格中)呈现的氨基酸序列。

在一些实施方案中，密码子被优选地优化，以被用于蛋白产生的选择的宿主细胞利用。例如，细菌中使用的优选的密码子通常用于细菌中的表达。因此，编码工程化酶多肽的密码子优化的多核苷酸在全长编码区的约40％、50％、60％、70％、80％或大于90％的密码子位置包含优选的密码子。

在一些实施方案中，酶多核苷酸编码具有酶活性与本文公开的性质的工程化多肽，其中所述多肽包含与选自本文提供的SEQ ID NO的参考序列具有至少60％、65％、70％、75％、80％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或更多同一性的氨基酸序列，或任何变体(例如实施例中提供的那些)的氨基酸序列，和与一种或更多种参考多核苷酸或如实施例中公开的任何变体的氨基酸序列相比的一个或更多个残基差异(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个氨基酸残基位置)。在一些实施方案中，参考多肽序列选自SEQ ID NO:2、4、118、266、420、562、656、790和/或846。

在一些实施方案中，多核苷酸能够与选自本文提供的任何多核苷酸序列的参考多核苷酸序列或其互补序列或者编码本文提供的任何变体酶多肽的多核苷酸序列在高度严格条件下杂交。在一些实施方案中，能够在高度严格条件下杂交的多核苷酸编码包含与参考序列相比具有一个或更多个残基差异的氨基酸序列的酶多肽。

在一些实施方案中，编码本文的工程化酶多肽中的任一个的分离的多核苷酸以各种方式被操纵，以促进酶多肽的表达。在一些实施方案中，编码酶多肽的多核苷酸构成表达载体，其中存在一个或更多个控制序列来调节酶多核苷酸和/或多肽的表达。根据所用的表达载体，在分离的多核苷酸插入载体之前对分离的多核苷酸的操纵可以是期望的或必要的。利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。在一些实施方案中，控制序列包括，除其他以外，启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。在一些实施方案中，基于宿主细胞的选择对合适的启动子进行选择。对于细菌宿主细胞，用于指导本公开内容的核酸构建体的转录的合适启动子包括，但不限于从以下获得的启动子：大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因，以及原核β-内酰胺酶基因(参见，例如，Villa-Kamaroff等人，Proc.Natl Acad.Sci.USA 75:3727-3731[1978])，以及tac启动子(参见，例如，DeBoer等人，Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括但不限于从以下的基因获得的启动子：米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusariumoxysporum)胰蛋白酶样蛋白酶(参见，例如WO 96/00787)，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体)，和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因：酿酒酵母(Saccharomycescerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如，Romanos等人，Yeast 8:423-488[1992])。

在一些实施方案中，控制序列也是合适的转录终止子序列(即由宿主细胞识别以终止转录的序列)。在一些实施方案中，终止子序列可操作地连接至编码酶多肽的核酸序列的3'末端。在选择的宿主细胞中有功能的任何合适的终止子可用于本发明中。用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得：酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如，Romanos等，上文)。

在一些实施方案中，控制序列也是合适的前导序列(即对由宿主细胞的翻译重要的mRNA的非翻译区)。在一些实施方案中，前导序列可操作地连接至编码酶多肽的核酸序列的5'末端。在选择的宿主细胞中有功能的任何合适的前导序列可用于本发明中。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得：米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列从以下的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

在一些实施方案中，控制序列也是多腺苷酸化序列(即可操作地连接至核酸序列的3'末端的序列，并且其在转录时，被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号)。在选择的宿主细胞中有功能的任何合适的多腺苷酸化序列可用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括，但不限于以下的基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列是已知的(参见例如Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。

在一些实施方案中，控制序列也是信号肽(即编码连接至多肽的氨基末端并将编码的多肽引导到细胞的分泌途径的氨基酸序列的编码区)。在一些实施方案中，核酸序列的编码序列的5'末端固有地包含信号肽编码区，其符合翻译阅读框地(in translationreading frame)与编码分泌的多肽的编码区的区段天然地连接。可选择地，在一些实施方案中，编码序列的5'末端包含对编码序列而言外来的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何合适的信号肽编码区可用于一种或更多种工程化多肽的表达。用于细菌宿主细胞的有效信号肽编码区是包括但不限于从以下的基因获得的那些信号肽编码区：芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如，Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。在一些实施方案中，对于丝状真菌宿主细胞有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和Humicola lanuginosa脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些：酿酒酵母α-因子和酿酒酵母转化酶。

在一些实施方案中，控制序列也是编码定位在多肽的氨基末端处的氨基酸序列的前肽编码区。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区可以从包括但不限于以下的基因的任何合适的来源获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如WO 95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时，前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。

在一些实施方案中，还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达调节。调节系统的实例是引起基因的表达响应于化学或物理刺激(包括调节性化合物的存在)被开启或关闭的那些。在原核宿主细胞中，合适的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中，合适的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中，合适的调节序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。

在另一方面，本发明涉及包含编码工程化酶多肽的多核苷酸，以及根据其待引入的宿主的类型，一个或更多个表达调控区诸如启动子和终止子、复制起点等的重组表达载体。在一些实施方案中，本文描述的各种核酸和控制序列连接在一起以产生重组表达载体，所述重组表达载体包括一个或更多个方便的限制性位点，以允许在这样的位点插入或取代编码酶多肽的核酸序列。可选择地，在一些实施方案中，本发明的核酸序列通过将核酸序列或包含该序列的核酸构建体插入到用于表达的合适的载体中来表达。在涉及产生表达载体的一些实施方案中，编码序列位于载体中使得编码序列与用于表达的适当的控制序列可操作地连接。

重组表达载体可以是任何合适的载体(例如，质粒或病毒)，其可以方便地进行重组DNA程序并且引起酶多核苷酸序列的表达。载体的选择通常取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。

在一些实施方案中，表达载体为自主复制载体(即，作为染色体外的实体存在的载体，其复制独立于染色体复制，诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选择的实施方案中，载体是其中当被引入宿主细胞中时，被整合到基因组中并与其被整合进的一条或更多条染色体一起复制的载体。此外，在一些实施方案中，利用了单一载体或质粒，或者一起包含待引入宿主细胞的基因组中的总DNA的两种或更多种载体或质粒，和/或转座子。

在一些实施方案中，表达载体包含允许容易选择转化的细胞的一个或更多个选择标志物(selectable marker)。“选择标志物”是其产物提供抗微生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。细菌的选择标志物的实例包括但不限于，来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶；例如来自构巢曲霉(A.nidulans)或米曲霉(A.orzyae))、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶；例如来自吸水链霉菌(S.Hygroscopicus))、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶；例如来自构巢曲霉或米曲霉)、sC(硫酸腺苷酰转移酶(sulfateadenyltransferase))和trpC(邻氨基苯甲酸合酶)，以及其等同物。

在另一方面，本发明提供了一种宿主细胞，所述宿主细胞包含编码本发明的至少一种工程化酶多肽的至少一种多核苷酸，所述多核苷酸可操作地连接至一个或更多个控制序列用于在宿主细胞中表达一种或更多种工程化酶。适合在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的，并且包括但不限于细菌细胞，诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门菌(Salmonellatyphimurium)细胞；真菌细胞，诸如酵母细胞(例如，酿酒酵母或巴斯德毕赤酵母(Pichiapastoris)(ATCC登录号201178))；昆虫细胞，诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞；动物细胞，诸如CHO、COS、BHK、293和Bowes黑素瘤细胞；和植物细胞。示例性宿主细胞还包括各种大肠杆菌(Escherichia coli)菌株(例如，W3110(ΔfhuA)和BL21)。细菌的选择标志物的实例包括但不限于，来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素和/或四环素抗性的标志物。

在一些实施方案中，本发明的表达载体包含允许载体整合到宿主细胞的基因组中或允许载体在细胞中独立于基因组进行自主复制的元件。在一些涉及整合到宿主细胞基因组中的实施方案中，载体依赖于编码多肽的核酸序列或用于通过同源或非同源重组将载体整合到基因组中的载体的任何其他元件。

在一些替代实施方案中，表达载体包含另外的核酸序列，用于指导通过同源重组整合到宿主细胞的基因组中。另外的核酸序列使载体能够在一条或更多条染色体中的一个或更多个精确位置处整合到宿主细胞基因组中。为了增加在精确位置处整合的可能性，整合元件优选地包含足够数量的核苷酸，诸如100个至10,000个碱基对，优选地400个至10,000个碱基对，和最优选地800个至10,000个碱基对，它们与相应的靶序列高度同源，以提高同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码或编码核酸序列。在另一方面，载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制，载体还可以包含复制起点，使得载体能够在所讨论的宿主细胞中自主复制。细菌复制起点的实例是允许在大肠杆菌中复制的P15A ori，或者质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)或pACYC184的复制起点以及允许在芽孢杆菌属(Bacillus)中复制的pUB110、pE194或pTA1060的复制起点。用于在酵母宿主细胞中使用的复制起点的实例是2μm复制起点、ARS1、ARS4、ARS1和CEN3的组合以及ARS4和CEN6的组合。复制起点可以是具有使其在宿主细胞中温度敏感地发挥功能的突变的复制起点(参见例如，Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433[1978])。

在一些实施方案中，将多于一个拷贝的本发明的核酸序列插入宿主细胞以增加基因产物的产生。核酸序列拷贝数的增加可以通过将该序列的至少一个另外的拷贝整合到宿主细胞基因组中，或者通过将可扩增的选择标志物基因包含在核酸序列中来获得，其中可以通过在合适的选择剂的存在下培养细胞来选择含有选择标志物基因的扩增的拷贝并从而含有核酸序列的另外的拷贝的细胞。

用于本发明的许多表达载体是商购可得的。合适的商业表达载体包括但不限于p3xFLAGTM

因此，在一些实施方案中，将包含编码至少一种变体磷酸戊糖变位酶的序列的载体转化到宿主细胞中，以允许载体的增殖和一种或更多种变体磷酸戊糖变位酶的表达。在一些实施方案中，变体磷酸戊糖变位酶被翻译后修饰以去除信号肽，并且在一些情况下可以在分泌后被裂解。在一些实施方案中，上文描述的转化的宿主细胞在合适的营养培养基中，在允许表达一种或更多种变体磷酸戊糖变位酶的条件下培养。可用于培养宿主细胞的任何合适的培养基可用于本发明，包括但不限于含有合适补充物的基本培养基或复合培养基。在一些实施方案中，宿主细胞在HTP培养基中生长。合适的培养基可以从多个商业供应商获得，或者可以根据公开的配方(例如，在美国典型培养物保藏中心的目录中的)制备。

在另一方面，本发明提供了包含编码本文提供的改进的磷酸戊糖变位酶多肽的多核苷酸的宿主细胞，所述多核苷酸可操作地连接到用于在宿主细胞中表达磷酸戊糖变位酶的一个或更多个控制序列。用于表达由本发明的表达载体编码的磷酸戊糖变位酶多肽的宿主细胞是本领域熟知的，并且包括但不限于，细菌细胞诸如大肠杆菌、巨大芽孢杆菌(Bacillus megaterium)、开菲尔乳杆菌(Lactobacillus kefir)、链霉菌属和鼠伤寒沙门菌细胞；真菌细胞诸如酵母细胞(例如酿酒酵母或巴斯德毕赤酵母(ATCC登录号201178))；昆虫细胞诸如果蝇属S2和夜蛾属Sf9细胞；动物细胞诸如CHO、COS、BHK、293和Bowes黑素瘤细胞；和植物细胞。用于上文描述的宿主细胞的合适的培养基和生长条件是本领域熟知的。

用于表达磷酸戊糖变位酶的多核苷酸可以通过本领域已知的各种方法引入细胞中。技术包括，除其他以外，电穿孔、生物弹射粒子轰击(biolistic particlebombardment)、脂质体介导的转染、氯化钙转染和原生质体融合。用于将多核苷酸引入细胞中的各种方法是本领域技术人员已知的。

在一些实施方案中，宿主细胞为真核细胞。合适的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。合适的真菌宿主细胞包括但不限于子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、半知菌亚门(Deuteromycota)、接合菌门(Zygomycota)、不完全菌(Fungi imperfecti)。在一些实施方案中，真菌宿主细胞是酵母细胞和丝状真菌细胞。本发明的丝状真菌宿主细胞包括Eumycotina和卵菌亚门(Oomycota)的所有丝状形式。丝状真菌的特征是营养菌丝体，其中细胞壁由几丁质、纤维素和其他复杂多糖组成。本发明的丝状真菌宿主细胞在形态学上不同于酵母。

在本发明的一些实施方案中，丝状真菌宿主细胞是任何合适的属和种，包括但不限于：绵霉属(Achlya)、枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢子菌属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、隐丛壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothis)、镰刀菌属(Fusarium)、赤霉菌属(Gibberella)、粘帚霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨形孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉属(Scytalidium)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)、和/或草菇属(Volvariella)、和/或有性型或无性型、以及其同物异名、基原异名或分类学等同物。

在本发明的一些实施方案中，宿主细胞是酵母细胞，包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)物种的细胞。在本发明的一些实施方案中，酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡尔斯伯酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、Saccharomyces norbensis、克鲁维酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母、Pichia finlandica、Pichia trehalophila、Pichia kodamae、膜醭毕赤酵母(Pichiamembranaefaciens)、Pichia opuntiae、Pichia thermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichia angusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白念珠菌(Candida albicans)或解脂耶氏酵母(Yarrowialipolytica)。

在本发明的一些实施方案中，宿主细胞是藻类细胞，诸如衣藻属(Chlamydomonas)(例如莱茵衣藻(C.reinhardtii))和席藻属(Phormidium)(席藻属物种ATCC29409)。

在一些其他实施方案中，宿主细胞为原核细胞。合适的原核细胞包括但不限于革兰氏阳性、革兰氏阴性和革兰氏可变(Gram-variable)细菌细胞。任何合适的细菌生物体可用于本发明，包括但不限于土壤杆菌属(Agrobacterium)、脂环酸芽胞杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、组囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、嗜酸栖热菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、Campestris、弯曲杆菌属(Camplyobacter)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭形杆菌属(Fusobacterium)、粪杆菌属(Faecalibacterium)、弗朗西丝菌属(Francisella)、黄杆菌属(Flavobacterium)、地芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯氏菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、微杆菌属(Microbacterium)、中生根瘤菌(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅列藻属(Scenedesmus)、链霉菌属、链球菌属(Streptococcus)、Synecoccus、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷菌属(Serratia)、沙门菌属(Salmonella)、志贺菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、嗜热聚球藻(Thermosynechococcus)、热球菌属(Thermococcus)、脲原体(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施方案中，宿主细胞是以下的物种：土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、布赫纳氏菌属、地芽孢杆菌属、弯曲杆菌属、梭菌属、棒状杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门菌属、链球菌属、链霉菌属或发酵单胞菌属。在一些实施方案中，细菌宿主菌株对人类是非致病性的。在一些实施方案中，细菌宿主菌株是工业菌株。许多细菌的工业菌株是已知的并且适用于本发明。在本发明的一些实施方案中，细菌宿主细胞是土壤杆菌属物种(例如，放射形土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)和悬钩子土壤杆菌(A.rubi))。在本发明的一些实施方案中，细菌宿主细胞是节杆菌属物种(例如，金黄节杆菌(A.aurescens)、柠檬色节杆菌(A.citreus)、球形节杆菌(A.globiformis)、A.hydrocarboglutamicus、A.mysorens、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、A.protophonniae、A.roseoparqffinus、硫磺色节杆菌(A.sulfureus)和产脲节杆菌(A.ureafaciens))。在本发明的一些实施方案中，细菌宿主细胞是芽孢杆菌属物种(例如，苏云金芽孢杆菌(B.thuringensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、B.alkaophius、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens))。在一些实施方案中，宿主细胞是工业芽孢杆菌属菌株，包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽孢杆菌或解淀粉芽孢杆菌。在一些实施方案中，芽孢杆菌宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌和/或解淀粉芽孢杆菌。在一些实施方案中，细菌宿主细胞是梭菌属物种(例如，丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌E88(C.tetani E88)、象牙海岸梭菌(C.lituseburense)、C.saccharobutylicum、产气荚膜梭菌(C.perfringens)和拜氏梭菌(C.beijerinckii))。在一些实施方案中，细菌宿主细胞是棒状杆菌属物种(例如，谷氨酸棒状杆菌(C.glutamicum)和嗜乙酰乙酸棒状杆菌(C.acetoacidophilum))。在一些实施方案中，细菌宿主细胞为埃希氏菌属物种(例如，大肠杆菌)。在一些实施方案中，宿主细胞为大肠杆菌W3110。在一些实施方案中，细菌宿主细胞是欧文氏菌属物种(例如，噬夏孢欧文氏菌(E.uredovora)、胡萝卜软腐欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、E.punctata和E.terreus)。在一些实施方案中，细菌宿主细胞是泛菌属物种(例如，柠檬酸泛菌(P.citrea)和成团泛菌(P.agglomerans))。在一些实施方案中，细菌宿主细胞是假单胞菌属物种(例如恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii和假单胞菌属物种D-0l 10(P.sp.D-0l 10))。在一些实施方案中，细菌宿主细胞是链球菌属物种(例如，S.equisimiles、酿脓链球菌(S.pyogenes)和乳房链球菌(S.uberis))。在一些实施方案中，细菌宿主细胞是链霉菌属物种(例如，生二素链霉菌(S.ambofaciens)、不产色链霉菌(S.achromogenes)、除虫链霉菌(S.avermitilis)、天蓝色链霉菌(S.coelicolor)、生金色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)和变铅青链霉菌(S.lividans))。在一些实施方案中，细菌宿主细胞是发酵单胞菌属物种(例如，运动发酵单胞菌(Z.mobilis)和解脂发酵单胞菌(Z.lipolytica))。

可用于本发明的许多原核和真核菌株是公众从许多培养物保藏中心可容易地获得的，诸如美国典型培养物保藏中心(ATCC)、德国微生物和真菌保藏中心(DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH,DSM)、荷兰中央农业研究中心(Centraalbureau Voor Schimmelcultures,CBS)和美国农业研究服务专利培养物保藏中心北方区域研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center,NRRL)。

在一些实施方案中，宿主细胞被遗传修饰以具有改进蛋白分泌、蛋白稳定性的特征和/或蛋白表达和/或分泌所期望的其他性质。遗传修饰可以通过遗传工程技术和/或典型微生物技术(例如，化学或UV诱变和随后的选择)来实现。事实上，在一些实施方案中，重组修饰和典型选择技术的组合用于产生宿主细胞。使用重组技术，核酸分子可以以引起宿主细胞内和/或培养基中一种或更多种磷酸戊糖变位酶变体的产量增加的方式引入、缺失、抑制或修饰。例如，敲除Alp1功能产生蛋白酶缺陷的细胞，并且敲除pyr5功能产生具有嘧啶缺陷表型的细胞。在一种遗传工程方法中，同源重组用于通过在体内特异性靶向基因来诱导靶向的基因修饰，以抑制编码蛋白的表达。在替代方法中，siRNA、反义和/或核酶技术可用于抑制基因表达。本领域已知各种降低细胞中的蛋白表达的方法，包括但不限于编码蛋白的基因的全部或一部分的缺失，和位点特异性诱变以破坏基因产物的表达或活性。(参见例如，Chaveroche等人,Nucl.Acids Res.,28:22e97[2000]；Cho等人,Molec.PlantMicrobe Interact.,19:7-15[2006]；Maruyama和Kitamoto,Biotechnol Lett.,30:1811-1817[2008]；Takahashi等人,Mol.Gen.Genom.,272:344-352[2004]；和You等人,Arch.Microbiol.,191:615-622[2009]，其均通过引用并入本文)。也可使用随机诱变，随后筛选期望的突变(参见例如，Combier等人,FEMS Microbiol.Lett.,220:141-8[2003]；和Firon等人,Eukary.Cell 2:247-55[2003]，二者通过引用并入)。

将载体或DNA构建体引入宿主细胞中可以使用本领域已知的任何合适的方法完成，包括但不限于磷酸钙转染、DEAE-葡聚糖介导的转染、PEG介导的转化、电穿孔或本领域已知的其他常用技术。在一些实施方案中，可使用大肠杆菌表达载体pCK100900i(参见，美国专利第9,714,437号，通过参考特此并入本文)。

在一些实施方案中，本发明的工程化宿主细胞(即，“重组宿主细胞”)在常规营养培养基中培养，所述培养基经适当修改以激活启动子、选择转化体或扩增磷酸戊糖变位酶多核苷酸。培养条件，诸如温度、pH等，是先前与选择用于表达的宿主细胞一起使用的那些，并且是本领域技术人员熟知的。如所述的，许多标准参考文献和教科书可用于许多细胞的培养和产生，包括细菌、植物、动物(尤其是哺乳动物)和古细菌(archebacterial)来源的细胞的培养和产生。

在一些实施方案中，表达本发明的变体磷酸戊糖变位酶多肽的细胞在分批或连续发酵条件下生长。典型的“分批发酵”是封闭的系统，其中培养基的组成在发酵开始时设定，并且在发酵期间不受人为变化的影响。分批系统的一种变化形式是“补料分批发酵”，其也可用于本发明。在这种变化形式中，随着发酵的进行，底物以增量添加。当分解代谢物阻遏可能抑制细胞的代谢时，以及期望培养基中具有有限量的底物时，补料分批系统是有用的。分批发酵和补料分批发酵是本领域常见和熟知的。“连续发酵”是开放的系统，其中将确定的发酵培养基连续添加到生物反应器，并且同时取出等量的条件培养基用于处理。连续发酵通常将培养物维持在恒定的高密度，其中细胞主要处于对数期生长。连续发酵系统力图维持稳态生长条件。用于调节用于连续发酵过程的营养物和生长因子的方法以及用于使产物形成速率最大化的技术是工业微生物学领域熟知的。

在本发明的一些实施方案中，无细胞转录/翻译系统可用于产生一种或更多种变体磷酸戊糖变位酶。若干系统是商购可得的，并且方法是本领域技术人员熟知的。

本发明提供了制备变体磷酸戊糖变位酶多肽或其生物活性片段的方法。在一些实施方案中，该方法包括：提供用编码包含与SEQ ID NO:2、4、118、266、420、562、656、790和/或846至少约70％(或至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％)序列同一性并且包含至少一个本文提供的突变的氨基酸序列的多核苷酸转化的宿主细胞；在培养基中在宿主细胞表达编码的变体磷酸戊糖变位酶多肽的条件下培养转化的宿主细胞；和任选地回收或分离表达的变体磷酸戊糖变位酶多肽，和/或回收或分离含有表达的变体磷酸戊糖变位酶多肽的培养基。在一些实施方案中，方法还提供任选地在表达编码的磷酸戊糖变位酶多肽后裂解转化的宿主细胞，并任选地从细胞裂解物回收和/或分离表达的变体磷酸戊糖变位酶多肽。本发明还提供了制备变体磷酸戊糖变位酶多肽的方法，所述方法包括在适于产生变体磷酸戊糖变位酶多肽的条件下培养用变体磷酸戊糖变位酶多肽转化的宿主细胞，并回收变体磷酸戊糖变位酶多肽。通常，使用本领域熟知的蛋白质回收技术，包括本文描述的那些技术，从宿主细胞培养基、宿主细胞或两者回收或分离磷酸戊糖变位酶多肽。在一些实施方案中，通过离心收集宿主细胞，通过物理或化学手段破坏，并保留所得的粗提取物用于进一步纯化。用于蛋白质表达的微生物细胞可以通过任何方便的方法来破坏，包括但不限于冻融循环、声波处理(sonication)、机械破坏和/或使用细胞裂解剂，以及本领域技术人员熟知的许多其他合适的方法。

宿主细胞中表达的工程化磷酸戊糖变位酶可以使用本领域已知的用于蛋白纯化的技术中的任一种或更多种从细胞和/或培养基回收，所述用于蛋白纯化的技术包括，除了其他以外，溶菌酶处理、声波处理、过滤、盐析、超离心和色谱法。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是以商标名CelLytic B

用于分离磷酸戊糖变位酶多肽的色谱技术包括但不限于，反相色谱、高效液相色谱、离子交换色谱、凝胶电泳和亲和色谱。用于纯化特定酶的条件部分地取决于诸如以下的因素：净电荷、疏水性、亲水性、分子量、分子形状等，是本领域技术人员已知的。

在一些实施方案中，亲和技术可用于分离改进的磷酸戊糖变位酶。对于亲和色谱纯化，可以使用特异性结合磷酸戊糖变位酶多肽的任何抗体。为了产生抗体，可以通过注射磷酸戊糖变位酶免疫接种各种宿主动物，包括但不限于兔、小鼠、大鼠等。磷酸戊糖变位酶多肽可以借助于侧链官能基团或附接至侧链官能基团的接头附接至合适的载体诸如BSA。根据宿主物种，可以使用各种佐剂增强免疫应答，包括但不限于弗氏(完全和不完全)、矿物凝胶诸如氢氧化铝、表面活性物质诸如溶血卵磷脂、普朗尼克多元醇、聚阴离子、肽、油乳剂、钥孔

在一些实施方案中，制备磷酸戊糖变位酶变体并以表达酶的细胞形式、作为粗提取物或作为分离或纯化的制品使用。在一些实施方案中，将磷酸戊糖变位酶变体制备成冻干剂、粉末形式(例如丙酮粉末)，或者制备成酶溶液。在一些实施方案中，磷酸戊糖变位酶变体是基本上纯的制品形式。

在一些实施方案中，磷酸戊糖变位酶多肽连接到任何合适的固体基底。固体基底包括但不限于固相、表面和/或膜。固体支持物包括但不限于有机聚合物诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺，以及它们的共聚物和接枝物。固体支持物还可以是无机的，诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。基底的构型可以呈珠、球、颗粒(particle)、小粒(granule)、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的，并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。多于一个支持物可以被配置在阵列上于多个位置处，所述位置可用试剂的自动递送或通过检测方法和/或仪器寻址。

在一些实施方案中，免疫学方法用于纯化磷酸戊糖变位酶变体。在一种方法中，使用常规方法产生的针对野生型或变体磷酸戊糖变位酶多肽(例如，针对包含SEQ ID NO:2、4、118、266、420、562、656、790和/或846的任一种的多肽、和/或其变体、和/或其免疫原性片段)的抗体被固定在珠上，与细胞培养基在变体磷酸戊糖变位酶被结合的条件下混合，并沉淀。在一种相关的方法中，可使用免疫色谱法(immunochromatography)。

在一些实施方案中，将变体磷酸戊糖变位酶表达为包含非酶部分的融合蛋白。在一些实施方案中，变体磷酸戊糖变位酶序列与纯化促进结构域融合。如本文使用的，术语“纯化促进结构域”是指介导与其融合的多肽的纯化的结构域。合适的纯化结构域包括但不限于金属螯合肽、允许在固定化金属上纯化的组氨酸-色氨酸模块、结合谷胱甘肽的序列(例如，GST)、血凝素(HA)标签(对应于源自流感血凝素蛋白的表位；参见例如，Wilson等人,Cell 37:767[1984])、麦芽糖结合蛋白序列、在FLAGS延伸/亲和纯化系统(例如，可从Immunex Corp获得的系统)中使用的FLAG表位，等等。考虑用于本文描述的组合物和方法的一种表达载体提供了融合蛋白的表达，所述融合蛋白包含与由肠激酶裂解位点隔开的多组氨酸区域融合的本发明的多肽。组氨酸残基促进在IMIAC(固定化金属离子亲和色谱；参见例如，Porath等人,Prot.Exp.Purif.,3:263-281[1992])上纯化，而肠激酶裂解位点提供了从融合蛋白分离变体磷酸戊糖变位酶多肽的手段。pGEX载体(Promega)也可用于表达将外源多肽表达为与谷胱甘肽S-转移酶(GST)的融合蛋白。一般来说，这样的融合蛋白是可溶的，并且可以通过吸附到配体-琼脂糖珠(例如，在GST-融合蛋白的情况下，谷胱甘肽-琼脂糖)，然后在游离配体的存在下洗脱，容易地从裂解的细胞纯化。

因此，在另一方面，本发明提供了产生工程化酶多肽的方法，其中所述方法包括将能够表达编码工程化酶多肽的多核苷酸的宿主细胞在适合于该多肽表达的条件下培养。在一些实施方案中，方法还包括分离和/或纯化如本文描述的酶多肽的步骤。

用于宿主细胞的合适的培养基和生长条件是本领域熟知的。考虑了，用于将用于表达酶多肽的多核苷酸引入细胞中的任何合适的方法可用于本发明。合适的技术包括但不限于，电穿孔、生物弹射粒子轰击、脂质体介导的转染、氯化钙转染和原生质体融合。

本发明的各种特征和实施方案在以下代表性实施例中进行了说明，这些实施例旨在说明而非限制。

实验

提供以下实施例，包括实验和获得的结果，仅用于说明的目的，而不应被解释为限制本发明。事实上，下文描述的许多试剂和设备有多种合适的来源。不意图将本发明限于任何试剂和设备项目的任何特定来源。

在下文的实验公开内容中，应用以下缩写：M(摩尔/升)；mM(毫摩尔/升)，uM和μM(微摩尔/升)；nM(纳摩尔/升)；mol(摩尔)；gm和g(克)；mg(毫克)；ug和μg(微克)；L和l(升)；ml和mL(毫升)；cm(厘米)；mm(毫米)；um和μm(微米)；sec.(秒)；min(s)(分钟)；h(s)和hr(s)(小时)；U(单位)；MW(分子量)；rpm(转/分)；psi和PSI(磅/平方英寸)；℃(摄氏度)；RT和rt(室温)；CV(变异系数)；CAM和cam(氯霉素)；PMBS(硫酸多粘菌素B)；IPTG(异丙基β-D-l-硫代吡喃半乳糖苷)；LB(溶菌肉汤，lysogeny broth)；TB(超级肉汤，terrific broth)；SFP(摇瓶粉末)；CDS(编码序列)；DNA(脱氧核糖核酸)；RNA(核糖核酸)；nt(核苷酸；多核苷酸)；aa(氨基酸；多肽)；大肠杆菌W3110(常用的实验室大肠杆菌菌株，可从Coli Genetic StockCenter[CGSC]，New Haven，CT获得)；HTP(高通量)；HPLC(高压液相色谱)；HPLC-UV(HPLC-紫外光可见检测器)；1H NMR(质子核磁共振光谱学)；FIOPC(相对于阳性对照的倍数改进)；Sigma和Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO)；Difco(Difco Laboratories,BDDiagnostic Systems,Detroit,MI)；Microfluidics(Microfluidics,Westwood,MA)；LifeTechnologies(Life Technologies,Fisher Scientific,Waltham,MA的一部分)；Amresco(Amresco,LLC,Solon,OH)；Carbosynth(Carbosynth,Ltd.,Berkshire,UK)；Varian(VarianMedical Systems,Palo Alto,CA)；Agilent(Agilent Technologies,Inc.,Santa Clara,CA)；Infors(Infors USA Inc.,Annapolis Junction,MD)；和Thermotron(Thermotron,Inc.,Holland,MI)。

实施例1

含HTP PPM的湿细胞沉淀的制备

用于产生本发明的变体的PPM(SEQ ID NO:2)酶的亲本基因从大肠杆菌基因组获得，并克隆到pCK110900载体中。用含有PPM编码基因的相应质粒转化W3110大肠杆菌细胞，并铺板在含有1％葡萄糖和30μg/ml氯霉素(CAM)的LB琼脂板上，并在37℃生长过夜。挑选单克隆菌落，并接种到180μl含有1％葡萄糖和30μg/mL氯霉素的LB中，并置于96孔浅孔微量滴定板的孔中。将板用O

实施例2

含HTP PPM的细胞裂解物的制备

用400μl含有100mM三乙醇胺缓冲液pH 7.5、1mg/mL溶菌酶、0.5mg/mL PMBS和0.3-5mM MnCl

实施例3

从摇瓶(SF)培养物制备冻干裂解物

将从具有1％葡萄糖和30μg/ml CAM的LB琼脂板挑选并在37℃孵育过夜的含有期望的基因的单个菌落转移到6ml具有1％葡萄糖和30μg/ml CAM的LB。使培养物在30℃、250rpm生长18小时，并以约1:50传代培养至250ml含30μg/ml CAM的TB中，至约0.05的最终OD

实施例4

用于产生化合物4的改进的磷酸戊糖变位酶变体

选择SEQ ID NO:2作为亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽，并且如实施例2中描述地产生澄清的裂解物。

对于每种酶，将澄清的细胞裂解物在含0.3mM MnCl

相对于SEQ ID NO:2的活性计算为与SEQ ID NO:2相比，每变体转化百分比形成的产物的转化百分比。通过将由LCMS分析确定的产物峰的面积除以底物峰和产物峰的面积之和来定量转化百分比。

实施例5

用于产生化合物4的改进的磷酸戊糖变位酶变体

选择SEQ ID NO:4作为用于这些实验的亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽，并且除了裂解缓冲液中MnCl

对于每种酶，将澄清的细胞裂解物在含10mM MnCl

相对于SEQ ID NO:4的活性计算为与SEQ ID NO:4的转化百分比相比，变体酶形成的产物的转化百分比。通过将由LCMS分析确定的产物峰的面积除以底物峰和产物峰的面积之和来定量转化百分比。

实施例6

用于产生化合物4的改进的磷酸戊糖变位酶变体

对于这些实验，选择SEQ ID NO:118作为亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽，并且如实施例2中描述地产生澄清的裂解物。

化合物3通过以下来合成：在圆底烧瓶中，将100mL的在100mM三乙醇胺缓冲液pH7.5中的68mM化合物1和145mM磷酸钾与100mL的在100mM三乙醇胺缓冲液pH 7.5中的1g/LPNP(SEQ ID NO:1154)混合，在45℃以750rpm搅拌18小时。将反应混合物在4000rpm、4℃离心1.5小时。将上清液冷冻并冷冻干燥18小时。

对于每种酶，将澄清的细胞裂解物在50mM TEoA,pH 7.5中稀释50倍。每个100μL反应在96孔浅孔微量滴定板中以90μL的在100mM三乙醇胺缓冲液pH 7.5中的20mM化合物3和10μL稀释的澄清裂解物进行。将板密封，并在40℃、800rpm孵育过夜。用3倍体积的在水中的3mM EDTA猝灭反应，在桌上型振荡器上摇动15分钟，并且然后在4℃以4000rpm离心10分钟。通过取出25uL的猝灭的样品进一步稀释样品，并转移到圆底96孔板中的7uL 3mM EDTA中用于LC-MS分析。

相对于SEQ ID NO:118的活性计算为在指定的反应条件下，与SEQ ID NO:118产生的转化百分比相比，变体酶形成的产物的转化百分比。通过将由LCMS分析确定的产物峰的面积除以底物峰和产物峰的面积之和来定量转化百分比。

实施例7

用于产生化合物4的改进的磷酸戊糖变位酶变体

对于这些实验，选择SEQ ID NO:266作为亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽，并且如实施例2中描述地产生澄清的裂解物。

化合物3通过以下来合成：在圆底烧瓶中，将100mL的在100mM三乙醇胺缓冲液,pH7.5中的68mM化合物1和145mM磷酸钾与100mL的在100mM三乙醇胺缓冲液,pH 7.5中的1g/LPNP(SEQ ID NO:1154)混合，在45℃以750rpm搅拌18小时。将反应混合物在4000rpm、4℃离心1.5小时。将上清液冷冻并冷冻干燥18小时。

对于每种酶，将澄清的细胞裂解物在50mM TEoA,pH 7.5中稀释50倍。每个100μL反应在96孔浅孔微量滴定板中以90μL的在100mM三乙醇胺缓冲液pH 7.5中的20mM化合物3和10μL稀释的澄清裂解物进行。将板密封，并在40℃、800rpm孵育18小时。用3倍体积的3mMEDTA猝灭反应，在桌上型振荡器上摇动15分钟，并且然后在4℃以4000rpm离心10分钟。

用50μL含有100mM氟腺嘌呤(化合物2)、0.5g/L PNP(SEQ ID NO:1154)、0.25g/L蔗糖磷酸化酶(SEQ ID NO:1158)和100mM三乙醇胺缓冲液,pH＝7.5的底物溶液处理猝灭的逆反应50μL，以除去1-磷酸脱氧核糖(化合物3)。将反应在45℃以800rpm摇动孵育4小时。将板在4℃和4000rpm离心15分钟，并且然后取出50μL上清液并稀释到50μL的3mM EDTA中，用于LCMS分析。相对于SEQ ID NO:266的活性计算为在指定的反应条件下，由LCMS确定的由变体酶形成的产物的峰面积与由LCMS确定的由SEQ ID NO:266产生的产物的峰面积的比率。

实施例8

用于产生化合物1的改进的磷酸戊糖变位酶变体

在96孔浅孔微量滴定板中进行每个100μL反应，如方案III所示的。具体来说，25g/L化合物4、18g/L化合物2；1.5g/L PNP(SEQ ID NO:1154)、5mM MnCl

相对于SEQ ID NO:266的活性计算为在指定的反应条件下，与SEQ ID NO:266的转化百分比相比，变体酶形成的产物的转化百分比。通过将由UPLC分析确定的产物峰(化合物1)的面积除以底物(化合物2)峰、产物(化合物1)峰和杂质/副产物峰的面积之和来定量转化百分比。

实施例9

用于产生化合物1的改进的磷酸戊糖变位酶变体

选择SEQ ID NO:420作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽，并且如实施例2中描述地产生澄清的裂解物。如实施例8中描述地构建反应。

实施例10

用于产生化合物1的改进的磷酸戊糖变位酶变体

选择SEQ ID NO:420作为用于下一轮进化的亲本酶。使用良好建立的技术(例如饱和诱变，和先前鉴定的有益突变的重组)产生工程化基因的文库。如实施例1中描述地以HTP产生每种基因编码的多肽。如实施例2中描述地产生澄清的裂解物。如实施例8中描述地构建反应。

实施例11

分析方法

本实施例提供了用于收集上文的实施例中提供的数据的方法。使用表11.1中的分析方法收集如实施例8-10中所述获得的数据。本实施例中提供的方法可用于分析使用本发明产生的变体。然而，并不意在将本发明限于本文描述的方法，因为其他合适的方法是本领域技术人员已知的。

使用表11.2中的分析方法收集实施例4-6中描述的数据，用于1-磷酸脱氧核糖炔烃和5-磷酸脱氧核糖炔烃的分析检测。

使用表11.3中的分析方法收集如实施例7中所述获得的数据，用于逆反应中的5-磷酸脱氧核糖的分析检测。

实施例12

用于产生化合物1的SEQ ID NO:562的改进的磷酸戊糖变位酶变体

编码具有SEQ ID NO:562的磷酸戊糖变位酶活性的多肽的工程化多核苷酸(SEQID NO:561)用于产生表12.1和12.2的工程化多肽。与起始多肽相比，这些多肽在期望的条件下显示出改进的磷酸戊糖变位酶活性(例如，如方案IV所示，通过在SP和工程化DERA和PNP酶存在下经由化合物1的产生来测量的产生化合物3的能力)。

方案IV

从SEQ ID NO:562的“骨架”氨基酸序列产生具有偶数编号的序列标识符的氨基酸序列的工程化多肽，如下文描述的。定向进化始于SEQ ID NO:561中所列的多核苷酸。使用多种熟知的技术(例如饱和诱变，先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用HTP测定和测量多肽磷酸戊糖变位酶活性的分析方法进行筛选。在这种情况下，通过使用表12.3中的分析方法在如方案IV中所示的蔗糖磷酸化酶(SP)和工程化脱氧核糖-磷酸醛缩酶(DERA)和嘌呤核苷磷酸化酶(PNP)的存在下产生化合物1来测量活性。本文提供的方法可用于分析使用本发明产生的变体。然而，并不意在本文描述的方法是适用于分析本文提供的和/或使用本文提供的方法产生的变体的仅有方法，因为其他合适的方法可用于本发明。

如以下制备高通量裂解物。如实施例1中描述地制备来自菌落PPM变体的冷冻沉淀，并用400μl含有100mM三乙醇胺缓冲液,pH 7.5、1mg/mL溶菌酶和0.5mg/mL PMBS的裂解缓冲液进行裂解。将裂解混合物在室温摇动2小时。然后将板在4000rpm和4℃离心15min。

如以下制备摇瓶粉末(来自摇瓶培养物的冻干裂解物)。将期望的变体的细胞培养物铺板到具有1％葡萄糖和30μg/ml CAM的LB琼脂板上并在37℃生长过夜。将来自每种培养物的单个菌落转移到6ml具有1％葡萄糖和30μg/ml CAM的LB。使培养物在30℃、250rpm生长18h，并以约1:50传代培养至250ml含30μg/ml CAM的TB中，至0.05的最终OD

反应在包括DERA/PPM/PNP/SP酶的串联4酶级联装置中进行，以96孔形式，在2mL深孔板中，具有100μL的总体积。反应包括作为摇瓶粉末的DERA、PNP和SP(0.5wt％DERA SEQID NO:1162、和0.5wt％PNP SEQ ID NO:1156、4wt％的野生型SP-SEQ ID NO:1158)，26g/L或124mM对映体纯(R)-2-乙炔基-甘油醛底物，99mM F-腺嘌呤(0.8当量)，186mM乙醛(异丙醇中40wt％，1.5当量)，372mM蔗糖(3.0当量)，5mM MnCl

用300μL的1M KOH和DMSO 1:1混合物猝灭反应。将猝灭的反应在桌上型振荡器上摇动10min，然后在4℃以4000rpm离心5min，以沉淀出任何沉淀物。然后将10微升上清液转移到预先填充有190μL 0.1M TEoA pH 7.5缓冲液中的25％MeCN的96孔圆底板中。将样品注入到Thermo U3000 UPLC系统，并使用Atlantis T3 C18,3μm,2.1x100mm柱等度分离，其中流动相包含补充有0.1％TFA的75:25水:乙腈，如实施例12-3中描述的。相对于SEQ ID NO:562的活性计算为在指定的反应条件下，与SEQ ID NO:562形成的化合物1的峰面积相比，变体酶形成的化合物1的峰面积。

实施例13

用于产生化合物1的SEQ ID NO:656的改进的磷酸戊糖变位酶变体

编码具有SEQ ID NO:656的磷酸戊糖变位酶活性的多肽的工程化多核苷酸(SEQID NO:655)用于产生表13.1的工程化多肽。与起始多肽相比，这些多肽在期望的条件下显示出改进的磷酸戊糖变位酶活性(例如，产生化合物3的能力，如经由在方案IV中所示的工程化DERA、PNP和SP酶存在下产生化合物1所测量的)。

从SEQ ID NO:656的“骨架”氨基酸序列产生具有偶数编号的序列标识符的氨基酸序列的工程化多肽，如下文描述的。定向进化始于SEQ ID NO:655中所列的多核苷酸。使用多种熟知的技术(例如饱和诱变，先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用HTP测定和测量多肽磷酸戊糖变位酶活性的分析方法进行筛选。在这种情况下，通过使用表12.3中的分析方法在如方案IV中所示的工程化蔗糖磷酸化酶(SP)、脱氧核糖-磷酸醛缩酶(DERA)和嘌呤核苷磷酸化酶(PNP)的存在下产生化合物1来测量活性。本文提供的方法可用于分析使用本发明产生的变体。然而，并不意在本文描述的方法是适用于分析本文提供的和/或使用本文提供的方法产生的变体的仅有方法，因为其他合适的方法可用于本发明。

反应在包括DERA/PPM/PNP/SP酶的串联4酶级联装置中进行，以96孔形式，在2mL深孔板中，具有100μL的总体积。反应包括作为摇瓶粉末的DERA、PNP和SP(0.5wt％DERA SEQID NO:1164、0.5wt％PNP SEQ ID NO:1156、0.5wt％SP SEQ ID NO:1160)，26g/L或124mM对映体纯(R)-2-乙炔基-甘油醛底物，99mM F-腺嘌呤(0.8当量)，186mM乙醛(异丙醇中40wt％，1.5当量)，372mM蔗糖(3.0当量)，5mM MnCl

用300μL的1M KOH和DMSO 1:1混合物猝灭反应。将猝灭的反应在桌上型振荡器上摇动10min，然后在4℃以4000rpm离心5min，以沉淀出任何沉淀物。然后将10微升上清液转移到预先填充有190μL 0.1M TEoA pH 7.5缓冲液中的25％MeCN的96孔圆底板中。将样品注入到Thermo U3000 UPLC系统，并使用Atlantis T3 C18,3μm,2.1x100mm柱等度分离，其中流动相包含补充有0.1％TFA的75:25水:乙腈，如实施例12-3中描述的。相对于SEQ ID NO:656的活性计算为在指定的反应条件下，与SEQ ID NO:656形成的化合物1的峰面积相比，变体酶形成的化合物1的峰面积。

实施例14

用于产生化合物1的SEQ ID NO:790的改进的磷酸戊糖变位酶变体

编码SEQ ID NO:790的具有磷酸戊糖变位酶活性的多肽的工程化多核苷酸(SEQID NO:789)用于产生表14.1的工程化多肽。与起始多肽相比，这些多肽在期望的条件下显示出改进的磷酸戊糖变位酶活性(例如，产生化合物3的能力，如经由在方案IV中所示的工程化DERA、PNP和SP酶存在下化合物1的产生所测量的)。

从SEQ ID NO:790的“骨架”氨基酸序列产生具有偶数编号的序列标识符的氨基酸序列的工程化多肽，如下文描述的。定向进化始于SEQ ID NO:790中所列的多核苷酸。使用多种熟知的技术(例如饱和诱变，先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用HTP测定和测量多肽磷酸戊糖变位酶活性的分析方法进行筛选。在这种情况下，通过使用表12.3中的分析方法在如方案IV中所示的工程化蔗糖磷酸化酶(SP)、脱氧核糖-磷酸醛缩酶(DERA)和嘌呤核苷磷酸化酶(PNP)的存在下产生化合物1来测量活性。本文提供的方法可用于分析使用本发明产生的变体。然而，并不意在本文描述的方法是适用于分析本文提供的和/或使用本文提供的方法产生的变体的仅有方法，因为其他合适的方法可用于本发明。

用300μL的1M KOH和DMSO 1:1混合物猝灭反应。将猝灭的反应在桌上型振荡器上摇动10min，然后在4℃以4000rpm离心5min，以沉淀出任何沉淀物。然后将10微升上清液转移到预先填充有190μL的0.1M TEoA pH 7.5缓冲液中的25％MeCN的96孔圆底板中。将样品注入到Thermo U3000 UPLC系统，并使用Atlantis T3 C18,3μm,2.1x100mm柱等度分离，其中流动相包含补充有0.1％TFA的75:25水:乙腈，如实施例12-3中描述的。相对于SEQ IDNO:790的活性计算为在指定的反应条件下，与SEQ ID NO:790形成的化合物1的峰面积相比，变体酶形成的化合物1的峰面积。

实施例15

用于产生化合物1的SEQ ID NO:846的改进的磷酸戊糖变位酶变体

编码具有SEQ ID NO:846的磷酸戊糖变位酶活性的多肽的工程化多核苷酸(SEQID NO:845)用于产生表15.1的工程化多肽。与起始多肽相比，这些多肽在期望的条件下显示出改进的磷酸戊糖变位酶活性(例如，产生化合物3的能力，如经由在方案IV中所示的工程化DERA、PNP和SP酶存在下经由产生化合物1所测量的)。

从SEQ ID NO:846的“骨架”氨基酸序列产生具有偶数编号的序列标识符的氨基酸序列的工程化多肽，如下文描述的。定向进化始于SEQ ID NO:846中所列的多核苷酸。使用多种熟知的技术(例如饱和诱变，先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库并使用HTP测定和测量多肽磷酸戊糖变位酶活性的分析方法进行筛选。在这种情况下，通过使用表12.3中的分析方法在如方案IV中所示的工程化蔗糖磷酸化酶(SP)、脱氧核糖-磷酸醛缩酶(DERA)和嘌呤核苷磷酸化酶(PNP)的存在下产生化合物1来测量活性。本文提供的方法可用于分析使用本发明产生的变体。然而，并不意在本文描述的方法是适用于分析本文提供的和/或使用本文提供的方法产生的变体的仅有方法，因为其他合适的方法可用于本发明。

如以下制备摇瓶粉末(来自摇瓶培养物的冻干裂解物)。将期望的变体的细胞培养物铺板到具有1％葡萄糖和30μg/ml CAM的LB琼脂板上并在37℃生长过夜。将来自每种培养物的单个菌落转移到具有1％葡萄糖和30μg/ml CAM的6ml LB。使培养物在30℃、250rpm生长18h，并以约1:50传代培养至250ml含30μg/ml CAM的TB中，至0.05的最终OD

用300μL的1M KOH和DMSO 1:1混合物猝灭反应。将猝灭的反应在桌上型振荡器上摇动10min，然后在4℃以4000rpm离心5min，以沉淀出任何沉淀物。然后将10微升上清液转移到预先填充有190μL的0.1M TEoA pH 7.5缓冲液中的25％MeCN的96孔圆底板中。将样品注入到Thermo U3000 UPLC系统，并使用Atlantis T3 C18,3μm,2.1x100mm柱等度分离，其中流动相包含补充有0.1％TFA的75:25水:乙腈，如实施例12-3中描述的。相对于SEQ IDNO:846的活性计算为在指定的反应条件下，与SEQ ID NO:846形成的化合物1的峰面积相比，变体酶形成的化合物1的峰面积。

出于所有目的，本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入本文，其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。

虽然已经说明和描述了各种具体的实施方案，但是将理解，可以做出各种改变而不偏离本发明的精神和范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：斯科特·J·诺维克;易翔;尼基·德拉斯;奥斯卡·阿尔维左;约瓦娜·纳佐尔;段达;韦丝娜·米切尔;乔纳森·弗罗姆;桑托什·西瓦拉马克莱斯娜;南希塔·苏布兰马尼安;杰弗里·C·穆尔;马克·霍夫曼;阿古斯蒂纳·罗德里格斯-格拉尼利奥;迪帕克·维尔玛;格兰特·墨菲;尼古拉斯·M·马歇尔;杰伊·拉塞尔;基思·A·卡纳达;
专利申请人：科德克希思公司;

上一篇：发动机起动装置
下一篇：用于检测糖类和/或治疗SIGLEC介导的障碍的多聚体蛋白