掌桥专利:专业的专利平台
掌桥专利
首页

由人白细胞抗原呈现的随机肽文库

文献发布时间:2023-06-19 10:46:31


由人白细胞抗原呈现的随机肽文库

相关申请的交叉引用

本申请要求于2018年8月31日提交的美国临时申请号62/726,060的权益,其全部内容通过引用并入本文。

背景技术

T细胞对于适应性免疫应答至关重要,在对感染和癌症的应答中发挥作用。T细胞识别来源于外来病原体及自身(例如在自身免疫的情况下)的蛋白质。这些蛋白质(例如肽)的片段由人白细胞抗原(HLA)分子呈递并由T细胞通过T细胞受体(TCR)识别。

I类主要组织相容性(MHC)HLA分子展示主要从将由细胞产生的内源性抗原(例如自身抗原)以及外来的细胞内抗原(例如来源于病毒蛋白的肽)加工成较小的肽而产生的肽。一旦肽结合到HLA肽结合裂口中,I类MHC HLA分子就与CD8+细胞毒性T细胞相互作用并刺激CD8+细胞毒性T细胞。I类MHC具有3个主要基因座A、B和C,其中每个基因座分为许多等位基因。等位基因是指给定基因座处的基因的DNA序列,并通常由至少四位数的数字(例如A*24:02)表示,第一个字母表示基因座,第一个数字定义等位基因的组(或类型),以及第二个数字定义等位基因的组中的特定蛋白质。可以附加第二和第三数字,分别指示沉默编码变体和非编码变体。

一旦识别出特定的肽-HLA复合物(pHLA),T细胞被激活并且可以(1)具有细胞毒性,(2)分泌细胞因子,和/或(3)募集其他免疫细胞。外来或自身肽、HLA分子和TCR之间的这种复杂相互作用对于鉴别免疫系统如何在分子水平上响应识别的病原体至关重要。在免疫应答过程中这种复杂相互作用的最大困难之一是根据所识别的肽的身份了解TCR的特异性。需要鉴别TCR和它们识别的pHLA的新方法。

发明内容

在一些实施方案中,本文提供的抗原筛选文库包含多个人白细胞抗原(HLA)-抗原多肽复合物,所述HLA-抗原多肽复合物包含(a)HLA多肽,所述HLA多肽包含肽结合裂口,(b)随机抗原多肽,其包含SEQ ID NO:1至209中的任何一个所示的氨基酸序列,其中所述随机抗原多肽与HLA多肽的肽结合裂口特异性结合,和(c)β-2(β2)微球蛋白多肽。

在一些实施方案中,多个HLA-抗原复合物包含选自以下的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原复合物包含选自以下的至少5个、10个、15个、20个或25个不同的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原-复合物包含A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E中所有的HLA多肽。

在一些实施方案中,多个HLA-抗原复合物包含含有与SEQ ID NO:427至455中的任何一个所示的氨基酸序列至少87.5%、90%、95%、97%、98%、99%或100%同一的氨基酸序列的HLA多肽。

在一些实施方案中,多个HLA-抗原多肽复合物包含含有至少约10

在一些实施方案中,HLA多肽、随机抗原多肽和β2-微球蛋白多肽构成单个多肽。在一些实施方案中,单个多肽还包含第一柔性多肽接头和第二柔性多肽接头。在一些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的N-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的N-末端。在这些实施方案中,第一柔性多肽接头将HLA多肽与随机抗原多肽分开,并且第二柔性多肽接头将HLA多肽与β2-微球蛋白多肽分开。在一些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的N-末端。在这些实施方案中,第一柔性多肽接头将HLA多肽与随机抗原多肽分开,并且第二柔性多肽接头将HLA多肽与β2-微球蛋白多肽分开。在一些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的N-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的C-末端。在这些实施方案中,第一柔性多肽接头将随机抗原多肽与β2-微球蛋白多肽分开,并且第二柔性多肽接头将β2-微球蛋白多肽与HLA多肽分开。在一些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的C-末端。在这些实施方案中,第一柔性多肽接头将HLA多肽与β2-微球蛋白多肽分开,并且第二柔性多肽接头将随机抗原多肽与HLA多肽分开。在一些实施方案中,在单个多肽上β2-微球蛋白多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在随机抗原多肽的N-末端。在这些实施方案中,第一柔性多肽接头将HLA多肽与随机抗原多肽分开,并且第二柔性多肽接头将随机抗原多肽与β2-微球蛋白多肽分开。在一些实施方案中,在单个多肽上随机抗原多肽在β2-微球蛋白的C-末端,并且在单个多肽上HLA多肽在随机抗原多肽的C-末端。在这些实施方案中,第一柔性多肽接头将β2-微球蛋白多肽与随机抗原多肽分开,并且第二柔性多肽接头将随机抗原多肽与HLA多肽分开。

在一些实施方案中,多个HLA-抗原复合物中的每个HLA-抗原复合物不包含表位标签。在一些实施方案中,多个HLA-抗原复合物中的至少一个HLA-抗原复合物包含表位标签。在一些实施方案中,多个HLA-抗原复合物中的至少一个HLA-抗原复合物不包含表位标签,并且多个HLA-抗原复合物中的至少一个HLA-抗原复合物包含表位标签。在一些实施方案中,表位标签包括FLAG标签、c-Myc标签、HIS标签、血凝素(HA)标签、VSVg标签或V5标签。

在一些实施方案中,HLA-抗原复合物各自包含膜拴系(tethering)结构域。在一些实施方案中,膜拴系结构域包含Aga2。在一些实施方案中,抗原筛选文库在多个细胞上表达。

在一些实施方案中,多个细胞是多个酵母细胞。在一些实施方案中,多个酵母细胞是酿酒酵母(Saccharomyces cerevisiae)的EBY100菌株的多个酵母细胞。

在一些实施方案中,多个细胞中的每个细胞表达特定的HLA-抗原复合物。

在一些实施方案中本文提供了包含多个人白细胞抗原(HLA)-抗原多肽复合物的抗原筛选文库,所述HLA-抗原多肽复合物包含HLA多肽,所述HLA多肽包含肽结合裂口,和随机抗原多肽,其包含SEQ ID NO:1至209中的任何一个所示的氨基酸序列,其中所述随机抗原多肽特异性结合至所述HLA多肽的肽结合裂口。

在一些实施方案中,多个HLA-抗原复合物包含选自以下的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原复合物包含选自以下的至少5个、10个、15个、20个或25个不同的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原-复合物包含A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E中所有的HLA多肽。

在一些实施方案中,多个HLA-抗原复合物包含含有与SEQ ID NO:427至455中的任何一个所示的氨基酸序列至少87.5%、90%、95%、97%、98%、99%或100%同一的氨基酸序列的HLA多肽。

在一些实施方案中,多个HLA-抗原多肽复合物包含含有至少约10

在一些实施方案中,HLA多肽、随机抗原多肽和β2-微球蛋白多肽构成单个多肽。在一些实施方案中,单个多肽还包含将HLA多肽与随机抗原多肽分开的第一柔性多肽接头。在这些实施方案的某些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的N-末端。在这些实施方案的某些实施方案中,在单个多肽上随机抗原多肽在HLA多肽的C-末端。

在一些实施方案中,多个HLA-抗原复合物中的每个HLA-抗原复合物不包含表位标签。在一些实施方案中,多个HLA-抗原复合物中的至少一个HLA-抗原复合物包含表位标签。在一些实施方案中,多个HLA-抗原复合物中的至少一个HLA-抗原复合物不包含表位标签,并且多个HLA-抗原复合物中的至少一个HLA-抗原复合物包含表位标签。在一些实施方案中,表位标签包括FLAG标签、c-Myc标签、HIS标签、血凝素(HA)标签、VSVg标签或V5标签。

在一些实施方案中,HLA-抗原复合物各自包含膜拴系结构域。在一些实施方案中,膜拴系结构域包含Aga2。在一些实施方案中,抗原筛选文库在多个细胞上表达。

在一些实施方案中,多个细胞是多个酵母细胞。在一些实施方案中,多个酵母细胞是酿酒酵母的EBY100菌株的多个酵母细胞。

在一些实施方案中,多个细胞中的每个细胞表达特定的HLA-抗原复合物。

在一些实施方案中,本文提供了包含多个抗原多肽-β-2(β2)微球蛋白多肽复合物、抗原多肽-β-2(β2)微球蛋白多肽复合物的抗原筛选文库。在这些实施方案中,抗原筛选文库还包含随机抗原多肽,其包含SEQ ID NO:1至209中的任何一个所示的氨基酸序列,其中所述随机抗原多肽特异性结合至HLA多肽的肽结合裂口;和β-2(β2)微球蛋白多肽。在这些实施方案中,抗原筛选文库还进一步包含由一种或多种酵母细胞组成性表达并包含肽结合裂口的多个HLA多肽。

在一些实施方案中,多个HLA-抗原复合物包含选自以下的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原复合物包含选自以下的至少5个、10个、15个、20个或25个不同的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原-复合物包含A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E中所有的HLA多肽。

在一些实施方案中,多个HLA-抗原复合物包含含有与SEQ ID NO:427至455中的任何一个所示的氨基酸序列至少87.5%、90%、95%、97%、98%、99%或100%同一的氨基酸序列的HLA多肽。

在一些实施方案中,多个抗原多肽-β-2(β2)微球蛋白多肽复合物包含含有至少约10

在一些实施方案中,随机抗原多肽和β2-微球蛋白多肽构成单个多肽。在一些实施方案中,单个多肽还包含第一柔性多肽接头。在这些实施方案的某些实施方案中,在单个多肽上随机抗原多肽在β2-微球蛋白多肽的N-末端。在这些实施方案的某些实施方案中,在单个多肽上随机抗原多肽在β2-微球蛋白多肽的C-末端。

在一些实施方案中,多个抗原多肽-β-2(β2)微球蛋白多肽复合物中的每个抗原多肽-β-2(β2)微球蛋白多肽复合物不包含表位标签。在一些实施方案中,多个抗原多肽-β-2(β2)微球蛋白多肽复合物中的至少一个抗原多肽-β-2(β2)微球蛋白多肽复合物包含表位标签。在一些实施方案中,多个HLA-抗原复合物中的至少一个HLA-抗原复合物不包含表位标签,并且多个HLA-抗原复合物中的至少一个HLA-抗原复合物包含表位标签。在一些实施方案中,表位标签包括FLAG标签、c-Myc标签、HIS标签、血凝素(HA)标签、VSVg标签或V5标签。

在一些实施方案中,抗原多肽-β-2(β2)微球蛋白多肽复合物各自包含膜拴系结构域。在一些实施方案中,膜拴系结构域包含Aga2。在一些实施方案中,抗原筛选文库在多个细胞上表达。

在一些实施方案中,多个细胞是多个酵母细胞。在一些实施方案中,多个酵母细胞是酿酒酵母的EBY100菌株的多个酵母细胞。

在一些实施方案中,多个细胞中的每个细胞表达特定的抗原多肽-β-2(β2)微球蛋白多肽复合物。

在一些实施方案中,本文提供了编码根据本发明的技术的抗原筛选文库的多个核酸。

在一些实施方案中,HLA-抗原复合物的HLA多肽由与SEQ ID NO:456至484中的任何一个至少约85%、87.5%、90%、95%、97%、98%或99%同源的核酸编码。在一些实施方案中,HLA-抗原复合物的随机抗原多肽由SEQ ID NO:210至426中的任何一个所示的核酸编码。

在一些实施方案中,多个核酸由多个细胞表达。

在一些实施方案中,本文提供了表达根据本发明的技术的抗原筛选文库的多个细胞。

在一些实施方案中,多个细胞是多个酵母细胞。在一些实施方案中,多个酵母细胞是酿酒酵母的EBY100菌株的多个细胞。在一些实施方案中,多个细胞中的每个细胞包含编码特定的HLA-抗原复合物的多个核酸中的核酸。

在一些实施方案中,本文提供了选择抗原的方法,所述方法包括使根据本发明的技术的多个细胞与T细胞受体(TCR)接触。

在一些实施方案中,TCR被固定在基底上。在一些实施方案中,TCR由细胞表达。

在一些实施方案中,选择重复2、3、4或5个循环。

在一些实施方案中,抗原是多肽抗原。在一些实施方案中,抗原是非天然存在的多肽抗原。在一些实施方案中,抗原是在人中非天然存在的多肽抗原。

附图简要说明

图1A示出了根据本发明的技术的一些实施方案的与酵母细胞偶联的HLA抗原多肽构建体的示意图。

图1B示出了根据本发明的技术的一些实施方案的拴系在细胞上的HLA抗原多肽构建体的示例性非限制性实施方案。

图2示出了根据本发明的技术的一些实施方案的用于选择与特异性T细胞受体相互作用的特异性随机抗原多肽的过程的示例性非限制性描绘。

图3A和3B是示例性pCT载体(图3A)和示例性pYAL载体(图3B)的图谱。

图4示出了根据本发明的技术的一些实施方案的通过流式细胞术对多个同种异型在酵母表面上的肽-HLA(pHLA)表达进行表征。

发明详述

本文描述了用于选择和/或鉴定T细胞受体(TCR)的多肽配体的抗原筛选文库。在许多情况下,抗原筛选文库可用于发现能够与人T细胞相互作用并作为TCR配体刺激人T细胞的多肽抗原,包括内源性TCR抗原和非内源性TCR抗原,它们可能是新的TCR抗原和/或新的表位。这样的新抗原和/或新表位至少例如可用于刺激可能已变得耗尽或无能的T细胞上的一个或多个TCR,并恢复针对癌症、肿瘤或慢性病毒感染的免疫应答。因此,本公开内容在给定的HLA的情况下包括肽文库展示,例如随机肽抗原文库,以确定限于HLA介导的肽识别的TCR的特异性和一般识别特性。

一旦使用本文描述的方法表达,随机肽抗原文库可以由在细胞表面上表达的HLA分子展示。通常,展示这些HLA-抗原多肽复合物的细胞不是宿主免疫系统的正常抗原呈递细胞,而是可以容易地用编码HLA-抗原多肽的核酸进行转化、转染、转导和/或电穿孔的细胞,包括但不限于昆虫细胞、酵母细胞和细菌细胞。在一些实施方案中,随机肽抗原文库由酵母细胞表达。将编码至少10

在一些实施方案中,本公开内容包括抗原筛选文库,其包含多个HLA-抗原多肽复合物。在一些实施方案中,HLA-抗原多肽复合物包含(a)HLA多肽,所述HLA多肽包含肽结合裂口;(b)随机抗原多肽,其包含SEQ ID NO:1至194中的任何一个所示的氨基酸序列,其中所述随机抗原多肽被选择为特异性结合至HLA多肽的肽结合裂口;以及(c)β-2(β2)微球蛋白多肽。本文还提供了随机肽抗原的衍生物及其文库、其组合物、其药物组合物及其用途。本文还提供了编码本文公开的一种或多种随机肽抗原文库及其衍生物的核酸序列,以及用于在一种或多种细胞中表达一种或多种随机肽抗原文库、其肽及其衍生物的方法。

如本文提供的实施例中所示,设计了随机肽抗原文库(实施例1),其包括核酸构建体(图1A)和拴系于细胞(例如酵母细胞)的肽构建体(图1B)。使用酵母展示(YD)系统对pHLA的表达进行表征和验证(实施例2)。这些pHLA可以与TCR相互作用,并且确定是否发生相互作用可以使用本文所述的一种或多种方法来确定,例如使用图2所示的方法来进行。pHLA的表达通过流式细胞术验证(实施例2,水平1),并且可以通过使用候选同种异型匹配的TCR筛选随机肽抗原文库来进一步在功能上进行验证(实施例2,水平2)。

本发明的以下描述仅旨在举例说明本公开内容的各种实施方案。因此,所讨论的具体修改不应被解释为对本公开内容的范围的限制。对于本领域技术人员将明显的是,在不脱离本公开内容的范围的情况下,可以做出各种等同、改变和修改,并且应当理解,这样的等同实施方案应包括在本文中。

本文列出的所有参考文献通过引用整体并入本文。方法和装置在本文通过示例的方式提供,并且不旨在限制本公开内容。

某些定义

在以下描述中,示出了一些具体细节以提供各种实施方案的透彻理解。然而,本领域技术人员将理解,可以在没有这些细节的情况下实践所提供的实施方案。除非上下文另外要求,否则在整个说明书和以下权利要求书中,词语“包括”及其变体(例如“包含”和“含有”)应以开放的、包容性的意义来解释,即“包括但不限于”。如本说明书和所附权利要求书中所使用的,单数形式“一个”、“一种”和“该”包括复数个参照对象,除非内容中另有明确规定。还应注意,术语“或”通常以其包括“和/或”的意义使用,除非内容中另有明确规定。此外,本文提供的标题仅是为了方便起见,并不解释所要求保护的实施方案的范围或含义。

术语“肽”、“多肽”和“蛋白质”互换使用用于指氨基酸残基的聚合物,并且不限于最小长度,尽管可以指定氨基酸残基的数量(例如,9mer是9个氨基酸残基)。多肽可包括氨基酸残基,包括天然和/或非天然氨基酸残基。该术语还包括多肽的表达后修饰,例如,糖基化、唾液酸化、乙酰化、磷酸化等。在一些实施方案中,多肽可以包含相对于天然或天然序列的修饰,只要蛋白质保持所希望的活性。这些修饰可以是故意的,例如通过定点诱变,或者可以是偶然的,例如通过产生蛋白质的宿主的突变或由于PCR扩增引起的错误。

术语“酸性残基”是指具有包含酸性基团的侧链的D-或L-形式的氨基酸残基。示例性的酸性残基包括D和E。

术语“酰胺残基”是指具有包含酸性基团的酰胺衍生物的侧链的D-或L-形式的氨基酸。示例性残基包括N和Q。

术语“芳族残基”是指具有包含芳族基团的侧链的D-或L-形式的氨基酸残基。示例性的芳族残基包括F、Y和W。

术语“碱性残基”是指具有包含碱性基团的侧链的D-或L-形式的氨基酸残基。示例性的碱性残基包括H、K和R。

术语“亲水残基”是指具有包含极性基团的侧链的D-或L-形式的氨基酸残基。示例性的亲水残基包括C、S、T、N和Q。

术语“非功能性残基”是指具有缺乏酸性、碱性或芳族基团的侧链的D-或L-形式的氨基酸残基。示例性的非功能性氨基酸残基包括M、G、A、V、I、L和正亮氨酸(Nle)。

术语“中性疏水残基”是指具有缺乏碱性、酸性或极性基团的侧链的D-或L-形式的氨基酸残基。示例性的中性疏水氨基酸残基包括A、V、L、I、P、W、M和F。

术语“极性疏水残基”是指具有包含极性基团的侧链的D-或L-形式的氨基酸残基。示例性极性疏水性氨基酸残基包括T、G、S、Y、C、Q和N。

术语“疏水残基”是指具有缺乏碱性或酸性基团的侧链的D-或L-形式的氨基酸残基。示例性疏水氨基酸残基包括A、V、L、I、P、W、M、F、T、G、S、Y、C、Q和N。

关于参考多肽序列的“序列同一性百分比(%)”是在比对序列并引入缺口(如果有必要)以实现最大的序列同一性百分比并且不考虑将任何保守置换作为序列同一性的一部分之后,候选序列中与参考多肽序列中的氨基酸残基同一的氨基酸残基的百分比。用于确定氨基酸序列同一性百分比的比对可以以已知的各种方式实现,例如,使用公开可用的计算机软件,例如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件,或适用于核酸序列的其他软件。能够确定用于比对序列的合适参数,包括在所比较的序列的全长上实现最大比对所需的算法。然而,出于本文的目的,使用序列比较计算机程序ALIGN-2产生氨基酸序列同一性百分比值。ALIGN-2序列比较计算机程序由Genentech,Inc.编写,并且源代码已与用户文档一起归档在U.S.Copyright Office,Washington D.C.,20559,其中其注册在U.S.Copyright Registration No.TXU510087下。ALIGN-2程序可从Genentech,Inc.,SouthSan Francisco,Calif.公开获得,或可以从源代码进行编译。ALIGN-2程序应被编译用于在UNIX操作系统(包括数字UNIX V4.0D)上使用。所有序列比较参数均由ALIGN-2程序设置,并且没有变化。

在使用ALIGN-2用于氨基酸序列比较的情况下,给定氨基酸序列A相对、与或针对给定氨基酸序列B(其可以替代地表述为相对、与或针对给定氨基酸序列B具有或包含一定氨基酸序列同一性百分比的给定氨基酸序列A)的氨基酸序列同一性百分比如下计算:分数X/Y乘以100,其中X是在A和B的程序比对中通过序列比对程序ALIGN-2评分为同一匹配的氨基酸残基的数量,以及其中Y是B中氨基酸残基的总数。将理解,当氨基酸序列A的长度不等于氨基酸序列B的长度时,则A与B的氨基酸序列同一性百分比将不等于B与A的氨基酸序列同一性百分比。除非另外特别说明,否则本文使用的所有氨基酸序列同一性百分比值均为如在上一段落中所述的使用ALIGN-2计算机程序获得的。

如本文所用,术语“同源的”、“同源性”或“同源性百分比”当在本文中用于相对于参考序列描述核酸序列时,可以使用Karlin&Altschul 1990描述的公式(如Karlin&Altschul 1993中修改的)来确定。这样的公式被并入Altschul 1990的基本局部比对搜索工具(BLAST)程序中。自提交本申请之日起,可使用最新版本的BLAST确定序列的同源性百分比。

“T细胞受体”(TCR)是指脊椎动物(例如哺乳动物)的抗原/MHC结合异源二聚体蛋白质产物,TCR基因复合物,包括人TCRα、β、γ和δ链。例如,如Rowen 1996所公开的,已经对人βTCR基因座的完整序列进行了测序;人TCR基因座已被测序和重测序,例如参见Mackelprang 2006;参见Arden 1995中对T细胞受体可变基因区段家族的一般分析;对于出版物中提供和引用的序列信息,通过引用将它们的每一个明确地并入本文。

“诱饵”是指与本发明的技术的抗原结合的TCR或“具有一个或多个抗原结合结构域的其他大分子”。具有一个或多个抗原结合结构域的其他大分子是抗体、DARPin或合成分子,包括适配体。抗原结合结构域结合肽,例如本发明的技术的一种或多种HLA-肽复合物,或核酸,例如DNA和RNA。

关于核酸或多核苷酸的“外源”表示核酸是重组核酸构建体的一部分或不在其天然环境中。例如,外源核酸可以是来自一个物种的被引入另一个物种中的序列,即异源核酸。通常,通过重组核酸构建体将这样的外源核酸引入其他物种。外源核酸也可以是对于生物体天然的并且已经被重新引入该生物体的细胞中的序列。包含天然序列的外源核酸通常可以通过与外源核酸连接的非天然序列(例如,在重组核酸构建体中在天然序列侧翼的非天然调节序列)的存在与天然存在的序列区分开来。另外,稳定转化的外源核酸通常整合在除了发现天然序列的位置以外的位置。可以例如使用遗传重组将外源元件添加到构建体中。遗传重组是DNA链的断裂和重新结合以形成编码一组新的遗传信息的DNA新分子。

如本文所用,术语“约”是指接近所述量10%的量。

本文公开了抗原筛选文库,例如随机肽抗原文库,其包含多个HLA-抗原多肽复合物。本公开内容的HLA-抗原多肽复合物最少包含至少三种组分:(a)随机抗原多肽,(b)I类主要的组织相容性(MHC I)HLA分子,和(c)β2-微球蛋白。在一些实施方案中,将(a)的随机抗原多肽随机化,其具有至少一个或多个保守的残基,其充当锚定残基以结合特定类型的HLA分子。示例性但非限制性随机抗原多肽抗原和与它们所关联的HLA类型显示在表1中并由SEQ ID NO:1至194给出以及显示在表2中并由SEQ ID NO:195至209给出。在一些实施方案中,随机多肽抗原包含与但不限于与SEQ ID NO:1至194和SEQ ID NO:195至209中任何一个所示的氨基酸序列至少约70%、75%、80%、85%、87%、87.5%、90%、95%、97%、97.5%、98%、98.5%、99%、99.5%或100%同一的序列。在一些实施方案中,随机多肽抗原包含与SEQ ID NO:1至194和SEQ ID NO:195至209中任何一个所示的序列中的任何一个同一的序列。在本公开内容中还设想了从SEQ ID NO:1至194和SEQ ID NO:195至209中的任何一个的N-末端截短或C-末端截短1、2、3、4、5、6、7、8、9、10、15、20或25个氨基酸的随机多肽抗原截短体。在一些实施方案中,(b)的HLA分子是HLA多肽,并且包含肽结合裂口。在一些实施方案中,一旦表达,(a)的随机抗原多肽在肽结合裂口处结合(b)的HLA多肽。

表1:按HLA类型分类的多肽抗原序列

表2:HLA A11的其他多肽抗原序列

在一些实施方案中,本公开内容的抗原筛选文库包含(b)至少由但不限于至少在表4中提供的核苷酸序列SEQ ID NO:210至411编码的随机抗原多肽。在一些实施方案中,本公开内容的抗原筛选文库包括(b)至少由但不限于至少在表5中提供的核苷酸序列SEQ IDNO:412至426编码的随机抗原多肽。编码(b)的随机抗原多肽的核酸由简并碱基序列编码,从而有效地允许任何氨基酸在对应于简并碱基序列的给定位置处编码。每个随机抗原多肽具有至少一个保守的锚定位置,其由限制性简并密码或特定序列编码,这允许随机抗原多肽更有效地与某种HLA类型相互作用。与具有完全随机抗原多肽的HLA复合物的形成相比,每个随机抗原多肽具有至少一个保守的锚定位置增加形成随机抗原多肽和HLA复合物的效率。在一些实施方案中,随机抗原多肽的1、2或3个氨基酸残基是恒定的。在一些实施方案中,随机抗原多肽抗原包含与但不限于与SEQ ID NO:210至411和SEQ ID NO:412至426中的任何一个所示的氨基酸序列中的任何一个至少约70%、75%、80%、85%、87%、87.5%、90%、95%、97%、97.5%、98%、98.5%、99%、99.5%或100%同一的序列。在一些实施方案中,随机抗原多肽抗原包含与SEQ ID NO:210至411和SEQ ID NO:412至426中的任何一个所示的序列中的任何一个同一的序列。在本公开内容中还设想了从SEQ ID NO:210至411和SEQ ID NO:412至426中的任何一个的N-末端截短或C-末端截短1、2、3、4、5、6、7、8、9、10、15、20或25个氨基酸的随机抗原多肽抗原多肽截短体。

在一些实施方案中,随机抗原多肽的氨基酸残基变化2、3或4个不同的氨基酸。例如,参考表1,与HLA-A2结合的随机抗原多肽的第二个和最后一个位置将分别包含亮氨酸或甲硫氨酸;和亮氨酸、甲硫氨酸或缬氨酸。

上表1和表2中的氨基酸序列包含随机氨基酸残基('X')和位于被统称为锚定位置的残基上的明确定义的氨基酸。文库设计中指定的锚定位置可以例如基于表3中所示的氨基酸置换而改变。本领域普通技术人员将理解,表1和表2的氨基酸序列中X残基的可能置换不受限制并且可以包括附加的置换而不脱离本公开内容的范围。例如,氨基酸置换可用于鉴定促成HLA结合或限制本文所述的文库的成员的扩增的肽序列的重要残基。

保守修饰将产生具有与进行这样的修饰的肽相似的功能和化学特征的肽。相反,可以通过在氨基酸序列中选择其在维持(a)置换区域中分子主链的结构(例如,作为片层或螺旋构象)、(b)在靶位点处分子的电荷或疏水性或(c)分子的大小上的作用显著不同的置换来实现肽的功能和/或化学特性的实质性修饰。

例如,“保守氨基酸置换”可以涉及用非天然残基置换天然氨基酸残基,使得对该位置处的氨基酸残基的极性或电荷几乎没有影响或没有影响。此外,多肽中的任何天然残基也可以被丙氨酸置换,如先前关于“丙氨酸扫描诱变”所描述的(参见,例如MacLennan1998和Sasaki&Sutoh 1998,其讨论了丙氨酸扫描诱变)。

所希望的氨基酸置换(无论是保守的还是非保守的)可以在需要这样的置换时由本领域技术人员确定。表3示出了示例性氨基酸置换。

表3:氨基酸置换

在某些实施方案中,保守氨基酸置换还涵盖通常通过化学肽合成而不是通过在生物系统中的合成而掺入的非天然存在的氨基酸残基。

如在前面的“某些定义”部分中所指出的,可以基于可能对序列的修饰有用的常见侧链性质将天然存在的残基分为几类。例如,非保守置换可涉及将这些类别之一的成员交换为来自另一类别的成员。可将这样的置换的残基引入与非人直系同源物同源的肽的区域中,或引入分子的非同源区域中。另外,出于影响链取向的目的,也可以使用P或G进行修饰。

在进行这样的修饰时,可以考虑氨基酸的亲水指数。基于其疏水性和电荷特性,已为每个氨基酸分配了亲水指数;这些是:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);和精氨酸(-4.5)。

亲水氨基酸指数在赋予蛋白质相互作用生物学功能中的重要性在本领域中是已知的(Kyte&Doolittle 1982)。已知某些氨基酸可以置换具有相似的亲水指数或评分的其他氨基酸,并且仍然保留相似的生物学活性。在基于亲水指数进行改变时,亲水指数在±2之内的氨基酸的置换是优选的,在±1之内的那些氨基酸置换是特别优选的,并且在±0.5之内的氨基酸置换是甚至更特别优选的。

在本领域中还应理解,可以基于亲水性有效地进行相似氨基酸的置换。由其相邻氨基酸的亲水性决定的蛋白质的最大局部平均亲水性与其免疫原性和抗原性有关,即与蛋白质的生物学特性有关。

已经将以下亲水性值分配给氨基酸残基:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。在基于相似的亲水性值进行改变时,亲水性值在±2之内的氨基酸的置换是优选的,在±1之内的那些氨基酸置换是特别优选的,并且在±0.5之内的氨基酸置换是甚至更特别优选的。也可以基于亲水性从一级氨基酸序列中鉴定表位。这些区域也称为“表位核心区域”。

本领域技术人员将能够使用众所周知的技术来确定前述序列中示出的多肽的合适变体。为了鉴定在不破坏活性的情况下可以改变的分子的合适区域,本领域技术人员可以靶向不被认为对活性重要的区域。例如,当已知来自相同物种或来自其他物种的具有相似活性的相似多肽时,本领域技术人员可以将肽的氨基酸序列与相似肽进行比较。通过这样的比较,可以鉴定在相似多肽之间保守的分子的残基和部分。应当理解,相对于这样的相似肽而言不保守的肽区域中的变化将不太可能不利地影响该肽的生物学活性和/或结构。本领域技术人员还将知道,即使在相对保守的区域中,也可以用化学上相似的氨基酸置换天然存在的残基,同时保持活性(保守氨基酸残基置换)。因此,即使对于生物活性或结构可能重要的区域也可以进行保守氨基酸置换而不会破坏生物活性或不会不利地影响肽结构。

另外,本领域技术人员可以回顾结构功能研究,从而鉴定相似肽中对于活性或结构重要的残基。鉴于这样的比较,可以预测肽中与相似肽中对于活性或结构重要的氨基酸残基相对应的氨基酸残基的重要性。本领域技术人员可以针对肽的这样的预测的重要氨基酸残基选择化学上相似的氨基酸置换。

本领域技术人员还可以在相似的多肽中分析三维结构和与该结构有关的氨基酸序列。鉴于该信息,本领域技术人员可以预测肽的氨基酸残基相对于其三维结构的比对。本领域技术人员可以选择不对预测在蛋白质表面上的氨基酸残基进行根本改变,因为这样的残基可能参与与其他分子的重要相互作用。此外,本领域技术人员可以产生在每个所希望的氨基酸残基处包含单个氨基酸置换的测试变体。然后可以使用本领域技术人员已知的活性测定来筛选变体。这样的数据可用于收集有关合适变体的信息。例如,如果发现对特定氨基酸残基的改变导致破坏的、不希望的降低的或不合适的活性,则可以避免具有这样的改变的变体。换句话说,基于从这样的常规实验收集的信息,本领域技术人员可以容易地确定其中应避免单独的或与其他突变组合的进一步置换的氨基酸。

已经有许多科学出版物致力于二级结构的预测(参见,例如,Moult 1996;Chou&Fasman 1974a;Chou&Fasman 1974b;Chou&Fasman 1978a;Chou&Fasman 1978b;和Chou&Fasman 1979)。此外,计算机程序当前可用于协助预测二级结构。预测二级结构的一种方法是基于同源性建模。例如,具有大于30%的序列同一性或大于40%的相似性的两个多肽或蛋白质通常具有相似的结构拓扑。蛋白质结构数据库(PDB)的最新发展已提供了增强的二级结构可预测性,包括多肽或蛋白质结构内潜在的折叠数(Holm&Sander 1999)。已经提出,给定的多肽或蛋白质中存在有限的折叠数量,并且一旦解析了关键数量的结构,结构预测的准确性将大大提高(Brenner 1997)。

预测二级结构的其他方法包括“线程化(threading)”(Jones 1997;Sippl&Flockner 1996)、“轮廓分析”(Bowie 1991;Gribskov 1987;Gribskov 1990)和“进化联系”(Holm&Sander 1999;Brenner 1997)。

表4:编码随机多肽抗原的核酸序列

表5:编码HLA A11的随机多肽抗原的其他核酸序列

随机抗原多肽的一个优点是具有简并碱基密码的单个核酸可以潜在地表达大量不同的随机抗原多肽,这增加了任何一项筛选实验将鉴定出与某个TCR相互作用的一种或多种随机抗原多肽的机会。在一些实施方案中,编码随机抗原多肽的核酸可以编码至少1x10

在HLA分子的结合裂口中结合的肽抗原通常具有有限的长度范围。与I类HLA分子结合的大多数多肽的长度为8、9、10或11个氨基酸。在一些实施方案中,与HLA分子结合并形成本公开内容的HLA-抗原多肽复合物的随机抗原多肽的长度为8至11个氨基酸。在一些实施方案中,随机抗原多肽的长度为8至10个氨基酸。在一些实施方案中,随机抗原多肽的长度为8个氨基酸。在一些实施方案中,随机抗原多肽的长度为9个氨基酸。在一些实施方案中,随机抗原多肽的长度为10个氨基酸。在一些实施方案中,随机抗原多肽的长度为11个氨基酸。

本文所述的HLA-抗原多肽复合物的另一种组分是HLA分子,例如HLA多肽。为了本公开内容的目的,HLA分子是I类主要组织相容性分子。在一些实施方案中,本公开内容的HLA-抗原多肽复合物(HLA-抗原复合物)的多个HLA多肽可包含以下任何基因座和等位基因:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原-复合物中的每个HLA-抗原-复合物包含选自以下的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原复合物包含选自以下的至少5个、10个、15个、20个或25个不同的HLA多肽:A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E。在一些实施方案中,多个HLA-抗原复合物包含A3、A11、A23、A24、A26、A30、A31、A33、A68、B7、B8、B15、B27、B40、B44、B51、B53、C1、C2、C3、C4、C5、C6、C7、C8和E中所有的HLA多肽。

在一些实施方案中,HLA-抗原多肽复合物的HLA多肽的氨基酸序列可以包含表6中所示的任何氨基酸序列。在一些实施方案中,HLA多肽包含与SEQ ID NO:427至455中的任何一个所示的氨基酸序列至少约70%、75%、80%、85%、87%、87.5%、90%、95%、97%、97.5%、98%、98.5%、99%、99.5%或100%同一的氨基酸序列。在一些实施方案中,HLA多肽包含与SEQ ID NO:427至455中的任何一个所示的任何一个氨基酸序列同一的氨基酸序列。在一些实施方案中,HLA多肽的包含肽结合裂口的部分与SEQ ID NO:251至279中的任何一个同一,并且非肽结合裂口残基与SEQ ID NO:427至455中的任何一个至少约70%、75%、80%、85%、87.5%、90%、95%、97%、98%、99%或100%同一。本公开内容中还涵盖的是从SEQ ID NO:427至455中的任何一个的N-末端截短或C-末端截短1、2、3、4、5、6、7、8、9、10、15、20或25个氨基酸的HLA多肽截短体。

表6:HLA等位基因氨基酸序列

HLA-抗原多肽复合物的HLA多肽可以由表7中所示的任何核酸编码。在一些实施方案中,HLA多肽由与至少但不限于表7中所列的任何一个核酸序列(例如,SEQ ID NO:456至484)至少约90%、95%、97%、98%、99%或100%同源的核酸序列编码。在一些实施方案中,HLA多肽由与SEQ ID NO:456至484中的任何一个所示的核酸序列同一的核酸序列编码。

表7:HLA等位基因核酸序列

在一些实施方案中,随机肽抗原文库的多个HLA-抗原多肽复合物包含至少约10

在一些实施方案中,随机肽抗原文库的多个HLA-抗原多肽复合物还包含β2-微球蛋白多肽,其与细胞表面上的HLA-抗原多肽复合物相互作用并使其稳定。人β2-微球蛋白多肽的氨基酸序列在NCBI Seq.Ref.NP_004039中给出。在一些实施方案中,本公开内容的人β2-微球蛋白多肽氨基酸序列是人β2-微球蛋白多肽的功能性天然存在的变体,其氨基酸序列与NCBI Seq.Ref.NP_004039公开的人β2-微球蛋白多肽至少约90%、95%、97%、98%或99%同一。

本公开内容还包括多个HLA-抗原多肽的抗原筛选文库,其中β2-微球蛋白由细胞组成性表达。在一些实施方案中,β2-微球蛋白由第一核酸编码,随机抗原多肽由第二核酸编码,并且HLA多肽由第三核酸编码。在其他实施方案中,β2-微球蛋白由第一核酸编码,而随机抗原多肽和HLA多肽由第二核酸编码。当由第一核酸编码时,β2-微球蛋白可以在第二核酸或第三核酸之前或之后被转导、转染或转化到细胞中。

在本公开内容的一些实施方案中,使用本领域普通技术人员已知的技术将β2-微球蛋白与抗原筛选文库的至少一种随机抗原多肽融合。在这些实施方案中,HLA多肽可以是或可以不是抗原筛选文库的组分。在本公开内容的其他实施方案中,使用本领域普通技术人员已知的技术将至少一种HLA多肽与抗原筛选文库的至少一种随机抗原多肽融合。在这些实施方案中,β2-微球蛋白可以由被转导、转染或转化以表达抗原筛选文库的其他组分(例如随机抗原多肽和HLA多肽)的细胞表达。类似于本文所述的其他实施方案,β2-微球蛋白由细胞组成性表达。在这些实施方案的某些实施方案中,细胞是酵母细胞。在其他实施方案中,β2-微球蛋白不由被转导、转染或转化以表达抗原筛选文库的其他组分(例如随机抗原多肽和HLA多肽)的细胞表达。在这些实施方案的某些实施方案中,细胞是哺乳动物细胞。

除了随机肽抗原文库的HLA-抗原多肽复合物的(a)随机抗原多肽、(b)MHC I HLA分子和(c)β2-微球蛋白特征之外,本公开内容的HLA-抗原多肽复合物可进一步包含(d)信号序列、(e)在(a)、(b)或(c)中的任何或全部之间的多肽接头、(f)膜拴系结构域,和任选地(g)表位标签,例如FLAG标签,c-Myc标签,His标签,血凝素(HA)标签,VSVg标签,V5标签,AU1标签,AU5标签,Glu-Glu标签,OLLAS标签,T7标签,S-TagHSV标签,KT3标签,TK15标签,Fc标签,Xpress标签,Ty标签,Strep标签,NE标签,E标签,C-标签和/或AviTag。在一些实施方案中,HLA-抗原复合物不包含表位标签。然而,在一些实施方案中,随机肽抗原文库的多个HLA-抗原复合物中的每一个中的至少一个或多个包含表位标签,其允许使用特异于该表位的抗体确认至少一种HLA-抗原复合物的表达。在一些实施方案中,随机肽抗原文库的多个HLA-抗原复合物中的每一个包含表位标签。

在一些实施方案中,膜拴系结构域包含将膜拴系结构域与HLA-抗原多肽复合物的一个或多个其他特征((a)-(e)和(g))分开的多肽接头。在一些实施方案中,HLA-抗原多肽复合物的特征((a)-(g))被表达为单个多肽。在一些实施方案中,(b)HLA分子(例如,HLA多肽)、(a)随机抗原多肽和(c)β2-微球蛋白多肽构成单个多肽。在一些实施方案中,(b)HLA多肽和(a)随机抗原多肽被表达为单个多肽,而(c)β2-微球蛋白被单独表达。例如,(c)β2-微球蛋白可以由表达(a)随机抗原多肽和(b)HLA多肽的同一核酸编码的单独多肽、单独核酸或由其细胞内源产生来提供。在一些实施方案中,随机抗原多肽在HLA多肽的N-末端,并且HLA多肽在β2-微球蛋白多肽的N-末端。在一些实施方案中,随机抗原多肽在HLA多肽的C-末端,并且HLA多肽在β2-微球蛋白多肽的N-末端。在一些实施方案中,随机抗原多肽在HLA多肽的N-末端,并且HLA多肽在β2-微球蛋白多肽的C-末端。在一些实施方案中,随机抗原多肽在HLA多肽的C-末端,并且HLA多肽在β2-微球蛋白多肽的C-末端。

(a)随机抗原多肽、(b)I类主要组织相容性(MHC I)HLA分子,和(c)β2-微球蛋白可以通过至少一个柔性多肽接头(例如第一柔性多肽接头,第二柔性多肽接头,第三柔性多肽接头,第四柔性多肽接头,第五柔性多肽接头或更多个柔性多肽接头)分开。在一些实施方案中,至少一个柔性多肽接头的长度范围可以为约3至约100个氨基酸残基,约5至约80个氨基酸残基,约10至约70个氨基酸残基,约3至约100个氨基酸残基,约20至约60个氨基酸残基。在一些实施方案中,接头的长度可以为约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个氨基酸残基。在一些实施方案中,接头可以是式(GGGGS)

在一些实施方案中,随机肽抗原文库的HLA-抗原多肽复合物包含信号多肽,其通过分泌途径将HLA-抗原多肽复合物引导至细胞表面。该信号肽在内质网中被切割,并且当位于细胞表面时不由HLA-抗原多肽复合物表达。信号序列可以是任何合适的序列,例如内源性HLA前导序列,或从不同的分泌或跨膜分子导入的异源前导序列,例如免疫球蛋白前导序列。

HLA-抗原多肽复合物还包含膜拴系结构域,例如来自糖基磷脂酰肌醇(GPI)蛋白的锚定结构域和/或来自具有内部重复序列的酵母蛋白(PIR蛋白)的结构域。该膜拴系结构域可以包含跨膜结构域或与细胞表面蛋白相互作用的结构域。在一些实施方案中,膜拴系结构域包含选自酵母Aga2、Cwp1p、Cwp2p、Aga1p、Tip1p、Flo1p、Sed1p、YCR89w和Tir1p的GPI蛋白和/或选自酵母Pir1p、Pir2p、Pir3p、Pir4p和Pir5p的PIR蛋白的至少一个锚定结构域。在图1B中提供了膜拴系结构域的非限制性实例。

在其他实施方案中,多个HLA-抗原多肽复合物的抗原筛选文库的组分被表达为多于一个多肽,并且包括将多个HLA-抗原多肽复合物的抗原筛选文库的组分彼此分开的切割序列。例如,通过切割序列将随机肽抗原与HLA多肽和/或与β-2(β2)微球蛋白多肽分开。作为另一个实例,HLA肽通过核苷酸编码的切割序列与β-2(β2)微球蛋白多肽分开。在一些实施方案中,抗原筛选文库的组分被多于一个切割序列分开。合适的切割序列是本领域普通技术人员已知的,并且包括但不限于自切割肽(P2A,T2A,F2A和E2A)、蛋白水解切割位点(3C位点,凝血酶位点,TEV位点,因子Xa位点和EKT位点)以及内部核糖体进入序列(IRES)。

在一些实施方案中,抗原筛选文库和/或HLA-抗原多肽复合物可以由一种或多种细胞表达,所述细胞可以容易地用本文所述的核酸转染、转导、电穿孔或转化。在一些实施方案中,抗原筛选文库和/或HLA-抗原多肽复合物在多个细胞上表达。在一些实施方案中,多个细胞中的每个细胞表达HLA-抗原多肽复合物的特定的HLA-抗原复合物和/或抗原筛选文库的另一组分。在一些实施方案中,核酸或多个核酸编码抗原筛选文库和/或HLA-抗原多肽复合物。在一些实施方案中,抗原筛选文库和/或HLA-抗原多肽复合物包括原核细胞。在一些实施方案中,表达HLA-抗原多肽复合物的细胞包括真核细胞。在一些实施方案中,真核细胞包括酵母细胞。在一些实施方案中,酵母细胞是酿酒酵母的细胞。在一些实施方案中,酿酒酵母是EBY100菌株。用核酸转化酿酒酵母可以通过标准方法实现,只要效率足以产生至少10

除了上文所述的抗原筛选文库的多个HLA-抗原多肽复合物之外,本发明的技术还包括具有不同于上文所述的那些的HLA-抗原多肽复合物的至少两个或更多个抗原筛选文库。在一些实施方案中,HLA-抗原多肽复合物与上文所述的多个HLA-抗原多肽复合物相比具有更少的组分和/或至少一个不同的组分。例如,在一些实施方案中,HLA-抗原多肽复合物还可包含(a)具有肽结合裂口的HLA多肽;和(b)随机抗原多肽,其包含与HLA多肽的肽结合裂口特异性结合的SEQ ID NO:1至209中的任何一个所示的氨基酸序列。在这些实施方案中,HLA多肽和随机抗原多肽构成单个多肽。此外,在这些实施方案中,单个多肽还包含将HLA多肽与随机抗原多肽分开的第一柔性多肽接头。当在由第一柔性多肽接头分开的单个多肽上表达时,在单个多肽上随机抗原多肽在HLA多肽的N-末端,或者在单个多肽上随机抗原多肽在HLA多肽的C-末端。

作为另一个实例,在一些实施方案中,本发明的技术的抗原筛选文库包含(a)由一种或多种酵母细胞组成性表达的HLA多肽,该HLA多肽包含结合肽的裂口,和(b)多个β-2(β2)微球蛋白多肽-抗原多肽复合物。在这些实施方案中,多个β-2(β2)微球蛋白多肽复合物包含随机抗原多肽,该随机抗原多肽包含SEQ ID NO:1至209中任何一个所示的氨基酸序列,其中该随机抗原多肽与HLA多肽的肽结合裂口特异性结合;和(c)β-2(β2)微球蛋白多肽。在这些实施方案中,随机抗原多肽和β2-微球蛋白多肽构成单个多肽。此外,在这些实施方案中,单个多肽还包含第一柔性多肽接头,其将β-2(β2)微球蛋白多肽与随机抗原多肽分开。当在由第一柔性多肽接头分开的单个多肽上表达时,在单个多肽上随机抗原多肽在β-2(β2)微球蛋白多肽的N-末端,或者在单个多肽上随机抗原多肽在β-2(β2)微球蛋白多肽的C-末端。

本文还公开了编码抗原筛选文库的HLA-抗原多肽复合物的核酸。编码本公开内容的HLA-抗原多肽复合物的核酸最少编码:(a)随机抗原多肽,(b)MHC I HLA分子,和(c)β2-微球蛋白。除了由一种或多种核酸编码的随机肽抗原文库的HLA-抗原多肽复合物的(a)随机抗原多肽、(b)MHC I HLA分子和(c)β2-微球蛋白特征外,本公开内容的HLA-抗原多肽复合物还包括编码以下的核酸:(d)信号序列、(e)(a)、(b)或(c)之间的多肽接头、(f)膜拴系结构域以及任选地(g)表位标签,例如FLAG标签,c-Myc标签,HIS标签,血凝素标签,VSVg标签,V5标签,AU1标签,AU5标签,Glu-Glu标签,OLLAS标签,T7标签,S标签,HSV标签,KT3标签,TK15标签,Fc标签,Xpress标签,Ty标签,Strep标签,NE标签,E标签,C标签和/或AviTag(图1A和图1B)。

在一些实施方案中,编码(f)膜拴系结构域的核酸可以进一步编码(e)将膜拴系结构域与HLA-抗原多肽复合物的其他特征分开的一个或多个多肽接头。在一些实施方案中,核酸编码一个或多个柔性多肽接头,当所有三个特征都在单个核酸上编码时,所述柔性多肽接头将(a)HLA多肽与(b)随机抗原多肽和(c)β2-微球蛋白多肽分开。

在一些实施方案中,编码单个多肽的核酸还包含编码第一柔性多肽接头和第二柔性多肽接头的核苷酸,其中编码第一柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码随机抗原多肽的核苷酸序列分开,和编码第二柔性多肽接头的核苷酸序列将编码随机抗原多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上随机抗原多肽在HLA多肽的N-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的N-末端。

在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码随机抗原多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上随机抗原多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的N-末端。

在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码随机抗原多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上随机抗原多肽在HLA多肽的N-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的C-末端。

在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码随机抗原多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码β2-微球蛋白多肽的核苷酸序列与编码HLA多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上随机抗原多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在β2-微球蛋白多肽的C-末端。

在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码随机抗原多肽的核苷酸序列与编码HLA多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上β2-微球蛋白多肽在HLA多肽的C-末端,并且在单个多肽上HLA多肽在随机抗原多肽的N-末端。

在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码HLA多肽的核苷酸序列与编码随机抗原多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码随机抗原多肽的核苷酸序列与编码β2-微球蛋白多肽的核苷酸序列分开。在一些实施方案中,一旦表达,在单个多肽上随机抗原多肽在β2-微球蛋白的C-末端,并且在单个多肽上HLA多肽在随机抗原多肽的C-末端。在一些实施方案中,编码第一柔性多肽接头的核苷酸序列将编码β2-微球蛋白多肽的核苷酸序列与编码随机抗原多肽的核苷酸序列分开,并且编码第二柔性多肽接头的核苷酸序列将编码随机抗原多肽的核苷酸序列与编码HLA多肽的核苷酸序列分开。

在其他实施方案中,尽管由单个核酸编码,但多个HLA-抗原多肽复合物的抗原筛选文库的组分表达为多于一个多肽。在这些实施方案中,核苷酸编码的切割序列将多个HLA-抗原多肽复合物的抗原筛选文库的组分彼此分开。例如,一旦表达,随机肽抗原通过切割序列与HLA多肽和/或与β-2(β2)微球蛋白多肽分开。作为另一个例子,一旦表达,HLA肽通过核苷酸编码的切割序列与β-2(β2)微球蛋白多肽分开。在这些实施方案中,HLA多肽的一部分与多个HLA-抗原多肽复合物的抗原筛选文库的其他组分分开地表达,并且当分开地表达时,与HLA-抗原多肽复合物的其他组分在细胞内天然配对。

在一些实施方案中,HLA-抗原复合物的随机抗原多肽由SEQ ID NO:210至411中的任何一个所示的核酸编码。在一些实施方案中,HLA-抗原复合物的HLA多肽由与SEQ ID NO:210至411中的任何一个至少70%、75%、80%、85%、87.5%、90%、95%、97%、98%、99%或100%同源的核酸编码。在一些实施方案中,HLA-抗原复合物的随机抗原多肽由SEQ ID NO:412至426中的任何一个所示的核酸编码。在一些实施方案中,HLA-抗原复合物的HLA多肽由与SEQ ID NO:280至308中的任何一个至少70%、75%、80%、85%、87.5%、90%、95%、97%、98%、99%或100%同源的核酸编码。在一些实施方案中,核酸中的一个或多个,例如SEQ ID NO:210至411和412至426的核酸中的一个或多个由多个细胞表达。在一些实施方案中,多个细胞中的每个细胞包含编码HLA-抗原复合物的核酸。在一些实施方案中,多个细胞是多个酵母细胞。在一些实施方案中,多个酵母细胞是酿酒酵母的EBY100菌株的多个细胞。

编码HLA-抗原多肽复合物的一个或多个组分的核酸可以使用核酸或载体(例如外源核酸或外源载体)递送至多个细胞。合适的外源核酸和外源载体包括质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、转座子和病毒载体。这些外源核酸和外源载体可以进一步包含允许编码HLA-抗原多肽复合物的一个或多个组分的核酸的复制、允许抗生素选择以允许表达编码HLA-抗原多肽复合物的一个或多个组分的核酸的细胞或其他生物体的选择的组分,补充酵母自养体以选择表达编码HLA-抗原多肽复合物的一个或多个组分的核酸的酵母转化株的基因、用于HLA-抗原多肽复合物的原核或真核表达的启动子或增强子、聚腺苷酸化位点或允许转化的细胞的可视化的标记基因。在一些实施方案中,包含编码本公开内容的HLA-抗原多肽复合物的核酸的核酸包含诱导型启动子。

使用HLA-抗原多肽复合物和编码这样的复合物的核酸的方法最少包括使表达HLA抗原多肽复合物的一个或多个细胞(例如多个细胞)与TCR接触,并选择与TCR相互作用的一个或多个细胞。例如,可以通过在“淘选步骤”中使用TCR以捕获与TCR相互作用的表达HLA-抗原多肽复合物的一个或多个细胞并洗掉任何非相互作用的细胞(例如不与TCR相互作用的不表达HLA-抗原多肽复合物一个或多个细胞)来进行选择。可以收获来自相互作用细胞的核酸并进行测序,以阐明与TCR相互作用的随机抗原多肽的氨基酸序列。可以将这些核酸重新转染、转化或转导到一个或多个不同的细胞中以用于另一轮选择。该方法可以重复任何数量的选择轮次,例如1、2、3、4、5轮或更多轮(例如,在循环中),以富集与TCR强烈相互作用的HLA-抗原多肽复合物。

可在本公开内容中使用的测序平台包括但不限于:焦磷酸测序,合成测序,单分子测序,第二代测序,纳米孔测序,通过连接测序或通过杂交测序。优选的测序平台是可从Illumina(RNA-Seq)和Helicos(Digital Gene Expression或“DGE”)商购获得的那些。“下一代”测序方法包括但不限于以下商业化方法:1)454/Roche Lifesciences,包括但不限于Margulies 2005和美国专利号7,244,559;7,335,762;7,211,390;7,244,567;7,264,929;和7,323,305中描述的方法和装置;2)Helicos Biosciences Corporation(Cambridge,MA),如在美国专利号7,501,245;7,491,498;和7,276,720;以及在美国专利公开号2006/0024711;2009/0061439;2008/0087826;2006/0286566;2006/0024711;2006/0024678;2008/0213770;和2008/0103058中所述的;3)Applied Biosystems(例如,SOLiD测序);4)Dover Systems(例如,Polonator G.007测序);5)Illumina,如在美国专利号5,750,341;6,306,597;和5,969,119中所描述的;和6)Pacific Biosciences,如在美国专利号7,462,452;7,476,504;7,405,281;7,170,050;7,462,468;7,476,503;7,315,019;7,302,146;和7,313,308;以及在美国专利公开号2009/0029385;2009/0068655;2009/0024331;和2008/0206764中所描述的。

本文描述了使用本公开内容的HLA-抗原多肽复合物来选择或富集结合TCR(例如特异性TCR)的抗原的方法。在一些实施方案中,所述方法包括使用一个或多个转基因HLA-抗原多肽细胞文库(例如转基因HLA-抗原多肽酵母细胞文库),使表达HLA抗原多肽复合物的一个或多个(例如多个细胞)与TCR接触来选择抗原。本文所述的方法包括用于构建一个或多个转基因HLA-抗原多肽酵母细胞文库的方法。

在构建一个或多个转基因HLA-抗原多肽酵母细胞文库之后,所述方法进一步包括使用有限稀释方法验证一个或多个转基因HLA-抗原多肽酵母细胞文库,所述有限稀释方法包括使用营养缺乏的酵母培养基对各自表达至少一种HLA-抗原多肽的增殖酵母细胞的一个或多个培养物的有限稀释。在一些实施方案中,所述方法进一步包括计数来自稀释的酵母培养物的酵母,并估计具有至少约10

参照图2,可以用编码本公开内容的HLA-抗原多肽复合物的多个核酸202转化、转染或电穿孔多个细胞201,例如酵母。表达编码HLA-抗原肽复合物的多个核酸的多个细胞被称为转基因HLA-抗原多肽细胞文库203。转基因HLA-抗原多肽细胞文库203通过细胞增殖而扩增,并通过本领域已知的方法例如通过半乳糖、乳糖或异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)诱导多个细胞的HLA-抗原多肽复合物204的表达。使用该TCR 205阳性选择与TCR相互作用的表达HLA-抗原多肽复合物的细胞。在一些实施方案中,将TCR固定在基底上。在一些实施方案中,TCR由一个细胞或多个细胞表达。图2所示的该选择过程可以重复任意数目的选择轮次,例如1、2、3、4、5或更多次,以得到与TCR相互作用的单个或少量的HLA-抗原多肽复合物。在一些实施方案中,HLA-抗原多肽复合物包含多肽抗原。在一些实施方案中,多肽抗原是非天然存在的多肽抗原,例如在人中不是天然存在的多肽抗原。在每一轮选择之后或在最后一轮选择之后,可以对从选择的细胞205中提取的核酸进行深度测序或下一代测序反应。

在一些实施方案中,用本公开内容的方法(例如图2中所示的那些)筛选大于至少1x10

幼稚酵母文库(例如本文所述的HLA-抗原多肽序列文库)的表达最少表达约15%的在由HLA-A1呈现的单一9mer长度的肽的抗原多肽序列文库中的总抗原多肽序列(Gee2018b),和至少约5%的在具有由HLA-A2呈现的混合长度的肽(例如,8mer、9mer、10mer、11mer、12mer)的抗原多肽序列文库中的单一长度的肽(例如,8mer)(Gee 2018a)。尽管具有8mer的长度的肽的抗原多肽序列文库的少于约5%的单一长度表达,但TCR从在体外共培养测定中刺激TCR的抗原多肽序列文库中分离了靶8mer抗原(Gee 2018a)。已经筛选了这些抗原多肽序列文库并分离了针对具有已知特异性的TCR的肽(Gee 2018a)。尽管尚未确定功能性文库必需的最低表达水平,但数据显示少于15%的表达可导致可用于本文所述方法的抗原多肽序列文库。

在一些实施方案中,本公开内容的方法进一步包括鉴定与TCR相互作用的多肽抗原。例如,用于确定TCR相互作用多肽抗原的方法可包括以下任何步骤:

1.产生和HLA-抗原多肽复合物构建体设计:在一些实施方案中,步骤(1)包括但不限于产生一种或多种DNA构建体和/或设计以展示具有天然存在的蛋白序列、合成蛋白序列或其组合的一种或多种HLA多肽。

2.通过酵母表达测试HLA-抗原多肽复合物构建体的表达:在一些实施方案中,步骤(2)包括但不限于用编码单个肽或肽文库(包括感兴趣的HLA,例如HLA多肽)的质粒转化一个或多个电或化学感受态酵母。该质粒被设计用于单个肽构建体或肽构建体文库,以从Aga2的N-末端展示酵母蛋白。在一些实施方案中,表达确认可以包括表位标签(例如,V5,VSVg,c-Myc,HA)的抗体染色或展示单个肽-HLA构建体或肽-HLA构建体文库的酵母的荧光TCR四聚体、二聚体或右旋聚体(dextramer)染色。

3.用于HLA展示的任选验证步骤:在一些实施方案中,步骤(3)包括但不限于步骤(2)的表位标签的基于抗体的染色或展示单个肽-HLA构建体或肽-HLA构建体的文库的酵母的荧光TCR四聚体、二聚体或右旋聚体染色。在一些实施方案中,验证还可以包括用具有已知特异性或用于选择由HLA呈现的多样肽文库的TCR对肽-HLA构建体染色。

4.重新工程化HLA以用于展示的任选步骤:在一些实施方案中,步骤(4)包括但不限于经由易错聚合酶的随机诱变,然后电穿孔到化学和/或电感受态酵母。通过基于感兴趣的TCR的磁性细胞分选(MACS)或荧光激活细胞分选(FACS)使用细胞分离来选择表达本发明的技术的一个或多个文库的酵母细胞。在一些实施方案中,对分离的酵母克隆进行测序或深度测序以鉴定适当展示感兴趣的抗原肽的任何功能性HLA突变体。如果构建体或文库不恰当地展示,则在一些实施方案中包括步骤(4)。

5.肽-HLA文库的产生:在一些实施方案中,步骤(5)包括但不限于随机编码的肽配体或明确编码的肽配体。例如,基于每个HLA等位基因可以呈现的肽的偏好,为每个HLA等位基因独特地设计随机编码的肽配体或明确编码的肽配体。在一些实施方案中,步骤(5)还包括从一个或多个聚合酶链反应产生遗传物质。

6.具有感兴趣的TCR的肽-HLA文库的选择:在一些实施方案中,步骤(6)包括但不限于重复基于MACS或基于FACS的选择。例如,感兴趣的TCR或具有一个或多个抗原结合结构域的其他大分子充当诱饵,并且可以在磁珠、链霉亲和素、右旋糖酐或适合于多聚化的其他基底上多聚化。在一些实施方案中,一个或多个选择轮次的输出包括一个或多个酵母细胞与TCR的物理分离。分离后,酵母繁殖并被重新诱导用于蛋白质表达。这些重复轮次富集了结合性酵母群体。

7.深度测序和数据分析:该过程可能涉及提取酵母文库的遗传信息并进行选择,和对产物进行测序以鉴定来自所选文库的肽的性质。然后可以对这些数据进行分析以鉴定TCR的潜在靶标,和/或将其输入到算法中以做出有关TCR特异性的预测。

本文所述的转基因HLA-抗原多肽细胞文库和HLA-抗原多肽复合物的抗原可以与给定的TCR结合使用。例如,TCR或具有一个或多个抗原结合结构域的其他大分子是阳性选择剂或诱饵,并且一旦与抗原(例如,HLA-抗原多肽复合物)结合时,就鉴定其同源抗原。本文所述的TCR可以是天然的或外源的(例如,重组的),并由细胞例如原代T细胞、永生化T细胞或非T细胞表达。在一些实施方案中,TCR被固定在固体支持物例如柱子、聚苯乙烯板或多孔板的孔或珠子上。在一些实施方案中,TCR被多聚化为固定在珠子上的多个TCR。例如,TCR可以在但不限于磁珠、链霉亲和素或右旋糖酐上多聚化。

在一些实施方案中,TCR是可溶性蛋白质,其包含感兴趣的TCR(例如,TCRa/β、TCRy/δ)的至少一个或多个结合结构域。可溶性蛋白可以是单链或异二聚体。在一些实施方案中,通过在一个多肽的C-末端添加生物素受体肽序列来修饰可溶性TCR。在受体肽上的生物素化后,TCR可通过与生物素结合伴侣(例如,抗生物素蛋白,链霉亲和素,traptavidin,中性抗生物素蛋白等)结合而多聚化或添加至基底。在一些实施方案中,生物素结合伴侣可以包括可检测的标记,例如荧光团、质量标记等,或者可以与颗粒(例如,顺磁性颗粒)结合。结合至TCR的配体的选择可以通过如本领域中已知的流式细胞术、磁性选择等来进行。

在前述材料和/或通过引用并入本文的任何其他材料与本公开内容冲突的程度上,以本公开内容为准。

以下实施例提供了本文公开的技术的其他代表性实施方案。

实施例

提供以下实施例以进一步举例说明本发明的技术的实施方案,并且其不应被解释为限制本发明的技术的范围。在提及某些实施方案或其特征的程度上,其仅出于举例说明的目的,并且除非另有说明,否则其不意图限制本发明的技术。本领域技术人员可以在不行使发明能力的情况下并且在不脱离本发明的技术的范围的情况下开发等同的手段。将理解的是,可以在本文描述的程序中做出许多变化,同时保持在本发明的技术的范围内。这样的变化旨在被包括在本文公开的技术的范围内。因此,在以下代表性实施例中描述了本文公开的技术的实施方案。

实施例1:抗原多肽文库的设计

该实施例描述了与多肽抗原HLA复合物一起使用的本公开内容的抗原文库的设计。使用来自诸如www.IEDB.org/的网站的已知HLA结合表位配体的数据,设计和选择每个HLA等位基因的锚定残基的示例性算法如下:

步骤1:下载与给定等位基因结合的多肽的列表,其可以包含数百个肽或数千个肽。

步骤2:基于下载的已知肽,构建肽的每个位置的残基的频率矩阵。

步骤3:通过使用每个位置处的前4个残基的截止值,选择用于文库设计的“锚”的组成。

实施例2:pHLA文库的电穿孔

该实施例描述了用编码具有所有HLA同种异型并使用长度为8-11个氨基酸的肽(8mer-11mer)的本公开内容的示例性抗原文库的核酸电穿孔酵母细胞。在该实施例中,酵母细胞用编码HLA-抗原多肽复合物的抗原文库(pHLA文库)的核酸进行电穿孔。

用于在酵母上表达pHLA的电穿孔方法如下:

第0天:

1.高压灭菌三个2.5L带挡板的烧瓶和一个250mL带挡板的烧瓶用于扩增增殖性酵母培养物。

2.制备酵母蛋白胨葡萄糖培养基(YPD),其包含细菌蛋白胨、葡萄糖和酵母提取物。

3.制备两个5ml EBY100酵母培养物,并在30℃下摇动过夜。

4.制备用HindIII、NheI或NheI和BamHI限制酶消化的pYAL_3T质粒(10μg),和含有SEQ ID NO:210至411的文库的插入物(50μg)。pYAL_3T载体(SEQ ID NO:485)是pCT载体(SEQ ID NO:486;Invitrogen)的衍生物,表8,并且在图3A和3B中提供了图谱。表9和表10分别包括了pYAL_3T和pCT的特征。pYAL_3T与pCT的不同之处至少在于:作为pHLA文库的C-末端的展示蛋白支架(Aga2)的方向,人B2M的添加和连接接头。已描述了pYAL_3T(Gee2018a)。

表8:pYAL_3T和pCT载体的核苷酸序列

表9:pYAL_3T载体的特征

表10:pCT载体的特征

第1天:通过将100μl的两种酵母培养物中的每一种添加到5ml的新鲜YPD中,将来自第0天步骤3的两种酵母培养物传代并在30℃下摇动过夜。

第2天:

1.测量来自第1天的过夜培养物的光密度(OD)。

2.在2.5L带挡板的烧瓶中,使用YPD,使用来自步骤1的300ml的OD 0.3酵母培养物制备新的培养物。

3.制备3ml的1M Tris pH 8.0/1M 1,4-二硫苏糖醇(DTT)

4.制备15ml的2M醋酸锂(LiAc)/10mM Tris,1mM EDTA(TE)

5.繁殖培养物至1.6-2.0的OD。

6.加入3ml的Tris/DTT。

7.加入15ml的2M LiAc/TE。

8.使培养物在30℃下繁殖15分钟,同时以每分钟225转(rpm)摇动。

9.以3000xg离心培养物3分钟。

10.将沉淀物重悬浮于50mL冷E-缓冲液中。

11.将来自步骤10的悬浮液在4℃下以3000xg离心3分钟。

12.重复步骤10和11两次。

13.去除残留的缓冲液。

14.将沉淀物重悬浮于600μL E-缓冲液中。

15.添加来自第0天的步骤4的50μg插入物和10μg消化的质粒,缓冲液、插入物、质粒和酵母的总体积应为约1mL。

16.将来自步骤15的150μL悬浮液等分到冰冷的2mm间隙电穿孔比色杯中。

17.在2.5kV下电穿孔每个比色杯。时间常数应在3到4ms

18.添加三个1mL体积的冷YPD,然后使用YPD使总体积增加到200mL

19.在250mL带挡板的烧瓶中,在30℃下以225rpm培养经电穿孔的酵母1小时。

20.以3500xg离心培养物3分钟以形成酵母细胞沉淀物,倒出上清液,并将酵母细胞沉淀物重悬浮于10mL的SDCAA(葡萄糖酪蛋白氨基酸,其还包括不含氨基酸的酵母氮源和硫酸铵、柠檬酸钠和柠檬酸一水合物,pH为4.5)。

第2天:确定滴度

1.向四个Eppendorf管中的每一个中加入990μL的SDCAA。

2.将来自上述步骤20的10μL加入含有990μL的SDCAA的管中。

3.移液吸取100μL的10

4.移液吸取100μL的10

5.移取吸取100μL的10

6.将步骤2-5中的100μL的每种稀释液涂布在单独的SDCAA板上,并在30℃下孵育3天。计数平板上的菌落以确定滴度。根据步骤2,计数的菌落代表文库x10

7.向来自步骤20的剩余的细胞悬浮液加入490ml的pH 4.5SDCAA,并在30℃下培养过夜。

第3天:24小时后,测量来自步骤8的传代物的OD。OD应至少为5。在500mL的SDCAA的总体积中将培养物传代至OD为1。

第4天:在500mL的SDCAA的总体积中将细胞传代至OD为1。

第5天:在来自第2天的步骤18后72小时,在SGCAA中(半乳糖酪蛋白氨基酸,其还包括不含氨基酸的酵母氮源和硫酸铵、柠檬酸钠和柠檬酸一水合物,pH为4.5)进行诱导。

配方:

1)E-缓冲液,500ml

-0.6g Tris碱,

-91.09g山梨糖醇(1M)

-在ddH2O中的73.50mg CaCl2(1mM;考虑制成1M储备溶液)至500ml的最终体积,7.5的pH。通过0.22μm膜过滤。

2)1M Tris/1M DTT,3ml

-在3ml 1M Tris中的0.462g 1,4-二硫苏糖醇,pH 8.0并通过过滤灭菌。

3)2M LiAc/TE溶液,15ml

-在10ml的TE(10mM Tris,1mM EDTA)中的1.98g LiAc,通过过滤灭菌。

实施例3:pHLA表达的表征

该实施例描述了表征实施例2的经电穿孔的酵母细胞上的HLA-抗原多肽复合物的表达。这些表达测量包括FACS分析以确定在酵母细胞表面上展示的肽-MHC的水平并指示随机酵母菌展示文库的功能性。酵母上pHLA的表达的表征方法如下:

材料

1.来自实施例2的酵母文库

2.PBSM(1x PBS,1g/L牛血清白蛋白,EDTA,pH 7.4;经过滤的)

3.抗-myc(FITC荧光团缀合的)抗体

4.96孔U型底平板

任选的:

5.抗-V5(647荧光团缀合的)抗体

6.抗-HA(BV421荧光团缀合的)抗体

7.抗-VSV(PE荧光团缀合的)抗体

细胞制备

1.在NanoDrop上测量酵母培养物的光密度。介于0至1之间的OD600读数在以1:20的培养物:SDCAA稀释度在20℃下诱导2到3天的培养物的线性范围内。

2.将酵母培养物的样品转移到96孔板的孔中。对于具有约10的OD600的酵母培养物,使用25μL的培养物。包括了单色和未染色的对照。

3.向每个孔中添加PBSM至200μl的最终体积。

4.以2500xg离心96孔板2分钟。

5.去除上清液。

染色细胞

1.将每个细胞沉淀物重悬浮于100μl PBSM中

2.视情况添加1μl抗体。

3.在4℃避光(例如在黑暗下)孵育30分钟。

洗涤细胞并测定pHLA表达

1.以2500xg离心96孔板2分钟。

2.去除上清液。

3.将每个沉淀物重悬浮于200μl PBSM中。

4.以2500xg离心96孔板2分钟。

5.去除上清液。

6.将每个沉淀物重悬浮于200μl PBSM中。

7.用CytoFlex分析每个孔中的样品。

结果:HLA-抗原多肽复合物(SEQ ID NO:8、11、14、18、21+24、28、32、36、40-44、47、50、53、56、65、75、69、77+80、89、95、99、102+106、108、111+114、117+120、124和125的肽)的表达通过流式细胞术确定,并在图4中显示。使用靶向由HLA-抗原多肽复合物表达的表位标签的抗体来染色经电穿孔的酵母细胞。FITC-A染色对应于表达c-Myc标签的HLA-抗原多肽复合物。抗体-表位标签结合被用作用于测定pHLA表达的替代物,如图4所示,其范围为SEQID NO:56的8.99%到SEQ ID NO:177+180的26.3%的表达。

实施例4:pHLA表达的功能验证

该实施例描述了用候选TCR在功能上验证实施例2的经电穿孔的酵母细胞上pHLA的表达。当候选TCR是同种异型匹配时,可以从多达6个文库鉴定pHLA的预期靶抗原。酵母上pHLA的表达的功能验证方法如下:

HLA-抗原多肽序列文库(例如本文公开的那些)最少表达约25%的由HLA-A1呈现的单一9mer长度的肽的总抗原多肽序列(Gee2018b),和表达少于约5%的具有由HLA-A2呈现的混合长度的肽(例如,8mer、9mer、10mer、11mer)的单一长度的肽(例如,8mer)(Gee2018a)。尽管具有8mer长度的肽的HLA-抗原多肽序列的单一长度的肽的表达少于约5%,但是分离的感兴趣的TCR靶向来自HLA-抗原多肽复合物的8mer抗原。这些分离的感兴趣的TCR在体外共培养测定中被一种或多种HLA-抗原多肽复合物刺激(Gee 2018a;参见其中的图5C和7A)。已经筛选了HLA-抗原多肽文库并分离了结合已知特异性的TCR的肽(Gee 2018a)。尽管尚未确定本公开内容的功能性HLA-抗原多肽文库所必需的最低表达水平,但数据显示少于15%的表达可导致可用于本文所述方法的HLA-抗原多肽文库。

虽然本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员而言明显的是,这些实施方案仅通过示例的方式提供。在不脱离本发明的情况下,本领域技术人员现在将想到许多变化、改变和替代。应当理解,本文所述的本发明的实施方案的各种替代方案可以用于实施本发明。

本说明书中引用的所有出版物、专利申请、已发布的专利和其他文件均通过引用并入本文,就好像每个单独的出版物、专利申请、已发布的专利或其他文件均被明确地并单独地指出通过引用整体并入。在与本公开内容中的定义相冲突的程度上,排除通过引用并入的文本中包含的定义。

参考资料

Altschul等人,“Basic local alignment search tool.”J Mol Biol215(3):403-410(1990)

Altschul&Karlin.“Methods for assessing the statistical significanceof molecular sequence features by using general scoring schemes.”Proc NatlAcad Sci USA 87(6):2264-2268(1990)

Altschul&Karlin.“Applications and statistics for multiple high-scoring segments in molecular sequences.”Proc Natl Acad Sci USA 90(12):5873-5877(1993)

Arden等人,“Human T-cell receptor variable gene segment families.”Immunogenetics 42(6):455-500(1995)

Bowie等人,“A method to identify protein sequences that fold into aknown three-dimensional structure.”Science253(5016):164–170(1991)

Brenner等人,“Population statistics of protein structures:lessons fromstructural classifications.”Curr Opin Struct Biol 7(3):369–376(1997)

Chou&Fasman.“Prediction of protein conformation.”Biochemistry 13(2):222–245(1974a)

Chou&Fasman.“Conformational parameters for amino acids in helical,beta-sheet,and random coil regions calculated from proteins.”Biochemistry 113(2):211–222(1974b)

Chou&Fasman.“Prediction of the secondary structure of proteins fromtheir amino acid sequence.”Adv Enzymol Relat Areas Mol Biol 47:45–148(1978a)

Chou&Fasman.“Empirical predictions of protein conformation.”Annu RevBiochem 47:251–276(1978b)

Chou&Fasman.“Prediction of beta-turns.”Biophys J26:367–384(1979)

Gee等人,“Antigen identification for orphan T cell receptors expressedon tumor-infiltrating lymphocytes.”Cell 172(3):549-563(2018a)

Gee等人,“Facile method for screening clinical T cell receptors foroff-target peptide-HLA reactivity.”bioRxiv 472480(2018b)

Gribskov等人,“Profile analysis:detection of distantly relatedproteins.”Proc Natl Acad Sci USA 84(13):4355–4358(1987)

Gribskov等人,Profile analysis.”Methods Enzymol 183:146–159(1990)

Holm&Sander.“Protein folds and families:sequence and structurealignments.”Nucleic Acids Res 27(1):244–247(1999)

Jones.“Progress in protein structure prediction.”Curr Opin StructBiol 7(3):377–87(1997)

Jones等人,“Engineering and Characterization of a Stabilizedα1/α2Module of the Class I Major Histocompatibility Complex Product L.”J.ofBiol.Chem.281(35):25734-25744(2006)

Kotsiou等人,“Properties and Applications of Single-Chain MajorHistocompatibility Complex Class I Molecule.”Antioxid.Redox Signal.15(3):645-655(2011)

Kyte&Doolittle.“A simple method for displaying the hydropathiccharacter of a protein.”J Mol Biol 157(1):105-132(1982)

Mackelprang等人,“Sequence diversity,natural selection and linkagedisequilibrium in the human T cell receptor alpha/delta locus.”Hum Genet 119(3):255-266(2006)

MacLennan等人,“Structure-function relationships in the Ca(2+)-bindingand translocation domain of SERCA1:physiological correlates in Brodydisease.”Acta Physiol Scand Suppl 643:55-67(1998)

Margulies等人,“Genome sequencing in microfabricated high-densitypicolitre reactors.”Nature 437(7057):376-380(2005)

Mottez等人,“Cells Expressing a Major Histocompatibility Complex ClassI Molecule with a Single Covalently Bound Peptide Are Highly Immunogenic.”J.Exp.Med.181:493-502(1995)

Moult.“The current state of the art in protein structure prediction.”Curr Opin Biotechnol 7(4):422–427(1996)

Pandey等人,“Current strategies for protein production andpurification enabling membrane protein structural biology.”Biochem CellBiol.94(6)507-527(2016)

Rowen等人,“The complete 685-kilobase DNA sequence of the human beta Tcell receptor locus.”Science 272(5269):1755-1762(1996)

Sasaki&Sutoh.“Structure-mutation analysis of the ATPase site ofDictyostelium discoideum myosin II.”Adv Biophys 35:1–24(1998)

Sippl&Flockner.“Threading thrills and threats.”Structure4(1):15–19(1996)

Tafuro等人,“Reconstitution of Antigen Presentation in HLA Class I-Negative Cancer Cells with Peptide-β-2m Fusion Molecules.”Eur.J.Immunol.31:440-449(2001)

White等人,“Soluble Class I MHC withβ2-MicroglobulinCovalently LinkedPeptides:Specific Binding to a T Cell Hybridoma.”J.Immunol.162:2671-2676(1999)

技术分类

06120112678659