掌桥专利:专业的专利平台
掌桥专利
首页

根本上多样的人类抗体文库

文献发布时间:2023-06-19 10:14:56


根本上多样的人类抗体文库

本申请要求于2017年12月18日提交的美国临时申请号62/607,199以及于2018年10月31日提交的美国临时申请号62/753,754的权益,这些申请的全部内容通过引用并入本文。

单克隆抗体(mAb)可用作治疗剂、研究工具并用于诊断方法中,但找到对期望的靶标具有亲和力的抗体可能具有挑战。抗体文库提供了用于针对目标化合物筛选大量抗体的有效工具。此类文库通常基于天然存在的可变基因的重排或将合成多样性引入抗体序列中。然而,天然抗体文库通常具有极其有限的多样性,而合成文库可能会受到非功能性序列的困扰。因此,需要开发具有高度功能多样性的抗体文库。

发明内容

本文提供了抗体文库,其包含多种抗体。多种抗体可以包含包括VH-CDR1序列、VH-CDR2序列、VH-CDR3序列的VH结构域和包括VL-CDR1序列、VL-CDR2序列、VL-CDR3序列的VL结构域。VH-CDR3序列和VL-CDR3序列中的至少一个可以源自初始

本文还提供了制备抗体文库的方法,包括:a)从初始B细胞池获得多个VH-CDR3和VL-CDR3序列的序列信息,并从记忆B细胞池获得多个VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1、VL-CDR2和VL-CDR3序列的序列信息;b)组装多个可变轻(VL)结构域序列,每个VL结构域序列包括:从步骤a中确定的来自记忆B细胞的序列信息获得的VL-CDR1序列,从步骤a中确定的来自记忆B细胞的序列信息获得的VL-CDR2序列,以及从步骤a中确定的来自记忆B细胞或初始B细胞的序列信息获得的VL-CDR3序列,c)组装编码多个第一抗体的多个第一核酸序列,每个第一抗体包含在步骤b.中组装的可变轻(VL)结构域序列和单个固定的重链序列;d)将多个第一核酸序列插入多个噬菌体中;e)在多个噬菌体的表面上表达多个第一抗体;f)对多个噬菌体施加至少一种选择压力以产生包含第一核酸序列的子集的噬菌体的子集;g)组装多个可变重(VH)结构域序列,每个VH结构域序列包括:从步骤a中确定的来自记忆B细胞的序列信息获得的VH-CDR1序列,从步骤a中确定的来自记忆B细胞的序列信息获得的VH-CDR2序列,以及从步骤a中确定的来自记忆B细胞或初始B细胞的序列信息中获得的VH-CDR3序列,其中VH-CDR3序列和VL-CDR3序列中的至少一个源自来自初始B细胞的序列信息;h)用步骤g中组装的多个VH结构域序列替换来自第一核酸序列的子集中的单个固定的重链序列,以产生多个第二核酸序列,每个第二核酸序列包含在步骤b中组装的可变轻(VL)结构域序列和在步骤g.中组装的可变重(VH)结构域序列,其中多个第二核酸序列编码多个第二抗体;以及i)用多个噬菌体转化多种微生物以产生多个转化体。在一些实施方案中,初始B细胞池包含少于5%的并非初始B细胞来源的细胞。在一些实施方案中,记忆B细胞池包含少于5%的并非记忆B细胞来源的细胞。在一些实施方案中,源自初始B细胞的VH-CDR3序列和VL-CDR3序列中的至少一个是天然存在的序列。在一些实施方案中,源自记忆细胞的VH-CDR3序列或VL-CDR3序列是天然存在的序列。在一些实施方案中,源自记忆B细胞的VH-CDR1序列、VH-CDR2序列、VL-CDR1序列和VL-CDR2序列是天然存在的序列。在一些实施方案中,源自初始B细胞的VH-CDR3序列和VL-CDR3序列中的至少一个与天然存在的序列包含至少80%的序列同源性。在一些实施方案中,源自记忆细胞的VH-CDR3序列或VL-CDR3序列与天然存在的序列包含至少80%的序列同源性。在一些实施方案中,源自记忆B细胞的VH-CDR1序列、VH-CDR2序列、VL-CDR1序列和VL-CDR2序列与天然存在的序列包含至少80%的序列同源性。在一些实施方案中,初始B细胞池、记忆细胞池或其组合从多个个体获得。在一些实施方案中,多个个体是至少50个个体。在一些实施方案中,所述方法进一步包括在获得序列信息之前,对样品中的初始B细胞和记忆B细胞进行分选以产生初始B细胞池和记忆B细胞池。在一些实施方案中,对初始B细胞和记忆B细胞进行分选包括使用流式细胞术。在一些实施方案中,流式细胞术是荧光激活细胞分选术(FACS)。在一些实施方案中,所述方法进一步包括从初始B细胞和记忆B细胞提取核酸。在一些实施方案中,所述核酸是DNA。在一些实施方案中,所述核酸是mRNA。在一些实施方案中,所述方法进一步包括将mRNA逆转录为互补DNA(cDNA)。在一些实施方案中,组装每个VL结构域序列包括使用重叠延伸PCR(OE-PCR)。在一些实施方案中,组装每个VH结构域序列包括使用重叠延伸PCR(OE-PCR)。在一些实施方案中,单个固定的重链序列是选自IGHJ4、IGHV1-46、IGHV1-69、IGHV3-15和IGHV3-23的种系序列。在一些实施方案中,施加至少一种选择压力包括施加热应力、用蛋白A选择、用蛋白L选择或其组合。在一些实施方案中,热应力为至少65℃的温度。在一些实施方案中,向多个噬菌体施加热应力从噬菌体子集排除不稳定和易于聚集的噬菌体。

本文还提供了包含多种抗体的抗体文库,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)CDR序列选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列,其中CDR序列对于多种抗体中的每种抗体是相同的;并且(d)其余的CDR序列的独特组合选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列。在一些实施方案中,(c)的CDR序列是VH-CDR3序列。在一些实施方案中,(d)的其余的CDR序列是VH-CDR1序列、VH-CDR2序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列。在一些实施方案中,(c)的CDR序列与源自初始抗体克隆的CDR序列相同。在一些实施方案中,(d)的其余的CDR序列中的每一个以高度多样性存在于抗体文库中。在一些实施方案中,高度多样性包括至少1×10

本文进一步提供了用于生成抗体文库的方法,所述方法包括:(a)选择CDR序列,其中所述CDR序列选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列;(b)用(a)中选择的CDR序列替换第一抗体文库中的每种抗体的CDR序列,从而生成包含多种抗体的第二抗体文库,其中多种抗体中的每种抗体包含:(i)在(a)中选择的CDR序列;以及(ii)在(a)中未选择的其余的CDR序列的独特组合,其中所述其余的CDR序列选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列。在一些实施方案中,第一抗体文库包含多种抗体,其中多种抗体中的每种抗体包含VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的独特组合。在一些实施方案中,在(a)中选择的CDR序列是VH-CDR3序列。在一些实施方案中,(ii)的其余的CDR序列是VH-CDR1序列、VH-CDR2序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列。在一些实施方案中,(ii)的其余的CDR序列中的每一个以高度多样性存在于抗体文库中。在一些实施方案中,高度多样性包括至少1×10

本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。

附图说明

专利或申请文件包含至少一个彩色附图。根据专利局要求并支付必要的费用后,将提供带有彩色附图的本专利或专利申请公开的副本。本发明的新颖特性在所附的权利要求书中具体阐述。通过参考以下对其中利用到本发明原理的说明性实施方案加以阐述的详细说明和附图,将会获得对本发明特征和优点的更好理解,在附图中:

图1示出了与从记忆B细胞获得的VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1、VL-CDR2和VL-CDR3多样性的量相比,从单个个体的初始B细胞获得的VH-CDR3和VL-CDR3多样性的量。

图2示出了使用包括SuperHuman+Carterra和SuperHuman Zero-Day在内的不同技术开发抗体文库的时间长度。

图3示出了显示对PD1的亲和力(nM)的克隆的百分比。

图4示出了针对人和食蟹猴细胞表面PD1对五个抗-PD1克隆的反应性。在对照中,在每个图中,PPE对照/亲本细胞和PPE对照/转染细胞是最左侧的峰,而阳性对照抗体/转染细胞是最右侧的峰。在所选克隆图中,在每个图中,PPE对照/转染细胞是最左侧的峰,而PPE阳性/转染细胞是最右侧的峰。

图5示出了两个抗-PD1克隆在人类、小鼠和食蟹猴之间的交叉反应性。

图6示出了针对配体阻塞的筛选。

图7示出了包含61个阳性和49个独特克隆的2个板的β半乳糖苷酶(bGal)ELISA和Sanger筛选。

图8示出了抗体克隆序列的多样性。

图9显示了抗体融合变体。

图10示出了抗bGal#27的VH-CDR1(CDR-H1)和VH-CDR2(CDR-H2)中的变体。

图11描绘了框架选择策略中涉及的因素。

图12A-图12B示出了来自I期临床试验的mAb的框架用途。图12A示出了在来自I期临床试验的超过400个mAb中使用的重链框架。图12B示出了在来自I期临床试验的超过400个mAb中使用的轻链框架,示出了大部分I期mAb是源自κ的。

图13描绘了14个人类群体中12个框架的等位基因频率。

图14描绘了14个人类亚群中27个框架的等位基因频率。

图15示出了人类抗体框架的亲和力成熟景观图。

图16示出了3个框架区:VH-FR1(FW1)、VH-FR2(FW2)和VH-FR3(FW3),以及2个CDR:VH-CDR1(CDR-H1)和VH-CDR2(CDR-H2)的氨基酸序列。

图17示出了组合设计和选择以产生功能上多样的VH和VK序列的抗体文库。

图18示出了各种文库制备过程中的重链冗余度。

图19示出了克隆之间的序列重叠。

图20描绘了来自超过100个个体的体细胞高变(SHM)。

图21描述了所使用的框架(在本文也称为支架)和抗体文库的多样性。

图22描述了抗体文库的特性。

图23示出了在VH-CDR1(CDR-H1)和VH-CDR2(CDR-H2)区中观察与预计的配对突变频率。

图24示出了IGHV3-23的位置偏置。

图25示出了双生子的频率。

图26描绘了14个人类群体中的IGHV1-3等位基因频率变异。

图27示出,少于10,000个克隆占来自人血的外周样品的克隆总量的主导。

图28示出了表达与gIII外壳蛋白融合的本文所述抗体的噬菌粒载体。

图29描绘了生成本文所述的抗体文库的方法的非限制性实例。

图30描绘了本文所述的抗体文库的非限制性实例。

图31A和图31B描绘了在本公开内容的抗体文库中筛选在各种特性方面具有改善的抗体的方法的非限制性实例。

图32描绘了生成如本文所述的抗体文库以及从中选择一种或多种期望的抗体的方法的非限制性示例性工作流程。

图33描绘了生成本文所述的抗体文库的方法的非限制性实例。

图34描绘了在本公开内容的抗体文库中筛选在各种特性方面具有改善的抗体的方法的非限制性实例。

图35描绘了在本公开内容的抗体文库中筛选在各种特性方面具有改善的抗体的方法的非限制性实例。

具体实施方式

抗体文库的理想特性可以是高度的功能多样性。功能多样性不仅可以确保有大量抗体可用于测试目的,而且可以确保这种多样性与功能相关,从而提高了这些文库在治疗、诊断和研究用途中的效用。通过以非天然存在的组合使用天然存在的互补决定区(CDR),诸如混合来自记忆细胞和初始细胞的CDR,这增加了可能的CDR组合的数目,可以实现文库多样性的增加。通过在抗体文库制备过程中选择功能性(例如,与蛋白质结合的能力),可以进一步实现这种多样性的功能性的增加。

在某些情况下,本文公开了具有独特性质的抗体、包含高度功能多样性的抗体文库以及制备所述抗体和所述抗体文库的方法。

抗体

抗体可以在体内由B细胞合成。由B细胞合成的抗体同种型包括但不限于IgA、IgD、IgE、IgG和IgM。尚未遇到抗原的B细胞可以被称为初始B细胞,而已经遇到抗原并被抗原激活的B细胞可以被称为记忆B细胞。初始B细胞可以表达IgM、IgD或其组合。记忆B细胞可以表达IgE、IgA、IgG、IgM或其组合。IgA可以是IgA1或IgA2。IgG可以是IgG1、IgG2、IgG3或IgG4。记忆B细胞可以是类别转换记忆B细胞或者非转换或边缘区记忆B细胞。非转换或边缘区记忆B细胞可以表达IgM。

互补决定区(“CDR”)是免疫球蛋白(抗体)可变区的一部分,其可负责抗体的抗原结合特异性。重链(HC)可变区可包含三个CDR区,缩写为VH-CDR1、VH-CDR2和VH-CDR3,并按此顺序存在于从N末端到C末端的重链上;并且轻链(LC)可变区可包含三个CDR区,缩写为VL-CDR1、VL-CDR2和VL-CDR3,并按此顺序存在于从N末端到C末端的轻链上。此外,轻链可以是κ链(VK)或λ链(Vλ)。在CDR之间围绕和散布的是框架区,其可以贡献于结构并且可以显示比CDR区域小的变异性。

重链可变区可包含四个框架区,缩写为VH-FR1、VH-FR2、VH-FR3和VH-FR4。重链从N末端到C末端可以包含:VH-FR1::VH-CDR1::VH-FR2::VH-CDR2::VH-FR3::VH-CDR3::VH-FR4。轻链可变区可包含四个框架区,缩写为VL-FR1、VL-FR2、VL-FR3和VL-FR4。轻链从N末端到C末端可以包含:VL-FR1::VL-CDR1::VL-FR2::VL-CDR2::VL-FR3::VL-CDR3::VL-FR4。在一些情况下,本文所用的“CDR序列”是指选自以下的CDR序列:VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1、VL-CDR2、VL-CDR3及其任何组合。

根本上多样的抗体文库

本文所述的抗体文库可包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(a)VH-CDR3序列和VL-CDR3序列中的至少一个源自初始B细胞;(b)如果VH-CDR3和VL-CDR3中仅有一个源自初始B细胞,则并非源自初始B细胞的VH-CDR3或VL-CDR3源自记忆细胞;以及(c)VH-CDR1序列、VH-CDR2序列、VL-CDR1序列和VL-CDR2序列源自记忆细胞。抗体文库在本文中也可以称为SuperHuman文库。

在一些情况下,抗体文库中的多种抗体具有高度的功能多样性。具有高度功能多样性的抗体文库可包含多种抗体,其中多种抗体中的至少80%、85%、90%、95%或99%是功能性的。功能性抗体可以是具有与蛋白质结合的能力的抗体。可以通过针对蛋白A或蛋白L筛选抗体来确定抗体与蛋白质结合的能力。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少80%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少85%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少90%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少95%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少99%是功能性的。

抗体文库可以包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

文库的抗体可以包含天然存在的CDR的非天然存在的组合,诸如源自天然存在的但是在同一抗体上的联合出现并非天然存在的记忆B细胞和初始B细胞的CDR的组合。例如,天然存在的CDR的非天然存在的组合可以包含至少一个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,天然存在的CDR的非天然存在的组合可包含至少一个源自主要是初始B细胞来源的细胞的CDR,而其余的CDR可源自主要是记忆B细胞来源的细胞。天然存在的CDR可以指在人类群体中天然存在的CDR。

天然存在的CDR的非天然存在的组合可包含至少一个源自初始细胞的CDR,而其余的CDR则源自记忆细胞。在一些情况下,至少VL-CDR1源自初始细胞。在一些情况下,至少VL-CDR2源自初始细胞。在一些情况下,至少VL-CDR3源自初始细胞。在一些情况下,至少VH-CDR1源自初始细胞。在一些情况下,至少VH-CDR2源自初始细胞。在一些情况下,至少VH-CDR3源自初始细胞。

天然存在的CDR的非天然存在的组合可以包含两个、三个、四个或五个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,来自下组中的CDR的两个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的三个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的四个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的五个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。

在非天然存在的组合的另一个非限制性实例中,VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1和VL-CDR2可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3和VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1和VL-CDR2可源自记忆细胞。

抗体序列、抗体的可变重链序列或抗体的可变轻链序列中的氨基酸残基可以根据它们的Kabat位置来指代。如本文所用,“Kabat位置”可指代在Kabat等人,1991,Sequencesof Proteins of Immunological Interest,第5版,US Department of Health and HumanServices,NIH,USA中描述的编号系统。在一些情况下,本文所述的抗体在Kabat位置H93、Kabat位置H94或其组合处包含变异。在一些情况下,抗体文库中的至少一种抗体在Kabat位置H93、Kabat位置H94或其组合处包含变异。在一些情况下,抗体文库中至少5%、10%、15%、20%、25%、30%、35%、40%、45%或50%的抗体在Kabat位置H93、Kabat位置H94或其组合处包含变异。变异可以是突变、插入或缺失。

当关于序列使用时,“源自”可以指与天然存在的CDR序列具有至少80%、至少85%、至少90%、至少95%、至少99%或100%的序列同源性的任何CDR序列。“源自”可以指从测序信息获得的任何CDR序列,所述测序信息从主要是初始B细胞来源的细胞池或主要是记忆B细胞来源的细胞池获得。例如,如果(1)在细胞中观察到序列,且(2)根据观察到的序列,化学合成相同的序列(或与该序列具有至少80%、至少85%、至少90%、至少95%、至少99%或至少100%的序列同源性的序列),则该序列“源自”该细胞。

源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR2序列可以是合成的VL-CDR2序列。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR3序列可以是合成的VL-CDR3序列。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。初始B细胞池可以从多个个体获得。初始B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非初始B细胞来源的细胞。

源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。记忆B细胞池可以从多个个体获得。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非记忆B细胞来源的细胞。记忆B细胞可以是CD27+B细胞。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非CD27+B细胞来源的细胞。

序列同源性百分比可以通过以下来计算:确定两个序列中出现相同核酸碱基的位置的数目以产生匹配位置的数目,用匹配位置的数目除以位置的总数目,所述位置可以包括添加或缺失,然后将结果乘以100,以得到序列同源性百分比。序列同源性百分比,也称为序列同一性百分比,可以通过在任何合适的序列比对程序(诸如Clustal Omega、通过对数期望的多序列比较(MUSCLE)、使用快速傅里叶变换的多重比对(MAFFT)、MegAlign和基本局部比对搜索工具(BLAST))中比对每个序列来确定。

初始细胞可以是初始B细胞。初始B细胞可以是人类初始B细胞。记忆细胞可以是记忆B细胞。记忆B细胞可以是人类记忆B细胞。在一些情况下,与来自记忆B细胞的VH-CDR3和VL-CDR3序列相比,初始B细胞显示出增加的VH-CDR3和VL-CDR3序列的多样性(图1)。初始细胞和记忆细胞可以获自来自个体或多个个体的生物样品,诸如血液。可以使用对初始细胞或记忆细胞具有特异性的标志物将初始细胞和记忆细胞从该样品物理分离。

可以使用标志物从生物样品识别、分离或分选B细胞、初始B细胞和记忆B细胞。用于识别、分离或分选B细胞的标志物的实例包括但不限于CD19+。用于识别、分离或分选初始B细胞的标志物的实例包括但不限于CD19+、CD27-、IgD+、IgM+及其组合。用于识别、分离或分选记忆B细胞的标志物的实例包括但不限于CD19+、CD27+及其组合。在一些实施方案中,使用CD27+对记忆B细胞进行分选。用于识别、分离或分选类别转换记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、CD27+、IgD-、IgM-及其组合。用于识别、分离或分选非转换或边缘区记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、IgD+、IgM+及其组合。在一些情况下,可以用以下标志物识别、分离或分选记忆B细胞:CD19+、CD27+、IgD-、IgM+及其组合。VH-CDR3所源自的初始细胞可以是CD27-/IgM+B细胞。VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3所源自的记忆细胞可以是CD27+/IgG+B细胞。

抗体的CDR序列可以是在单个或多个个体中发现的初始B细胞和记忆B细胞中发现的CDR序列。个体可以是哺乳动物。哺乳动物可以是人类、非人类灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。在一些情况下,CDR序列是从可公开获得的来源获得的CDR序列。可公开获得的CDR序列的来源的实例包括SAbDab(http://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/Welcome.php)和PylgClassify(http://dunbrack2.fccc.edu/PyIgClassify/)。

种系抗体序列可包含种系框架和种系CDR序列。与相应的种系CDR区相比,在抗体文库中发现的抗体中的每个CDR可包含至少1、2、3或4个突变。与相应的框架CDR区相比,抗体文库中的抗体中的每个CDR可包含不超过4个突变。

抗体的框架可以是天然存在的框架。天然存在的框架可以是在哺乳动物中发现的框架。哺乳动物可以是灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。灵长类动物可以是人类。与天然存在的框架相比,该框架可以包含至少一种变体。变体可以是突变、插入或缺失。变体可以是在编码抗体的核酸序列中发现的变体或在抗体的氨基酸序列中发现的变体。可以使用任何合适的框架序列,诸如先前在I期临床试验中使用的那些(图12A、图12B)。如本文所用,抗体的框架可以指可变重链的框架区(VH-FR1、VH-FR2、VH-FR3和VH-FR4)、可变轻链的框架区(VL-FR1、VL-FR2、VL-FR3和VL-FR4)或其组合。抗体文库中抗体的框架区可以与种系框架区相同。

该框架可以是治疗上最佳的框架。治疗上最佳的框架可包括选自下组的以下性质中的至少一种、至少两种、至少三种、至少四种、至少五种、至少六种或所有:a)先前在人类单克隆抗体中证明的安全性,b)热稳定的;c)不易于聚集;d)在整个人类群体中,在氨基酸水平上包含单个显性等位基因;e)包含CDR的不同典型拓扑;f)在细菌中表达良好;以及g)在噬菌体上展示良好。具有先前在人类单克隆抗体中证明的安全性的框架可以是在至少I期临床试验中已经使用的抗体的框架。热稳定的框架可以是在至少20℃、30℃、40℃、50℃、60℃、70℃、80℃、90℃、100℃或高于100℃下稳定的框架。热稳定的框架可以是能够承受至少每分钟3℃、每分钟4℃或每分钟5℃的温度升高的框架。在细菌中表达良好的框架可以是在细菌中产生生物活性抗体的框架。该细菌可以是大肠杆菌(E.coli)。该细菌可以是工程菌。该细菌可以是对抗体表达进行优化的细菌。在噬菌体上展示良好的框架可以是当在噬菌体表面上展示时产生生物活性抗体的框架。

用于选择框架的策略的实例描述于图11中,其中抗体的理想框架可以是显示结构多样性的抗体,其已经在人类的I期临床试验中成功使用、具有低的免疫原性、显示出聚集抗性、显示出适应性,并且是热稳定的。在一些情况下,如果抗体框架对血细胞具有固有的自体反应(例如,IGHV4-34)、具有较差的稳定性特征(例如,IGHV2-5)、具有在至少50%的个体中没有被发现的V基因(例如,IGHV4-b)、显示倾向于聚集的V基因(例如,IGLV6-57)或其组合,则避免该抗体框架。

本文的抗体框架的氨基酸序列可以包含一个以上的显性等位基因,其中在不同的人类群体中存在不同的显性等位基因(图13和图14)。例如,IGHV1-3框架包含3个等位基因:IGVH1-3*01、IGVH1-3*02和IGVH1-3*03,其在不同人类群体中以不同的频率被发现(图26)。在一些情况下,本文所述的抗体框架的氨基酸序列在至少两个人类群体中具有单个显性等位基因。在一些情况下,本文所述的抗体框架的氨基酸序列在所有人类群体中具有单个显性等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少两个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少十二个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。在一些情况下,VH结构域的框架区是来自IGHJ4、IGHV1-46、IGHV1-69、IGHV3-15或IGHV3-23的框架区。在一些情况下,VH结构域的框架区是来自IGHV2-5、IGHV3-7、IGVH4-34、IGHV5-51、IGHV1-24、IGHV2-26、IGHV3-72、IGHV3-74、IGHV3-9、IGHV3-30、IGHV3-33、IGHV3-53、IGHV3-66、IGHV4-30-4、IGHV4-31、IGHV4-59、IGHV4-61或IGHV5-51的框架区。在一些情况下,抗体文库中抗体的VH结构域的框架区是来自IGHV1-46、IGHV3-23或其组合的框架区。在一些情况下,抗体文库中抗体的VL结构域的框架区是来自IGKV1-39、IGKV2-28、IGKV3-15、IGKV4-1、IGKV1-5、IGKV1-12、IGKV1-13、IGKV3-11、IGKV3-20或其组合的框架区。在一个实例中,抗体文库中的抗体子集可具有来自IGHV1-46的VH结构域的框架区和来自IGKV1-39的VL结构域的框架区,而抗体文库中的其余抗体具有来自IGHV1-46的VH结构域的框架区和来自IGKV2-28的VL结构域的框架区。

在一些情况下,本文公开了编码本文所述的抗体的核酸序列。核酸序列可以是DNA或RNA序列。可以将核酸插入载体中。载体可以是噬菌体。噬菌体可以是噬菌粒或细菌噬菌体。噬菌粒可以是pMID21。细菌噬菌体可以是DY3F63、M13噬菌体、fd丝状噬菌体、T4噬菌体、T7噬菌体或λ噬菌体。在一些情况下,可以将噬菌粒与细菌噬菌体(即“辅助”噬菌体)组合引入微生物中。微生物可以是丝状细菌。丝状细菌可以是大肠杆菌。

本文所述的抗体文库包含多种抗体。多种抗体可以是至少1.0×10

在人体中天然发现的抗体(例如,来自初始细胞和记忆细胞抗体)以及通过其他文库制备方法产生的抗体文库的总量可以包含高度冗余的重链序列(图18)。如果文库中抗体的一个重链序列与不同抗体的另一个重链序列冗余,则可以表明该重链序列是相同的。具有冗余重链序列的两种或更多种抗体可以包含不同的抗体框架区、不同的轻链序列或其组合。通过本文所述的方法产生的抗体文库可以显示减少的重链冗余。重链冗余的减少可以增加抗体文库的多样性。冗余度可以通过排名靠前的克隆(top clone)所占文库的百分比来衡量。本文产生的抗体文库可具有约2%、约3%、约4%或约5%的冗余度(图18)。在一些情况下,由于天然存在的CDR的组合的限制,传统天然文库的重链的最大数目限于1.0×10

在一些情况下,抗体文库是如图21中所描述的抗体文库。在一些情况下,抗体文库是如图22中所描述的抗体文库。

生成多样的抗体文库的方法

在某些情况下,本文描述了制备包含多种抗体的抗体文库的方法,其中所述多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(a)VH-CDR3序列和VL-CDR3序列中的至少一个源自初始B细胞;(b)未源自初始B细胞的VH-CDR3序列或VL-CDR3序列源自记忆B细胞;并且(c)VH-CDR1序列、VH-CDR2序列、VL-CDR1序列和VL-CDR2序列源自记忆细胞。

在一些情况下,本文所述的方法产生具有高度功能多样性的抗体文库。具有高度功能多样性的抗体文库可包含多种抗体,其中多种抗体中的至少80%、85%、90%、95%或99%是功能性的。功能性抗体可以是具有与蛋白质结合的能力的抗体。可以通过针对蛋白A或蛋白L筛选抗体来确定抗体与蛋白质结合的能力。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少90%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少95%是功能性的。具有高度功能多样性的抗体文库可以包含多种抗体,其中多种抗体中的至少99%是功能性的。

抗体文库可以包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

用于制备抗体文库的方法可包括:(a)从初始B细胞池获得多个VH-CDR3和VL-CDR3序列的序列信息以及从记忆B细胞池获得多个VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1、VL-CDR2和VL-CDR3序列的序列信息;(b)组装多个可变轻(VL)结构域序列,每个VL结构域序列包括:从步骤a中确定的来自记忆B细胞的序列信息获得的VL-CDR1序列,从步骤a中确定的来自记忆B细胞的序列信息获得的VL-CDR2序列,以及从步骤a中确定的来自记忆B细胞或初始B细胞的序列信息获得的VL-CDR3序列;(c)组装编码多个第一抗体的多个第一核酸序列,每个第一抗体包括:(i)在步骤b中组装的可变轻(VL)结构域序列;和(ii)单个固定的重链序列;(d)将多个第一核酸序列插入多个噬菌体中;(e)在多个噬菌体的表面上表达多个第一抗体;(f)对多个噬菌体施加至少一种选择压力以产生包含第一核酸序列的子集的噬菌体的子集;(g)组装多个可变重(VH)结构域序列,每个VH结构域序列包括:从步骤a中确定的来自记忆B细胞的序列信息获得的VH-CDR1序列,从步骤a中确定的来自记忆B细胞的序列信息获得的VH-CDR2序列,以及从步骤a中确定的来自记忆B细胞或初始B细胞的序列信息获得的VH-CDR3序列,其中VH-CDR3序列和VL-CDR3序列中的至少一种源自来自初始B细胞的序列信息;(h)用在步骤g中组装的多个VH结构域序列替换来自第一核酸序列子集的单个固定的重链序列,以产生多个第二核酸序列,每个第二核酸序列包括:(i)在步骤b中组装的可变轻(VL)结构域序列,和(ii)在步骤g中组装的可变重(VH)结构域序列,其中多个第二核酸序列编码多个第二抗体;以及(i)用多个噬菌体转化多种微生物以产生多个转化体。

所述方法可以包括从多个个体获得包含初始B细胞和记忆B细胞的样品。样品可以是血液、血浆或血清。人血的外周样品可包含数十万个记忆克隆和成浆细胞,其中少于10,000个的集合占样品的主导(图27)。多个个体可以是多个哺乳动物。多个哺乳动物可以是多个灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。多个哺乳动物可以是多个人类。多个个体可以是至少25、50、75、100、125或150个个体。多个个体可以是50-100个个体。多个个体可以是50-140个个体。多个个体可以是至少50个个体。多个个体可以是至少140个个体。包含来自个体的初始B细胞和记忆B细胞的样品可包含至少约5×10

所述方法可以包括在获得序列信息之前,将样品中的初始B细胞与记忆B细胞分选或分离。记忆B细胞可以是CD27+B细胞。因此,序列信息可以包括针对初始B细胞和记忆B细胞的单独的序列信息。对初始B细胞和记忆B细胞进行分选可以包括使用流式细胞术。在一些情况下,流式细胞术是荧光激活细胞分选术(FACS)。对初始B细胞和记忆B细胞进行分选可以包括基于初始B细胞或记忆B细胞表面上存在的标志物的免疫磁化细胞分离程序。对来自样品的初始B细胞和记忆B细胞进行分选可以产生初始B细胞池和记忆B细胞池。对来自样品的初始B细胞和记忆B细胞进行分选可以产生多个初始B细胞池和多个记忆B细胞池。初始B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非初始B细胞来源的细胞。包含少于0.1%、1%、5%、10%、20%或30%的并非初始B细胞来源的初始B细胞池在本文也可称为主要是初始B细胞来源的池。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非记忆B细胞来源的细胞。包含少于0.1%、1%、5%、10%、20%或30%的并非记忆B细胞来源的细胞的记忆B细胞池在本文也可称为主要是记忆B细胞来源的池。

在一些情况下,将使用下一代测序(NGS)检查记忆B细胞池或初始B细胞池的质量。可以舍弃具有问题性的多样性或生化倾向(biochemical liability)的池。生化倾向的实例包括但不限于N联糖基化、脱氨基、酸水解、正电荷内肽切割、游离半胱氨酸、游离甲硫氨酸、替代终止密码子、隐蔽剪接位点、tev切割位点和过度带正电荷的CDR。在一些情况下,从池去除来自至少一个个体的序列数据。如果序列数据具有问题性的多样性或生化倾向,则可以从池去除来自个体的序列数据。

所述方法可以包括从初始B细胞提取核酸和从记忆B细胞提取核酸。在从样品中分离或隔离初始细胞和记忆细胞后,可以从每个初始细胞和记忆细胞提取核酸。核酸可以是DNA或信使RNA(mRNA)。如果核酸是mRNA,则所述方法可以进一步包括将mRNA逆转录为互补DNA(cDNA)。

制备抗体文库的方法可以包括从来自多个个体的初始B细胞获得多个VH-CDR3和VL-CDR3序列的序列信息以及从来自多个个体的记忆B细胞获得多个VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1、VL-CDR2和VL-CDR3序列的序列信息。来自初始B细胞的序列信息可以从初始B细胞池获得。来自记忆B细胞的序列信息可以从记忆B细胞池获得。获得CDR序列的序列信息可以包括对CDR序列进行测序。对多个CDR序列进行测序可以包括任何合适的测序技术,例如下一代测序(NGS)或Sanger测序。下一代测序的实例包括但不限于焦磷酸测序、合成法测序、连接法测序和单分子测序。对多个CDR序列进行测序可以产生序列信息。

对多个VH-CDR和VL-CDR序列进行测序可以包括对从来自样品的初始B细胞提取的核酸和从来自样品的记忆B细胞提取的核酸分别进行测序。

组装或合成VH序列或VL序列可包括使用重叠延伸PCR(OE-PCR)。在一些情况下,生成包含VH结构域的CDR或VL结构域的CDR的一部分的重叠片段。包含VH结构域的CDR或VL结构域的CDR的一部分的多个重叠片段可以覆盖VH结构域序列的CDR或VL结构域序列的CDR的全部。重叠片段可以是dsDNA片段。OE-PCR可包括重叠片段的组装以产生全部的VH结构域的CDR或VL结构域的CDR。VH结构域的CDR可以是VH-CDR1、VH-CDR2、VH-CDR3或其组合。VL结构域的CDR可以是VL-CDR1、VL-CDR2、VL-CDR3或其组合。可以合成VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2、VL-CDR3或其组合以包含以下特性中的至少一种:(a)为源自人种系序列的CDR序列,(b)与种系序列相比,含有不超过4个氨基酸突变,(c)为:(i)识别为在至少2个个体中天然存在并在没有适应性劣势的情况下富集或(ii)在淘选的过程中大量富集;(d)不包含任何生化倾向;或者(e)其组合。种系序列可以是IGHJ4、IGHV1-69、IGHV1-46、IGHV3-23、IGKV1-39、IGKV2-28、IGKV3-15或IGKV4-1,或其组合。

可以将使用OE-PCR组装的VH序列、VL序列或其组合克隆到载体中。载体可以是噬菌体。噬菌体可以是细菌噬菌体或噬菌粒。载体可以是HuCAL噬菌体。载体可以进一步包含编码表面外壳蛋白的基因。表面外壳蛋白可以是pIII、pVIII、pVI、pVII、pIX或gIII蛋白。表面外壳蛋白可以是gIII蛋白。在一些情况下,由载体编码的抗体的表达包括与载体的表面外壳蛋白融合的抗体的表达。表达的抗体可以展示在载体表面上。

制备抗体文库的方法可以包括组装多个VL结构域序列,所述多个VL结构域序列中的每个VL结构域序列包含:源自来自记忆B细胞的序列信息的VL-CDR1序列、源自来自记忆B细胞的序列信息的VL-CDR2序列以及源自来自记忆B细胞或初始B细胞的序列信息的VL-CDR3序列。VL结构域序列可以与单个固定的重链序列组合地克隆到载体中。单个固定的重链序列可以是IGHV3-23或IGHJ4。单个固定的重链序列可以被称为填充序列。

制备抗体文库的方法可包括组装编码多个第一抗体的多个第一核酸序列,多个第一抗体中的每个第一抗体包含:可变轻(VL)结构域序列;和单个固定的重链序列。制备抗体文库的方法可以包括将多个第一核酸序列插入多个载体中。载体可以是噬菌体。由包含组装的VL结构域和单个固定的重链序列的载体编码的抗体可以在载体中表达。抗体可以在载体表面上表达。

制备抗体文库的方法可以包括向多个载体施加至少一种选择压力,其中多个载体中的每个载体表达抗体。在施加选择压力之后,可以产生能够承受选择压力的噬菌体的子集。选择压力可以是施加热应力、用蛋白A选择、用蛋白L选择或其组合。热应力可以是约65℃的温度。热应力可以是至少30℃、40℃、50℃、60℃、70℃或80℃的温度。在一些情况下,如果载体不稳定或易于聚集,则对载体施加热应力排除该载体。在一些情况下,如果载体表达不具有与蛋白质结合的能力的抗体,则施加用蛋白A或蛋白L的选择排除该载体。施加用蛋白A或蛋白L的选择可以允许选择与蛋白质结合的抗体。与蛋白质结合的抗体可以是热稳定的。在一些情况下,在选择与蛋白质结合的抗体之后,可以确定对应于与蛋白质结合的抗体的核苷酸序列。

制备抗体文库的方法可以包括组装多个VH结构域序列,其中每个VH结构域序列包括:源自来自记忆B细胞的序列信息的VH-CDR1序列、源自来自记忆B细胞的序列信息的VH-CDR2序列以及源自来自记忆B细胞或初始B细胞的序列信息的VH-CDR3序列。VH-CDR1序列和VH-CDR2序列可以是从记忆B细胞获得的序列,而VH-CDR3序列可以是来自初始B细胞的序列。如果载体能够成功地承受所施加的选择压力,则可以用组装的VH结构域序列替换单个固定的重链序列。对于多种抗体中的每一种抗体,VH-CDR3序列和VL-CDR3序列中的至少一个可以源自来自初始B细胞的序列信息。

可以将包含组装的VL结构域和组装的VH结构域的载体转化到微生物中。微生物可以是细菌。细菌可以是丝状细菌。丝状细菌可以是大肠杆菌。微生物可以是任何合适的市售可得的菌株。

可以使用电穿孔、化学转化、热休克转化或其组合将载体转化到微生物中。

电穿孔可以包括对包含待转化的微生物和载体的连接混合物施加高压电场。高压的范围可以为1至25kV/cm。高压的范围可以为3至24kV/cm。可以施加给微生物以诱导转化的高压的实例包括但不限于10kV/cm、15kV/cm、20kV/cm和25kV/cm。高压可以作为一个脉冲或多个脉冲来施加。多个脉冲可以是每1、2、3、4、5、6、7、8、9、10、100、500或1000微秒(μs)施加的高压脉冲。多个脉冲可以是每10、20、30、30、50、60、70、80、90或100毫秒(msec)施加的高压脉冲。可以在室温或4℃下对微生物施用电穿孔。

在添加至连接混合物之前,可以将载体纯化并重悬于水或TE中。连接混合物可包含缓冲液。缓冲液的实例包括但不限于磷酸盐缓冲盐水(PBS)、hepes缓冲液(HBSS)或培养基。缓冲液可以是低渗缓冲液。缓冲液可以是高阻缓冲液。在一些情况下,在电穿孔后,将恢复培养基添加到连接混合物。

化学转化可包括将微生物和载体与阳离子一起温育。阳离子可以是Mg2+、Mn2+、Rb+或Ca2+。化学转化可包括将微生物和载体与CaCl

热休克转化可以包括对微生物和载体施加高温以诱导转化。高温可以是42℃。可以将温度施加10秒、20秒、30秒、40秒、50秒或1分钟。可以在电穿孔或化学转化之前、期间或之后施加热休克。

载体可以包含选择标记。选择标记可以是抗生素抗性基因或光学选择标记,诸如绿色荧光蛋白。抗生素抗性基因可赋予经载体转化的微生物对选自以下的抗体的抗性:卡那霉素、壮观霉素、链霉素、氨卡青霉素、羧苄青霉素、博来霉素、红霉素(erthyromycin)、多粘菌素(polymxin)B、四环素、氯霉素及其组合。选择标记可以允许排除未被载体转化的微生物。

用载体转化的微生物可以称为转化体。生成多种抗体可以包括多个转化体的生成。在一些情况下,多个转化体包括至少7.6×10

抗体优化和所得文库(Tumbler文库)

在一些方面,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)CDR序列选自以下:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列,其中多种抗体中每种抗体的CDR序列相同;并且(d)其余的CDR序列的独特组合选自以下:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3。抗体文库在本文也可以称为Tumbler文库。

在一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR1序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR1序列源自初始抗体克隆。

在另一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR2序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR2序列源自初始抗体克隆。

在另一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR3序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR3序列源自初始抗体克隆。

在另一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR1序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR2序列和VL-CDR3序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR1序列源自初始抗体克隆。

在另一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR2序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列和VL-CDR3序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR2序列源自初始抗体克隆。

在另一个实例中,本文所述的抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR3序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列和VL-CDR2序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR3序列源自初始抗体克隆。

在各个方面,抗体文库中的每种抗体包含选自初始抗体克隆的VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列,VL-CDR2序列或VL-CDR3序列。如本文所用,术语“初始抗体克隆”可以指具有期望性质的任何抗体或抗体片段,该性质诸如对期望表位、所述抗体或抗体片段的氨基酸序列、编码所述抗体或抗体片段的核苷酸序列或者与所述抗体或抗体片段相对应的任何计算机模拟的氨基酸或核苷酸序列的亲和力。在各个方面,抗体文库中的每种抗体可以包含源自初始抗体克隆的相同CDR序列。另外,抗体文库中的每种抗体可以包含并非源自初始抗体克隆的其余CDR序列的不同组合。在一些情况下,其余的CDR序列可以源自高度多样的抗体文库(例如,如本文所述的SuperHuman抗体文库)。在一些情况下,CDR中的一个可以源自初始抗体克隆,而其余的CDR可以源自高度多样的抗体文库(例如,SuperHuman抗体文库)。在一些情况下,高度多样的抗体文库可能在并非源自初始抗体克隆的每个CDR序列中具有高度多样性。在非限制性实例中,如图29所描绘的,抗体文库中的每种抗体可以包含源自初始抗体克隆(图29中的“初始克隆”)的相同VH-CDR3序列。另外,抗体文库中的每种抗体可以包含并非源自初始抗体克隆的其余CDR序列(在此实例中为VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3)的不同组合。

在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的一个或多个是天然存在的。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的每一个都是天然存在的,但是以非天然存在的组合的方式存在于每种抗体中。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的一个或多个天然存在于人类群体中或源自人CDR序列。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的每一个均天然存在于人类群体中,或源自人CDR序列。

在各个方面,文库的抗体可包含天然存在的CDR的非天然存在的组合,诸如源自天然存在的但是在同一抗体上的联合出现并非天然存在的记忆B细胞和初始B细胞的CDR的组合。例如,天然存在的CDR的非天然存在的组合可以包含至少一个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,天然存在的CDR的非天然存在的组合可包含至少一个源自主要是初始B细胞来源的细胞的CDR,而其余的CDR可源自主要是记忆B细胞来源的细胞。

天然存在的CDR的非天然存在的组合可包含至少一个源自初始细胞的CDR,而其余的CDR则源自记忆细胞。在一些情况下,至少VL-CDR1源自初始细胞。在一些情况下,至少VL-CDR2源自初始细胞。在一些情况下,至少VL-CDR3源自初始细胞。在一些情况下,至少VH-CDR1源自初始细胞。在一些情况下,至少VH-CDR2源自初始细胞。在一些情况下,至少VH-CDR3源自初始细胞。

天然存在的CDR的非天然存在的组合可以包含两个、三个、四个或五个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,来自下组中的CDR的两个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的三个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的四个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的五个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。

在非天然存在的组合的另一个非限制性实例中,VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1和VL-CDR2可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3和VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1和VL-CDR2可源自记忆细胞。

源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR2序列可以是合成的VL-CDR2序列。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR3序列可以是合成的VL-CDR3序列。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。初始B细胞池可以从多个个体获得。初始B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非初始B细胞来源的细胞。

源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。记忆B细胞池可以从多个个体获得。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非记忆B细胞来源的细胞。记忆B细胞可以是CD27+B细胞。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非CD27+B细胞来源的细胞。

初始细胞可以是初始B细胞。初始B细胞可以是人类初始B细胞。记忆细胞可以是记忆B细胞。记忆B细胞可以是人类记忆B细胞。在一些情况下,与来自记忆B细胞的VH-CDR3和VL-CDR3序列相比,初始B细胞显示出增加的VH-CDR3和VL-CDR3序列的多样性(图1)。初始细胞和记忆细胞可以获自来自个体或多个个体的生物样品,诸如血液。可以使用对初始细胞或记忆细胞具有特异性的标志物将初始细胞和记忆细胞从该样品物理分离。

可以使用标志物从生物样品识别、分离或分选B细胞、初始B细胞和记忆B细胞。用于识别、分离或分选B细胞的标志物的实例包括但不限于CD19+。用于识别、分离或分选初始B细胞的标志物的实例包括但不限于CD19+、CD27-、IgD+、IgM+及其组合。用于识别、分离或分选记忆B细胞的标志物的实例包括但不限于CD19+、CD27+及其组合。在一些实施方案中,CD27+用于对记忆B细胞进行分选。用于识别、分离或分选类别转换记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、CD27+、IgD-、IgM-及其组合。用于识别、分离或分选非转换或边缘区记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、IgD+、IgM+及其组合。在一些情况下,可以用以下标志物识别、分离或分选记忆B细胞:CD19+、CD27+、IgD-、IgM+及其组合。VH-CDR3所源自的初始细胞可以是CD27-/IgM+B细胞。VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3所源自的记忆细胞可以是CD27+/IgG+B细胞。

抗体的CDR序列可以是在单个或多个个体中发现的初始B细胞和记忆B细胞中发现的CDR序列。个体可以是哺乳动物。哺乳动物可以是人类、非人类灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。在一些情况下,CDR序列是从可公开获得的来源获得的CDR序列。可公开获得的CDR序列的来源的实例包括SAbDab(http://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/Welcome.php)和PylgClassify(http://dunbrack2.fccc.edu/PyIgClassify/)。

在各个方面,抗体文库中的每种抗体可以包含相同的支架,例如框架序列的相同组合(参见图30)。在各个方面,抗体文库中的每种抗体的VH结构域包含VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列。在一些情况下,抗体文库中的每种抗体的VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列中的每一种均相同。在一些情况下,VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列中的每一种均源自CDR序列所源自的初始抗体克隆(参见图30)。在一些情况下,VH-FR1序列可以是与初始抗体克隆相同的VH-FR1序列。在一些情况下,VH-FR2序列可以是与初始抗体克隆相同的VH-FR2序列。在一些情况下,VH-FR3序列可以是与初始抗体克隆相同的VH-FR3序列。在一些情况下,VH-FR4序列可以是与初始抗体克隆相同的VH-FR4序列。在各个方面,抗体文库中的每种抗体的VL结构域包含VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列。在一些情况下,抗体文库中的每种抗体的VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列中的每一种均相同。在一些情况下,VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列中的每一种都可以源自CDR序列所源自的初始抗体克隆(参见图30)。在一些情况下,VL-FR1序列可以是与初始抗体克隆相同的VL-FR1序列。在一些情况下,VL-FR2序列可以是与初始抗体克隆相同的VL-FR2序列。在一些情况下,VL-FR3序列可以是与初始抗体克隆相同的VL-FR3序列。在一些情况下,VL-FR4序列可以是与初始抗体克隆相同的VL-FR4序列。

抗体的框架可以是天然存在的框架。天然存在的框架可以是在哺乳动物中发现的框架。哺乳动物可以是灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。灵长类动物可以是人类。与天然存在的框架相比,该框架可以包含至少一种变体。变体可以是突变、插入或缺失。变体可以是在编码抗体的核酸序列中发现的变体或在抗体的氨基酸序列中发现的变体。可以使用任何合适的框架序列,诸如先前在I期临床试验中使用的那些(图12A、图12B)。如本文所用,抗体的框架可以指可变重链的框架区(VH-FR1、VH-FR2、VH-FR3和VH-FR4)、可变轻链的框架区(VL-FR1、VL-FR2、VL-FR3和VL-FR4)或其组合。抗体文库中抗体的框架区可以与种系框架区相同。

该框架可以是治疗上最佳的框架。治疗上最佳的框架可包括选自下组的以下性质中的至少一种、至少两种、至少三种、至少四种、至少五种或所有:a)先前在人类单克隆抗体中证明的安全性,b)热稳定的;c)不易于聚集;d)在整个人类群体中,在氨基酸水平上包含单个显性等位基因;e)包含CDR的不同典型拓扑;f)在细菌中表达良好;以及g)在噬菌体上展示良好。具有先前在人类单克隆抗体中证明的安全性的框架可以是在至少I期临床试验中已经使用的抗体的框架。热稳定的框架可以是在至少20℃、30℃、40℃、50℃、60℃、70℃、80℃、90℃、100℃或高于100℃下稳定的框架。热稳定的框架可以是能够承受至少每分钟3℃、每分钟4℃或每分钟5℃的温度升高的框架。在细菌中表达良好的框架可以是在细菌中产生生物活性抗体的框架。该细菌可以是大肠杆菌。该细菌可以是工程菌。该细菌可以是针对抗体表达进行优化的细菌。在噬菌体上展示良好的框架可以是当在噬菌体表面上展示时产生生物活性抗体的框架。

用于选择框架的策略的实例描述于图11中,其中抗体的理想框架可以是显示结构多样性的抗体,其已经在人类的I期临床试验中成功使用、具有低的免疫原性、显示出聚集抗性、显示出适应性,并且是热稳定的。在一些情况下,如果抗体框架对血细胞具有固有的自体反应(例如,IGHV4-34)、具有较差的稳定性特征(例如,IGHV2-5)、具有在至少50%的个体中没有被发现的V基因(例如,IGHV4-b)、显示倾向于聚集的V基因(例如,IGLV6-57)或其组合,则避免该抗体框架。

本文的抗体框架的氨基酸序列可以包含一个以上的显性等位基因,其中在不同的人类群体中存在不同的显性等位基因(图13和图14)。例如,IGHV1-3框架包含3个等位基因:IGVH1-3*01、IGVH1-3*02和IGVH1-3*03,其在不同人类群体中以不同的频率被发现(图26)。在一些情况下,本文所述的抗体框架的氨基酸序列在至少两个人类群体中具有单个显性等位基因。在一些情况下,本文所述的抗体框架的氨基酸序列在所有人类群体中具有单个显性等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少两个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少十二个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。在一些情况下,VH结构域的框架区是来自IGHJ4、IGHV1-46、IGHV1-69、IGHV3-15或IGHV3-23的框架区。在一些情况下,VH结构域的框架区是来自IGHV2-5、IGHV3-7、IGVH4-34、IGHV5-51、IGHV1-24、IGHV2-26、IGHV3-72、IGHV3-74、IGHV3-9、IGHV3-30、IGHV3-33、IGHV3-53、IGHV3-66、IGHV4-30-4、IGHV4-31、IGHV4-59、IGHV4-61或IGHV5-51的框架区。在一些情况下,抗体文库中抗体的VH结构域的框架区是来自IGHV1-46、IGHV3-23或其组合的框架区。在一些情况下,抗体文库中抗体的VL结构域的框架区是来自IGKV1-39、IGKV2-28、IGKV3-15、IGKV4-1、IGKV1-5、IGKV1-12、IGKV1-13、IGKV3-11、IGKV3-20或其组合的框架区。在一个实例中,抗体文库中的抗体子集可具有来自IGHV1-46的VH结构域的框架区和来自IGKV1-39的VL结构域的框架区,而抗体文库中的其余抗体具有来自IGHV1-46的VH结构域的框架区和来自IGKV2-28的VL结构域的框架区。

在一些情况下,本文公开了编码本文所述的抗体的核酸序列。核酸序列可以是DNA或RNA序列。可以将核酸插入载体中。载体可以是噬菌体。噬菌体可以是噬菌粒或细菌噬菌体。噬菌粒可以是pMID21。细菌噬菌体可以是DY3F63、M13噬菌体、fd丝状噬菌体、T4噬菌体、T7噬菌体或λ噬菌体。在一些情况下,可以将噬菌粒与细菌噬菌体(例如,“辅助”噬菌体)组合引入微生物中。微生物可以是丝状细菌。丝状细菌可以是大肠杆菌。

本文所述的抗体文库包含多种抗体。多种抗体可以是至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在各个方面,抗体文库可以在一个或多个CDR序列中具有高度多样性。在一些情况下,抗体文库可以在VH-CDR1序列中具有高度多样性。在一些情况下,抗体文库可以在VH-CDR2序列中具有高度多样性。在一些情况下,抗体文库可以在VH-CDR3序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR1序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR2序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR3序列中具有高度多样性。在一些情况下,抗体文库可以在并非源自初始抗体克隆的CDR序列中具有高度多样性,而在源自初始抗体克隆的CDR序列中具有低多样性或无多样性。在一些情况下,具有高度多样性的抗体文库可以包含至少1×10

在各个方面,与初始抗体克隆相比,抗体文库中的至少一种抗体可以在至少一种特性方面表现出改善。在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出热稳定性的改善(例如,更高的Tm)。例如,抗体文库中的至少一种抗体可以具有比初始抗体克隆高至少1℃、2℃、3℃、4℃、5℃、6℃、7℃、8℃、9℃、10℃、11℃、12℃、13℃、14℃、15℃、16℃、17℃、18℃、19℃、20℃、21℃、22℃、23℃、24℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃或大于50℃的解链温度(Tm)。在一些情况下,抗体文库中的抗体的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或大于95%可以具有比初始抗体克隆更高的Tm。

在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出对靶标表位更大的亲和力(例如,更低的解离常数(K

在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出增加的物种选择性。例如,抗体文库中的至少一种抗体可以具有比初始抗体克隆的K

在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出增加的物种交叉反应性(例如,跨灵长类动物物种)。例如,抗体文库中的至少一种抗体可以具有对物种A(例如,食蟹猴)的表位A更低的K

在各个方面,抗体文库可以包含与初始抗体克隆相比在多于一种特性方面表现出改善的一种或多种抗体。在一些情况下,该改善选自:改善的热稳定性、改善的对靶标表位的亲和力、改善的对特定物种的靶标表位的选择性以及改善的物种间的交叉反应性。在一些情况下,抗体文库中的抗体的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或大于95%在以下中的两个中表现出改善:热稳定性、对靶标表位的亲和力、对特定物种的靶标表位的选择性或者物种间的交叉反应性。在一些情况下,抗体文库中的抗体的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或大于95%在以下中的三个中表现出改善:热稳定性、对靶标表位的亲和力、对特定物种的靶标表位的选择性或者物种间的交叉反应性。图31A和图31B描绘了选择表现出改善的热稳定性、改善的对来自食蟹猴的表位A的亲和力和改善的对来自人类的表位A的亲和力的抗体克隆的非限制性实例。

在各个方面,抗体文库中的抗体可以表现出热稳定性。在一些情况下,抗体文库中的抗体可以具有在约50℃至约90℃之间的解链温度(Tm)。在一些情况下,抗体文库中的抗体的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或大于95%具有在约50℃至约90℃之间的解链温度(Tm)。例如,抗体文库中的抗体可以具有至少50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃的解链温度(Tm)。

在各个方面,抗体文库中的抗体可以表现出对靶标表位的高亲和力。在一些情况下,抗体文库中的抗体的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少50%、至少55%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或大于95%可以表现出对靶标表位的高亲和力。例如,抗体文库中的抗体可以以小于约50nM、25nM、10nM、5nM、1nM、900pM、800pM、700pM、600pM、500pM、400pM、300pM、200pM、100pM、50pM、25pM、10pM、5pM、1pM、900fM、800fM、700fM、600fM、500fM、400fM、300fM、200fM、100fM、50fM、25fM、10fM、5fM、1fM或更小的解离常数(K

使用Tumbler生成抗体文库的方法

一方面,提供了用于生成抗体文库(诸如上述抗体文库)的方法。在一些情况下,所述方法包括:(a)选择CDR序列,其中所述CDR序列选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列;(b)用(a)中选择的CDR序列替换第一抗体文库中的每种抗体的CDR序列,从而生成包含多种抗体的第二抗体文库,其中多种抗体中的每种抗体包括:(i)在(a)中选择的CDR序列;以及(ii)在(a)中未选择的其余的CDR序列的独特组合,其中所述其余的CDR序列选自:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列。

图32和图33描绘了生成抗体文库并从中获得一种或多种期望的抗体的方法的非限制性示例性工作流程。在一些情况下,获得初始抗体克隆(图32,3201)。在一些情况下,可以从第三方(诸如顾客或客户)获得初始抗体克隆。在其他情况下,可以从高度多样的抗体文库(例如,本文所述的SuperHuman抗体文库)获得初始抗体克隆。在一些情况下,初始抗体克隆可以具有期望的性质,诸如对特定表位的亲和力。在一些情况下,可期望改善初始抗体克隆的一个或多个特性。例如,可期望改善抗体的热稳定性(例如,提高解链温度(Tm))、抗体的结合特性(例如,亲和力)或抗体在两个或更多个物种之间的物种交叉反应性。然后可以将初始抗体克隆用于生成抗体文库(图32,3203)。在一些情况下,可以选择来自初始抗体克隆的CDR序列。CDR序列可以是以下中的任一种:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列或VL-CDR3序列。在特定方面,CDR序列是VH-CDR3序列(参见图33)。通常,选自初始抗体克隆的CDR序列是对于期望的特性重要的CDR序列,诸如对针对靶标表位的结合亲和力重要的CDR序列。在各个方面,可以将选自初始抗体克隆的CDR序列克隆到高度多样的抗体文库中。在一些情况下,高度多样的抗体文库在六个CDR序列中的五个中可以具有高度多样性,而在被替换的一个CDR序列中几乎没有多样性(参见例如,图30和图33)。在一些情况下,高度多样的抗体文库可以是SuperHuman抗体文库或修饰的SuperHuman抗体文库(例如,与SuperHuman抗体文库的支架相同,但是在被替换的CDR序列中没有多样性;参见图33)。在一些情况下,高度多样的抗体文库的每种抗体的CDR序列都可以被选自初始抗体克隆的CDR序列替换,以使得后续抗体文库中的每种抗体具有相同的CDR序列。例如,可以将来自初始抗体克隆的VH-CDR3序列克隆到高度多样的抗体文库中,使得高度多样的抗体文库中的每个VH-CDR3序列被选自初始抗体克隆的相同VH-CDR3序列替代(参见图33)。在这种情况下,其余的CDR序列(在该实例中为VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3)为存在于高度多样的抗体文库中的CDR序列。在一些情况下,可使用将突变引入CDR序列中的方法将CDR序列克隆到高度多样的抗体文库中(例如,以将更多的多样性引入CDR序列中)。在一些实例中,可以通过执行易错的PCR方法来克隆CDR序列,以将一个或多个突变引入CDR序列中。在一些情况下,高度多样的抗体文库中的每种抗体可以具有CDR序列的独特组合。因此,这样的方法可以生成在VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3中具有高度多样性但在VH-CDR3中几乎没有多样性的抗体文库(参见图33)。可以在后续的抗体文库上执行另外的选择和筛选步骤,以选择具有期望的特性的抗体克隆(图32,3205)。最后,可以通过计算方法确定最佳抗体序列(图32,3207)。图34和图35描绘了筛选和选择具有改善的特性的抗体克隆的方法,该特性诸如与初始抗体克隆相比增加的热稳定性、与初始抗体克隆相比增加的对靶标表位的结合亲和力和/或与初始抗体克隆相比增加的物种交叉反应性。

在各个方面,提供了用于生成抗体文库的方法。在一些情况下,抗体文库可以包含多种抗体,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)CDR序列选自以下:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列,其中多种抗体中每种抗体的CDR序列相同;并且(d)其余的CDR序列的独特组合选自以下:VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3。抗体文库在本文也可以称为Tumbler文库。

在一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR1序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR1序列源自初始抗体克隆。

在另一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR2序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR2序列源自初始抗体克隆。

在另一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VH-CDR3序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VH-CDR3序列源自初始抗体克隆。

在另一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR1序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR2序列和VL-CDR3序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR1序列源自初始抗体克隆。

在另一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR2序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列和VL-CDR3序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR2序列源自初始抗体克隆。

在另一个实例中,提供了用于生成包含多种抗体的抗体文库的方法,其中多种抗体中的每种抗体包含:(a)包含VH-CDR1序列、VH-CDR2序列和VH-CDR3序列的VH结构域;以及(b)包含VL-CDR1序列、VL-CDR2序列和VL-CDR3序列的VL结构域;其中(c)VL-CDR3序列对于多种抗体中的每种抗体是相同的;并且(d)VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列和VL-CDR2序列以不同的组合存在于多种抗体中的每种抗体中。在一些情况下,VL-CDR3序列源自初始抗体克隆。

在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的一个或多个是天然存在的。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的每一个都是天然存在的,但是以非天然存在的组合的方式存在于每种抗体中。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的一个或多个天然存在于人类群体中或源自人CDR序列。在各个方面,VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列和VL-CDR3序列中的每一个均天然存在于人类群体中,或源自人CDR序列。

在各个方面,文库的抗体可包含天然存在的CDR的非天然存在的组合,诸如源自天然存在的但是在同一抗体上的联合出现并非天然存在的记忆B细胞和初始B细胞的CDR的组合。例如,天然存在的CDR的非天然存在的组合可以包含至少一个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,天然存在的CDR的非天然存在的组合可包含至少一个源自主要是初始B细胞来源的细胞的CDR,而其余的CDR可源自主要是记忆B细胞来源的细胞。

天然存在的CDR的非天然存在的组合可包含至少一个源自初始细胞的CDR,而其余的CDR则源自记忆细胞。在一些情况下,至少VL-CDR1源自初始细胞。在一些情况下,至少VL-CDR2源自初始细胞。在一些情况下,至少VL-CDR3源自初始细胞。在一些情况下,至少VH-CDR1源自初始细胞。在一些情况下,至少VH-CDR2源自初始细胞。在一些情况下,至少VH-CDR3源自初始细胞。

天然存在的CDR的非天然存在的组合可以包含两个、三个、四个或五个源自初始细胞的CDR,而其余的CDR可以源自记忆细胞。例如,来自下组中的CDR的两个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的三个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的四个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。在另一个实例中,来自下组中的CDR的五个CDR可以源自初始细胞:VL-CDR1、VL-CDR2、VL-CDR3、VH-CDR1、VH-CDR2和VH-CDR3,而其余的CDR可以源自记忆细胞。

在非天然存在的组合的另一个非限制性实例中,VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VH-CDR3、VL-CDR1和VL-CDR2可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3可源自记忆细胞。在非天然存在的组合的另一个非限制性实例中,VH-CDR3和VL-CDR3可源自初始细胞,而VH-CDR1、VH-CDR2、VL-CDR1和VL-CDR2可源自记忆细胞。

源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自初始B细胞的VH-CDR1序列可与来自初始B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自初始B细胞的VH-CDR2序列可与来自初始B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自初始B细胞的VH-CDR3序列可与来自初始B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自初始B细胞的VL-CDR1序列可与来自初始B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR2序列可以是合成的VL-CDR2序列。源自初始B细胞的VL-CDR2序列可与来自初始B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自初始B细胞的VL-CDR3序列可以是合成的VL-CDR3序列。源自初始B细胞的VL-CDR3序列可与来自初始B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是初始B细胞来源的细胞池获得的序列信息。初始B细胞池可以从多个个体获得。初始B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非初始B细胞来源的细胞。

源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR1序列可以是合成的VH-CDR1序列。源自记忆B细胞的VH-CDR1序列可与来自记忆B细胞的天然存在的VH-CDR1序列包含100%的序列同源性。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR2序列可以是合成的VH-CDR2序列。源自记忆B细胞的VH-CDR2序列可与来自记忆B细胞的天然存在的VH-CDR2序列包含100%的序列同源性。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VH-CDR3序列可以是合成的VH-CDR3序列。源自记忆B细胞的VH-CDR3序列可与来自记忆B细胞的天然存在的VH-CDR3序列包含100%的序列同源性。

源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR1序列可以是合成的VL-CDR1序列。源自记忆B细胞的VL-CDR1序列可与来自记忆B细胞的天然存在的VL-CDR1序列包含100%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR2序列可与来自记忆B细胞的天然存在的VL-CDR2序列包含100%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含至少80%、85%、90%、95%或99%的序列同源性。源自记忆B细胞的VL-CDR3序列可与来自记忆B细胞的天然存在的VL-CDR3序列包含100%的序列同源性。

VH-CDR1序列、VH-CDR2序列、VH-CDR3序列、VL-CDR1序列、VL-CDR2序列、VL-CDR3序列或其任何组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。VH-CDR3序列、VL-CDR3序列或其组合可以源自从主要是记忆B细胞来源的细胞池获得的序列信息。记忆B细胞池可以从多个个体获得。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非记忆B细胞来源的细胞。记忆B细胞可以是CD27+B细胞。记忆B细胞池可包含少于0.1%、1%、5%、10%、20%或30%的并非CD27+B细胞来源的细胞。

初始细胞可以是初始B细胞。初始B细胞可以是人类初始B细胞。记忆细胞可以是记忆B细胞。记忆B细胞可以是人类记忆B细胞。在一些情况下,与来自记忆B细胞的VH-CDR3和VL-CDR3序列相比,初始B细胞显示出增加的VH-CDR3和VL-CDR3序列的多样性(图1)。初始细胞和记忆细胞可以获自来自个体或多个个体的生物样品,诸如血液。可以使用对初始细胞或记忆细胞具有特异性的标志物将初始细胞和记忆细胞从该样品物理分离。

可以使用标志物从生物样品识别、分离或分选B细胞、初始B细胞和记忆B细胞。用于识别、分离或分选B细胞的标志物的实例包括但不限于CD19+。用于识别、分离或分选初始B细胞的标志物的实例包括但不限于CD19+、CD27-、IgD+、IgM+及其组合。用于识别、分离或分选记忆B细胞的标志物的实例包括但不限于CD19+、CD27+及其组合。在一些实施方案中,CD27+用于对记忆B细胞进行分选。用于识别、分离或分选类别转换记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、CD27+、IgD-、IgM-及其组合。用于识别、分离或分选非转换或边缘区记忆B细胞的标志物的实例包括但不限于CD19+、CD27+、IgD+、IgM+及其组合。在一些情况下,可以用以下标志物识别、分离或分选记忆B细胞:CD19+、CD27+、IgD-、IgM+及其组合。VH-CDR3所源自的初始细胞可以是CD27-/IgM+B细胞。VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3所源自的记忆细胞可以是CD27+/IgG+B细胞。

抗体的CDR序列可以是在单个或多个个体中发现的初始B细胞和记忆B细胞中发现的CDR序列。个体可以是哺乳动物。哺乳动物可以是人类、非人类灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。在一些情况下,CDR序列是从可公开获得的来源获得的CDR序列。可公开获得的CDR序列的来源的实例包括SAbDab(http://opig.stats.ox.ac.uk/webapps/sabdab-sabpred/Welcome.php)和PylgClassify(http://dunbrack2.fccc.edu/PyIgClassify/)。

在各个方面,抗体文库中的每种抗体可以包含相同的支架,例如框架序列的相同组合(参见图30)。在各个方面,抗体文库中的每种抗体的VH结构域包含VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列。在一些情况下,抗体文库中的每种抗体的VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列中的每一种均相同。在一些情况下,VH-FR1序列、VH-FR2序列、VH-FR3序列和VH-FR4序列中的每一种均源自CDR序列所源自的相同初始抗体克隆(参见图30)。在一些情况下,VH-FR1序列可以是与初始抗体克隆相同的VH-FR1序列。在一些情况下,VH-FR2序列可以是与初始抗体克隆相同的VH-FR2序列。在一些情况下,VH-FR3序列可以是与初始抗体克隆相同的VH-FR3序列。在一些情况下,VH-FR4序列可以是与初始抗体克隆相同的VH-FR4序列。在各个方面,抗体文库中的每种抗体的VL结构域包含VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列。在一些情况下,抗体文库中的每种抗体的VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列中的每一个均相同。在一些情况下,VL-FR1序列、VL-FR2序列、VL-FR3序列和VL-FR4序列中的每一种都可以源自CDR序列所源自的相同初始抗体克隆(参见图30)。在一些情况下,VL-FR1序列可以是与初始抗体克隆相同的VL-FR1序列。在一些情况下,VL-FR2序列可以是与初始抗体克隆相同的VL-FR2序列。在一些情况下,VL-FR3序列可以是与初始抗体克隆相同的VL-FR3序列。在一些情况下,VL-FR4序列可以是与初始抗体克隆相同的VL-FR4序列。

抗体的框架可以是天然存在的框架。天然存在的框架可以是在哺乳动物中发现的框架。哺乳动物可以是灵长类动物、小鼠、大鼠、猪、山羊、兔、马、奶牛、猫或狗。灵长类动物可以是人类。与天然存在的框架相比,该框架可以包含至少一种变体。变体可以是突变、插入或缺失。变体可以是在编码抗体的核酸序列中发现的变体或在抗体的氨基酸序列中发现的变体。可以使用任何合适的框架序列,诸如先前在I期临床试验中使用的那些(图12A、图12B)。如本文所用,抗体的框架可以指可变重链的框架区(VH-FR1、VH-FR2、VH-FR3和VH-FR4)、可变轻链的框架区(VL-FR1、VL-FR2、VL-FR3和VL-FR4)或其组合。抗体文库中抗体的框架区可以与种系框架区相同。

该框架可以是治疗上最佳的框架。治疗上最佳的框架可包括选自下组的以下性质中的至少一种、至少两种、至少三种、至少四种、至少五种或所有:a)先前在人类单克隆抗体中证明的安全性,b)热稳定的;c)不易于聚集;d)在整个人类群体中,在氨基酸水平上包含单个显性等位基因;e)包含CDR的不同典型拓扑;f)在细菌中表达良好;以及g)在噬菌体上展示良好。具有先前在人类单克隆抗体中证明的安全性的框架可以是在至少I期临床试验中已经使用的抗体的框架。热稳定的框架可以是在至少20℃、30℃、40℃、50℃、60℃、70℃、80℃、90℃、100℃或高于100℃下稳定的框架。热稳定的框架可以是能够承受至少每分钟3℃、每分钟4℃或每分钟5℃的温度升高的框架。在细菌中表达良好的框架可以是在细菌中产生生物活性抗体的框架。该细菌可以是大肠杆菌。该细菌可以是工程菌。该细菌可以是针对抗体表达进行优化的细菌。在噬菌体上展示良好的框架可以是当在噬菌体表面上展示时产生生物活性抗体的框架。

用于选择框架的策略的实例描述于图11中,其中抗体的理想框架可以是显示结构多样性的抗体,其已经在人类的I期临床试验中成功使用、具有低的免疫原性、显示出聚集抗性、显示出适应性,并且是热稳定的。在一些情况下,如果抗体框架对血细胞具有固有的自体反应(例如,IGHV4-34)、具有较差的稳定性特征(例如,IGHV2-5)、具有在至少50%的个体中没有被发现的V基因(例如,IGHV4-b)、显示倾向于聚集的V基因(例如,IGLV6-57)或其组合,则避免该抗体框架。

本文的抗体框架的氨基酸序列可以包含一个以上的显性等位基因,其中在不同的人类群体中存在不同的显性等位基因(图13和图14)。例如,IGHV1-3框架包含3个等位基因:IGVH1-3*01、IGVH1-3*02和IGVH1-3*03,其在不同人类群体中以不同的频率被发现(图26)。在一些情况下,本文所述的抗体框架的氨基酸序列在至少两个人类群体中具有单个显性等位基因。在一些情况下,本文所述的抗体框架的氨基酸序列在所有人类群体中具有单个显性等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少两个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。具有一个显性等位基因的框架可以是这样的框架,其中在至少十二个人类群体中的至少50%、至少75%或至少90%中发现一个等位基因。在一些情况下,VH结构域的框架区是来自IGHJ4、IGHV1-46、IGHV1-69、IGHV3-15或IGHV3-23的框架区。在一些情况下,VH结构域的框架区是来自IGHV2-5、IGHV3-7、IGVH4-34、IGHV5-51、IGHV1-24、IGHV2-26、IGHV3-72、IGHV3-74、IGHV3-9、IGHV3-30、IGHV3-33、IGHV3-53、IGHV3-66、IGHV4-30-4、IGHV4-31、IGHV4-59、IGHV4-61或IGHV5-51的框架区。在一些情况下,抗体文库中抗体的VH结构域的框架区是来自IGHV1-46、IGHV3-23或其组合的框架区。在一些情况下,抗体文库中抗体的VL结构域的框架区是来自IGKV1-39、IGKV2-28、IGKV3-15、IGKV4-1、IGKV1-5、IGKV1-12、IGKV1-13、IGKV3-11、IGKV3-20或其组合的框架区。在一个实例中,抗体文库中的抗体子集可具有来自IGHV1-46的VH结构域的框架区和来自IGKV1-39的VL结构域的框架区,而抗体文库中的其余抗体具有来自IGHV1-46的VH结构域的框架区和来自IGKV2-28的VL结构域的框架区。

在一些情况下,本文公开了编码本文所述的抗体的核酸序列。核酸序列可以是DNA或RNA序列。可以将核酸插入载体中。载体可以是噬菌体。噬菌体可以是噬菌粒或细菌噬菌体。噬菌粒可以是pMID21。细菌噬菌体可以是DY3F63、M13噬菌体、fd丝状噬菌体、T4噬菌体、T7噬菌体或λ噬菌体。在一些情况下,可以将噬菌粒与细菌噬菌体(即“辅助”噬菌体)组合引入微生物中。微生物可以是丝状细菌。丝状细菌可以是大肠杆菌。

本文所述的抗体文库包含多种抗体。多种抗体可以是至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在一些情况下,抗体文库包含至少1.0×10

在各个方面,本文提供的方法可以生成在一个或多个CDR序列中具有高度多样性的抗体文库。在一些情况下,抗体文库可以在VH-CDR1序列中具有高度多样性。在一些情况下,抗体文库可以在VH-CDR2序列中具有高度多样性。在一些情况下,抗体文库可以在VH-CDR3序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR1序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR2序列中具有高度多样性。在一些情况下,抗体文库可以在VL-CDR3序列中具有高度多样性。在一些情况下,抗体文库可以在并非源自初始抗体克隆的CDR序列中具有高度多样性,而在源自初始抗体克隆的CDR序列中具有低多样性或无多样性。在一些情况下,具有高度多样性的抗体文库可以在特定CDR中包含至少1×10

在各个方面,与初始抗体克隆相比,本文提供的方法可以生成具有在至少一种特性方面的改善的至少一种抗体。在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出热稳定性的改善。例如,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出至少2X、3X、4X、5X、6X、7X、8X、9X、10X、15X、20X、25X、30X、35X、40X、45X、50X、55X、60X、65X、70X、75X、80X、85X、90X、95X、100X或大于100X的热稳定性。在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出对靶标表位更大的亲和力。例如,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出至少2X、3X、4X、5X、6X、7X、8X、9X、10X、15X、20X、25X、30X、35X、40X、45X、50X、55X、60X、65X、70X、75X、80X、85X、90X、95X、100X或大于100X的对靶标表位的亲和力。在一些情况下,抗体文库中的至少一种抗体可以表现出物种选择性的改善。例如,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出至少2X、3X、4X、5X、6X、7X、8X、9X、10X、15X、20X、25X、30X、35X、40X、45X、50X、55X、60X、65X、70X、75X、80X、85X、90X、95X、100X或大于100X的对特定物种的靶标表位的亲和力。在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出增加的物种交叉反应性。例如,抗体文库中的至少一种抗体可以对来自物种A(例如,食蟹猴)的表位A具有高亲和力,并且可以对于来自物种B(例如,人类)的表位A具有高亲和力。在一些情况下,与初始抗体克隆相比,抗体文库中的至少一种抗体可以表现出至少2X、3X、4X、5X、6X、7X、8X、9X、10X、15X、20X、25X、30X、35X、40X、45X、50X、55X、60X、65X、70X、75X、80X、85X、90X、95X、100X或大于100X的对来自物种A的表位A的亲和力,并且与初始抗体克隆相比,表现出至少2X、3X、4X、5X、6X、7X、8X、9X、10X、15X、20X、25X、30X、35X、40X、45X、50X、55X、60X、65X、70X、75X、80X、85X、90X、95X、100X或大于100X的对来自物种B的表位A的亲和力。图31A和图31B描绘了选择表现出改善的热稳定性、改善的对来自食蟹猴的表位A的亲和力和改善的对来自人类的表位A的亲和力的抗体克隆的非限制性实例。

在各个方面,本文描述的方法可以生成具有热稳定性的抗体。在一些情况下,抗体文库中的抗体可以是在约50℃至约90℃的温度下热稳定的。例如,抗体文库中的抗体可以是在至少50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃的温度下热稳定的。

在各个方面,本文描述的方法可以生成对靶标表位具有高亲和力的抗体。例如,抗体文库中的抗体可以以小于约50nM、25nM、10nM、5nM、1nM、900pM、800pM、700pM、600pM、500pM、400pM、300pM、200pM、100pM、50pM、25pM、10pM、5pM、1pM、900fM、800fM、700fM、600fM、500fM、400fM、300fM、200fM、100fM、50fM、25fM、10fM、5fM、1fM或更小的解离常数(K

某些术语

本文所使用的术语仅出于描述特定情况的目的,而不旨在进行限制。除了本领域技术人员对这些术语的理解之外,讨论以下术语以说明在本说明书中所使用的该术语的含义。如本文和所附权利要求书中所使用的,除非上下文另有明确规定,否则单数形式“一个”、“一种”和“该”包括复数指代物。还应注意,权利要求书可以被拟定为排除任何任选的要素。因此,该陈述旨在用作与要求保护的要素的叙述相关联地使用的诸如“单独”、“仅”等排他性术语或使用“否定”限制的先行基础。

本文中给出了某些范围,其中数值之前带有术语“约”。术语“约”在本文中用于为其后的确切数字以及与该术语后的数字接近或近似的数字提供文字支持。在确定数字是否接近或近似于具体列举的数字时,接近或近似的未列举数字可以是这样的数字,在给出数字的上下文中,该数字提供了具体列举的数字的实质上等同形式。在提供数值范围的情况下,应理解,除非上下文另有明确规定,否则在下限单位的十分之一上,在该范围的上限和下限之间的每个中间值以及在所述范围内的任何其他所述值或中间值均包括在本文所述的方法和组合物内。这些较小范围的上限和下限可以独立地包含在较小范围内,并且还包括在本文所述的方法和组合物内,但受到所述范围内的任何明确排除的限制。当所述范围包括一个或两个极限值时,排除那些所包括的极限值中的一个或两个的范围也包括在本文所述的方法和组合物中。

术语“个体”、“患者”或“受试者”可互换使用。这些术语均不要求或不限于以卫生保健工作者(例如,医生、注册护士、执业护士、医师助理、护理员或临终关怀工作者)的监督(例如,持续或间歇性)为特征的情况。此外,这些术语是指人类或动物受试者。

“治疗(treating)”或“治疗(treatment)”均是指治疗性处理以及预防性或防止性措施,其中目的是预防或减慢(减轻)目标病理状况或病症。需要治疗的个体包括已经患有病症的个体,以及容易患有病症的个体,或要预防病症的个体。

如本文所用,术语“抗体”是指免疫球蛋白分子和免疫球蛋白分子的免疫活性部分,即,包含与抗原免疫特异性结合的抗原结合位点的分子。该术语还指由两条免疫球蛋白重链和两条免疫球蛋白轻链以及包括全长抗体及其部分的多种形式组成的抗体;包括例如免疫球蛋白分子、多克隆抗体、单克隆抗体、重组抗体、嵌合抗体、人源化抗体、CDR移植抗体、F(ab)

除非另有定义,否则本文所用的所有技术术语和科学术语具有与本文所述的方法和组合物所属领域的普通技术人员通常所理解的相同含义。尽管类似于或等同于本文所述的那些方法和材料的任何方法和材料也可以用于实施或测试本文所述的方法和组合物,但是现在描述了代表性的示例性方法和材料。

实施例

实施例1:SuperHuman文库(SHL)2.0的生成

使用以下步骤生成SuperHuman文库:

1.基于以下的组合选择来自3500个组合(IGHV1-46、IGHV1-69、IGHV3-15、IGHV3-23用于重链,和IGKV1-39、IGKV2-28、IGKV3-15、IGKV4-1用于轻链)的人类库(humanrepertoire)的最佳的4个VH框架和最佳的4个VK框架:1)先前在人类mAb中证明的安全性,2)热稳定性;3)不易于聚集;4)在所有人类群体中在氨基酸水平上的框架中的单个显性等位基因(即非种族性药物);5)CDR的不同典型拓扑;6)在细菌中表达良好,且在噬菌体上展示良好。

2.从140名受试者获得血液。

3.从血液分选初始(CD27-/IgM+)细胞和记忆(CD27+/IgG+)细胞。

4.使用下一代测序(NGS)检查池的质量,并舍弃具有问题性的多样性或生化倾向的池。

5.使用通用引物对来自初始细胞的VH-CDR3序列进行PCR扩增。

6.使用框架特异性的引物对来自记忆细胞的VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3序列进行PCR扩增。

7.将框架定为合成产生的种系区段。

8.使用PCR-OE组装核酸文库。

9.使用NGS测序检查来自步骤8的组装的质量。

10.将轻链克隆到具有填充VH的载体中。

11.通过在热压力后使用蛋白A或蛋白L来选择框内材料。

12.将重链克隆到载体中以替换填充VH。

13.使用电穿孔用在步骤12结束时生成的载体转化微生物。

实施例2:筛选对PD1的亲和力

针对PD1的第4轮SuperHuman淘选后随机选择的两个96孔板的克隆进行初步筛选。

绕过ELISA筛选立即在Carterra高通量动力学仪器上测定样品(图3)。大部分的样品(hits)是阳性的,并且在184个测序中有98个是独特的。

针对人和食蟹猴PD1证明了对PD1显示出亲和力的克隆(图4)、(图5)。

实施例3:2个板的抗体克隆的bGal ELISA和Sanger筛选

对来自两个板的抗体克隆针对bGal进行ELISA淘选(图2)。

还对这些克隆进行Sanger测序(图8)。第三轮输出的极端多样性确保可以通过筛选一些96孔板的克隆来重新获得对任何表位的采样数。

不仅在VH-CDR3(CDR-H3)序列中发现多样性,而且在VH-CDR1(CDR-H1)和VH-CDR2(CDR-H2)序列中发现多样性(图10)。实施例4:组合设计和选择方法以产生具有多样的VH和VK序列的抗体文库

在构建过程中应用表达和热稳定性的功能性选择以产生在4000万条轻链中具有超过95%的功能多样性的文库。使用7.6×10

首先,通过将期望的轻链和临时的填充VH序列克隆到载体中来产生VK(κ轻链)文库。展示VK库并使其在超过65℃下承受热应力。使用蛋白A/L选择框内材料。用靶标VH序列替换由蛋白A/L选择产生的文库中的填充VH序列(图17)。

实施例5:SuperHuman文库(SHL)3.0的生成

使用以下步骤生成SuperHuman文库:

1.基于以下的组合选择六种抗体框架(IGHV1-46、IGHV3-23、IGKV1-39、IGKV2-28、IGKV3-15和IGKV4-1):1)先前在人类mAb中证明的安全性,2)热稳定性,3)不易于聚集,4)在所有人类群体中在氨基酸水平上的框架中的单个显性等位基因(即非种族性药物),5)CDR的不同典型拓扑;6)在细菌中表达良好,并在噬菌体上展示良好。

2.从50-100名受试者获得血液。

3.从血液分选初始(CD27-/IgM+或CD27-/IgD+)细胞和记忆细胞。

4.使用下一代测序(NGS)检查池的质量,并舍弃具有问题性的多样性或生化倾向的池。

5.使用通用引物对来自初始细胞的VH-CDR3序列进行PCR扩增。

6.基于以下内容通过DNA合成来选择不具有倾向的有利的VH-CDR1、VH-CDR2、VL-CDR1、VL-CDR2和VL-CDR3序列:(1)观察到存在于人类天然抗体中,(2)观察到在SuperHuman2.0针对多种抗原的选择中未表现欠佳,(3)没有生化倾向(C、暴露的M、脱氨基位点、酸水解位点、N联糖基化位点、琥珀终止密码子、蛋白石终止密码子、带高正电荷),(4)突变未超过阈值(例如,每个CDR不超过3个氨基酸突变)。换句话说,如果VH-CDR1、VHCDR2、VL-CDR1、VL-CDR2和VL-CDR3序列符合以下标准,则对其进行合成:

a)对于所用的各个框架,具有相比于各自的种系CDR不超过4个的氨基酸突变;和

b)在NGS期间被识别为存在于至少2个受试者中,并且在评估来自SuperHuman 2.0(实施例1)的针对11种抗原的55,000个采样数的池时进行富集而没有适应性劣势,或者并未在人体中观察到但是在相同的SuperHuman 2.0池中淘选时已充分富集;以及

c)不包含任何生化倾向(N联糖基化、脱氨基、酸水解、正电荷内肽切割、游离半胱氨酸、游离甲硫氨酸、替代终止密码子、隐蔽剪接位点、tev切割位点或过度带正电荷的CDR)。

7.将框架定为合成产生的无突变的100%种系区段。

8.使用PCR-OE或另一种DNA组装方法组装核酸文库。

9.使用NGS测序检查来自步骤8的组装的质量。

10.将轻链克隆到带有填充VH的载体中

11.通过在热压力后使用蛋白A或蛋白L来选择框内材料。

12.将重链克隆到载体中以替换填充VH。

13.使用电穿孔用在步骤12结束时生成的载体转化微生物。

尽管本文已经示出和描述了本发明的优选实施方案,但是对于本领域技术人员而言显而易见的是,这样的实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,本文所述的本发明的实施方案的各种替代方案可以用于实施本发明。以下权利要求书旨在限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同项。

技术分类

06120112474897