掌桥专利:专业的专利平台
掌桥专利
首页

一种纳米抗体合成库及其构建方法

文献发布时间:2023-06-19 16:11:11



技术领域

本发明属于基因工程技术领域。更具体地,涉及一种纳米抗体合成库及其构建方法。

背景技术

噬菌体展示技术是通过基因工程技术将外源基因整合进入噬菌体特定基因中,最终通过噬菌体外壳蛋白展示出具有活性的目的蛋白,该技术普遍应用于抗体库的构建,是基因工程抗体库构建中的常用技术。

纳米抗体(VHH)相对分子质量为12-15kDa,仅为传统单克隆抗体的十分之一。这使它容易接近靶目标表面的沟、裂缝或被隐藏的抗原表位,识别许多传统抗体无法识别的抗原。而纳米抗体的获取则需要通过纳米抗体库进行淘筛,目前,纳米抗体库根据其来源可分为3种,分别为天然库、免疫库及合成库,而选择不同的纳米抗体库来源构建得到的纳米抗体文库是不同的。纳米抗体需要通过纳米抗体库的淘筛获取制备,而天然库是提取大量未经过免疫的骆驼科动物血液中淋巴细胞获取抗体基因序列去建库;免疫库是通过注射免疫原诱导动物产生免疫应答并提取血液中淋巴细胞的抗体基因建库;而合成库是无需免疫及提取血液,人工设计合成抗体基因,再以基因工程技术去建库。而目前常用的噬菌体库是指通过噬菌体展示技术把文库里的抗体展示在噬菌体的外壳蛋白上,是为了后续制备抗体。其中,免疫库的抗体亲和力高、特异性强,仅需小库容(10

合成库是以表达性状良好、稳定性强的抗体序列为框架,来提高文库中抗体的表达水平和降低表达产物对宿主细胞的毒性,通过提高抗体库中功能性抗体分子的比例,从而增加抗体库的真实库容量。而且采用的骨架不同,制备合成的纳米抗体库是不同的。传统的合成库一般采用通用框架或者在天然库中筛选的框架,如本发明团队前期研发的纳米抗体全合成文库采用的是纳米抗体保守框架cAbBCII10,该骨架cabBCII10更稳定且表达量相对较高,在还原或缺失保守二硫键的情况下仍具有抗体功能,其构建出的纳米抗体全合成文库库容较高,多样性丰富。而目前最常应用于引入CDR区随机化的方法是采取NNK/NNS等简并引物引入序列多样性(N=A/T/G/C任一种;K=G/T;S=G/C),通过各种核苷酸混合物对序列进行随机编码合成,最终可编码所有20种氨基酸及琥珀终止密码子TAG,是目前构建合成库最为常用的方法,根据不同的纳米抗体选定,确定CDR序列长度是不同的,在现有技术中有报道在纳米抗体CDR3区长度结构的不同会使抗体产生不同的构象。因此,采用不同的框架以及选择不同的CDR序列长度,构建得到的纳米文库是不同的,为了扩增纳米抗体库的丰富度以及多样性,增加纳米抗体的获取以及淘筛途径,还需要开发出更多的纳米抗体文库,丰富全合成纳米抗体文库资源。

发明内容

本发明要解决的技术问题是克服上述的缺陷和不足,提供一种纳米抗体合成库及其构建方法,增加纳米抗体文库的序列多样性和结构多样性。

本发明的目的是提供一种纳米抗体合成库及其构建方法。

本发明另一目的是提供纳米抗体合成库。

本发明上述目的通过以下技术方案实现:

本发明公开了一种纳米抗体合成库及其构建方法,首先选定用于构建合成库的纳米抗体骨架,再通过纳米抗体序列收集,数据统计分析,确定了随机化区域,随机化策略采用NNK简并密码子引入序列多样性,通过Klenow酶扩增合成片段,以及多次重叠延伸拼接后得到完整的含随机化位点的纳米抗体序列,用于构建高容量、高多样性的纳米抗体合成库,最终构建了三种长度不同的纳米抗体合成库。三种文库中CDR1、CDR2区随机化位点分别固定为了8个氨基酸、7个氨基酸,三种文库的主要区别在于CDR3区的长度分别为9、12、15个氨基酸,所构建三种文库库容分别为3×10

本发明采用的纳米抗体合成文库的构建方法包括以下步骤:

(1)纳米抗体框架选定,选择一种高表达量及高热稳定性纳米抗体骨架区作为合成库的基础抗体框架,并确定其FR区,所述框架的表达量大于20mg/L,热稳定性指在50~90℃下加热5~60min仍可维持同室温相近的活性;

(2)收集各类纳米抗体序列,统计CDR区氨基酸各位点出现频率及各CDR区氨基酸长度频率,确定合成库随机化位点CDRs区,对CDR3区设计三种不同长度以及结构的氨基酸,并随机化CDR1、CDR2及CDR3区域;

(3)根据步骤(1)及步骤(2)所确定的FR区及CDRs区合成四条带有随机化位点的单链DNA片段,四种合成片段分别包含了抗体FR1-CDR1-FR2部分,FR2-CDR2-FR3部分,FR3部分及FR3-CDR3-FR4部分,并设计相应延伸引物将单链DNA通过PCR扩增为双链DNA;

(4)通过重叠延伸PCR拼接步骤(3)中各双链DNA片段,获取完整的CDR区随机化纳米抗体基因,再经过酶切和酶连接构建噬菌粒重组载体;

(5)将步骤(4)中所构建含抗体基因序列的重组载体通过电击转入感受态细胞,并进行扩培后以辅助噬菌体救援,以构建基于噬菌体展示的纳米抗体合成库。

本发明采用的骨架选择一种高表达量及高热稳定性纳米抗体区,其框架的表达量大于20mg/L,热稳定性指在50~90℃下加热5~60min仍可维持同室温相近的活性,保证后续制备出的抗体有更优秀的性能。本发明研究采用的纳米抗体骨架是来源于一个识别小分子物质的免疫库淘筛所得的纳米抗体,其框架的表达量30~50mg/L,且其在90℃极端温度下加热60min仍可保持50%活性;是不同于目前纳米抗体文库构建采用的通用框架,相比于采用cabBCII10骨架的纳米抗体表达量(均不超10mg/L)高出4~10倍,相比于通用框架的表达量也高出近一个数量级,具有高表达量及良好的热稳定性,为后续抗体制备及实际应用提供良好的抗体性能基础。

优选地,在步骤(1)中选用的纳米抗体骨架高表达量30~50mg/L,且其在90℃极端温度下加热60min仍可保持50%活性;确定的骨架保守区FR区中,FR1区氨基酸个数定为25个,FR2区氨基酸个数定为17个,FR3区氨基酸个数定为38个,FR4区氨基酸个数定为11个。

优选地,在步骤(2)中随机化位点通过NNK突变设计引入。

纳米抗体的框架序列是相对保守的,本发明采用的骨架序列是来源于识别小分子物质的,通过把CDR区随机化,设计三种长度的CDR3区,除了统计频率不同以外,三种CDR3区的氨基酸长度有助于形成凹型、凸型、环型结构,增加了文库结构多样性,从而体现出构建的纳米抗体合成库的广谱性。

所确定的纳米抗体合成库的VHH序列随机化区域定为CDR1、CDR2及CDR3区,通过NNK突变引入随机化位点,其中CDR1区随机化氨基酸位点个数为8个,CDR2区随机化氨基酸位点个数为7个,CDR3区随机化氨基酸位点分为3种长度,分别为9、12、15个氨基酸。采用3种长度的CDR3区随机化氨基酸位点可以构建出三种不同的纳米抗体合成库。

优选地,在步骤(3)中特异性延伸引物的序列依次如SEQ ID NO.1~4所示;合成的含有随机化位点区域的纳米抗体单链DNA片段的序列依次如SEQ ID NO.5~8所示。

优选地,在步骤(3)中扩增采用Klenow酶。

优选地,在步骤(4)中酶切和酶连接采用SfiⅠ酶切及T4 DNA连接酶,重叠延伸PCR采用的引物序列依次如SEQ ID NO.9~10和SEQ ID NO.13~14所示。

优选地,在步骤(5)中感受态细胞采用琥珀抑制型菌株TG1感受态细胞。

本发明提供一种纳米抗体合成库,由以上构建方法获得。

优选地,所示纳米抗体全合成文库的库容不低于1.0×10

本发明具有以下有益效果:

本发明公开了一种纳米抗体合成库及其构建方法,首先选择固定的抗体恒定区作为文库中抗体的基础骨架,选择的骨架具有高表达量及高热稳定性,其来源于一个识别小分子物质的免疫库淘筛所得的纳米抗体,其框架的表达量30~50mg/L,且其在90℃极端温度下加热60min仍可保持50%活性;是不同于目前纳米抗体文库构建采用的通用框架,相比于采用cabBCII10骨架的纳米抗体表达量(均不超10mg/L)高出4~10倍,相比于通用框架的表达量也高出近一个数量级,具有高表达量及良好的热稳定性,为后续抗体制备及实际应用提供良好的抗体性能基础。再通过数据统计、序列分析,并综合考虑到CDR3区不同长度对抗体可变区结构的改变后,将CDR3区随机化氨基酸个数设计为3种不同长度,CDR1、CDR2区氨基酸随机化个数固定。随后对三个CDR区均进行随机化构建全合成纳米抗体文库。

本发明不同于其他常见合成库采用报道的通用框架,而选择另外的高表达量高热稳定性纳米抗体的骨架区作为合成库构建基本骨架,并且不仅仅只对一个CDR区进行随机化,选择所有CDR区进行随机化,需要进行多次延伸拼接,相对难度更高,其中各片段的重叠延伸PCR反应条件经多次实验优化所得,最终以求获取更丰富的文库多样性(序列多样性、结构多样性),增加淘筛各类不同对象的可能性。

其中,CDR序列长度的确定是根据统计不同的纳米抗体而进行选定的,本发明提供的构建方法对CDR3区设计了三种不同长度的氨基酸数目,这三种CDR3区的氨基酸长度有助于形成凹型、凸型、环型结构,增加了文库结构多样性。

附图说明

图1为CDR1区氨基酸长度频率统计;

图2为CDR2区氨基酸长度频率统计;

图3为CDR3区长度频率统计;

图4为扩增VHH基因合成片段(图A中M:DL500 DNA marker;lane 1:含CDR1区的随机化位点双链DNA片段N1;lane 2:含CDR2区随机化位点双链DNA片段N2。图B中M:DL500 DNAmarker;lane 1:FR3区VHH基因片段N3;lane 2:含CDR3区随机化位点双链DNA片段N4);

图5为优化过程中部分优化条件举例(图E中M:DL500 DNA marker;lane1-lane8:不同退火温度下的N1及N2拼接片段;图F中M:DL500 DNA marker;lane 1-lane2:55℃-60℃退火反应时N1N2片段拼接条带;lane3-lane4:55-58℃退火反应时N3N4片段拼接条带);

图6为重叠延伸PCR拼接VHH片段(图C中M:DL500 DNA marker;lane1:N1及N2拼接片段;lane 2:N3及N4拼接片段。图D中M:DL500 DNA marker;lane 1:所有CDR区随机化的VHH基因);

图7为抗体库挑菌测序结果。

具体实施方式

以下结合说明书附图和具体实施例来进一步说明本发明,但实施例并不对本发明做任何形式的限定。除非特别说明,本发明采用的试剂、方法和设备为本技术领域常规试剂、方法和设备。

除非特别说明,以下实施例所用试剂和材料均为市购。

实施例1骨架及随机化位点确定

本发明以一种高表达量及高热稳定性纳米抗体的保守骨架区作为合成文库的框架,其框架的表达量30~50mg/L,且其在90℃极端温度下加热60min仍可保持50%活性(Wang J,Bever C,Majkova Z,et al.Heterologous antigen selection of camelidheavy chain single domain antibodies against tetrabromobisphenol A.[J].Analytical Chemistry,2014,86(16):8296-8302.);该框架相比于通用框架的表达量也高出近一个数量级,具有高表达量及良好的热稳定性。基于其DNA序列设计合成库的随机化片段,用于合成库构建及后续淘筛。

将所选定框架基因序列上传至该网站(http://www.imgt.org/IMGT_vquest/input)通过数据对比,进行框架区及可变区分区,选择VHH基因的框架区作为合成库构建的基础骨架,确定FR区;最终FR1区氨基酸个数定为25个;FR2区氨基酸个数定为17个;FR3区氨基酸个数定为38个;FR4区氨基酸个数定为11个。

通过文献收集、IMGT、NCBI等数据库的纳米抗体序列收集,以及本发明团队实验室已有纳米抗体序列收集,共获取180条针对不同对象的纳米抗体序列。这些序列涵盖真菌毒素、农兽药、食品添加剂、环境污染物等不同对象,以IMGT/V-QUEST序列分区工具对纳米抗体序列进行分区,以Bioedit、Jalview统计不同纳米抗体CDR区氨基酸长度及各位点氨基酸出现频率,从而确定合成库随机化位点。

统计结果如图1至图3所示,由图可知,这些不同纳米抗体序列的CDR1区氨基酸长度基本全部为8个,CDR2区氨基酸长度则普遍为7个或8个,但7个氨基酸长度的频率略多于8个氨基酸长度,CDR3区长度则跨越十分大,从7个至25个不等。构建合成库随机化区域定为CDR1、CDR2及CDR3区,其中CDR1区随机化氨基酸位点个数为8个,CDR2区随机化氨基酸位点个数为7个,CDR3区由于其长度跨度大,再综合考虑统计数据及参考文献叙述后,将CDR3区氨基酸随机化位点定为3种长度,分别为9、12、15个氨基酸。本文库采用NNK简并密码子对选定目标位点进行随机化,人工合成得到含随机化位点的VHH基因片段。

特别地,本实施例对CDR3区氨基酸随机化位点定为3种长度,以下实施例仅对氨基酸长度为12个的CDR3区氨基酸随机化位点进行后续的合成以及构建。其余两种CDR3区氨基酸随机化位点定长度9和15,进行构建纳米文库时除了所用合成片段不同以外,其他操作均与以下实施例步骤相同。

实施例2合成基因片段的扩增

根据所确定的FR区及CDRs区合成四条带有随机化位点的单链DNA片段,四种合成片段分别包含了抗体FR1-CDR1-FR2部分,FR2-CDR2-FR3部分,FR3部分及FR3-CDR3-FR4部分,并设计相应延伸引物将单链DNA扩增为双链DNA。

抗体基因序列设计了四条单链DNA片段及与之匹配的延伸引物如下表1所示,以单链DNA为模板,经Klenow酶扩增获取对应双链DNA片段,扩增双链DNA片段的反应体系及条件:首先将单链DNA与延伸引物添加量摩尔比控制为1:3,再以TE缓冲液(含100mM NaCl)将体系补足至50μL,95℃加热5min后,于室温缓慢冷却20min。再向体系中加入10×NEBbuffer2 20μL、10mM dNTPs 8μL、Klenow酶3μL、RNase free H

表1四条单链DNA片段及与之匹配的延伸引物序列

最终得到含有CDR区随机化的四条双链DNA片段,电泳结果如图4所示,四条双链DNA的条带位置正确,成功扩增得到了用于重叠延伸PCR的双链DNA片段。

实施例3重叠延伸PCR反应条件的优化

本发明方法构建的合成库随机化区域定为CDR1、CDR2及CDR3区,同时对三个CDR区都进行随机化。在随机化区域选择时,一般随机化部位越多进行扩增反应越复杂,难度就越大,选择所有CDR区进行随机化,需要进行多次延伸拼接,相对难度更高。本实施例对重叠延伸PCR反应条件以及引物进行优化,其中针对拼接纳米抗体基因序列设计了一系列特异性引物如下表2所示,对重叠延伸PCR反应条件进行优化如下表3所示。

采用重叠延伸PCR将上述步骤所得抗体基因片段两两拼接,重叠延伸PCR拼接程序包括:拼接片段N1N2:94℃5min;94℃30s,50℃30s,72℃1min,35个循环;72℃5min。拼接片段N3N4:94℃5min;94℃30s,55℃30s,72℃1min,35个循环;72℃5min。拼接出完整VHH基因:94℃5min;94℃30s,60℃30s,72℃1min,35个循环;72℃5min。

表2引物的设计

表3重叠延伸PCR反应条件

分别采用上述表2中的引物和表3中的条件别进行了检测,结果如图5所示,其中采用的不同引物以及条件会有很多非特异性条带的产生,扩增不出完整的CDR区随机化的抗体基因序列。

经过不同的引物序列的优化对比,最终采用的引物为SOE-F(SEQ ID NO.9)、SOE-R(SEQ ID NO.9)、SfiⅠ-F(SEQ ID NO.13)和SfiⅠ-R(SEQ ID NO.14),拼接N1N2片段时PCR退火温度设置为50℃退火时间30s,拼接N3N4片段PCR退火温度设置为55℃,退火时间30s,拼接完整VHH基因片段时PCR退火温度设置为60℃,退火时间30s。经过多轮重叠延伸PCR,最终得到完整的全部CDR区随机化的抗体基因序列,拼接得到的完整VHH基因序列电泳图如图6所示,可以看出拼接所得条带大小介于300bp及400bp之间,与纳米抗体序列基因的条带大小相符。

经多次引物和条件的优化后,通过筛选出较佳的引物和条件进行下一步实验。

实施例3纳米抗体合成库构建及鉴定

将上述实施例2中构建好的目的片段和pComb3xss空载质粒以sfiⅠ酶进行酶切,反应体系如下:1μg目的DNA,5μL 10×buffer,2μL sfiⅠ限制性内切酶,RNase free H

再以T4 DNA连接酶酶连的方式将目的片段插入线性化pComb3xss噬菌粒中,连接体系为:线性化载体100ng、插入片段、10×T4 DNA连接酶Buffer 2.5μL、5U/μL的T4 DNA连接酶1U、RNase free H

将纯化后的连接产物电击转入感受态细胞TG1以构建纳米抗体合成文库,其中转化次数共10次,吸取10μL菌液梯度稀释后(10

随机挑取上述用于计数的培养皿中的菌落进行菌落PCR,计算文库插入率,并将挑取得菌落扩培后进行测序验证。经过梯度板计数,测序结果如图7所示,最终实施例所构建的纳米抗体合成库实际库容为1.9×10

采用本发明方法对另外两种CDR3区文库长度分别为9和15个氨基酸进行构建,最终验证得到所构建的文库库容分别为3×10

实施例4纳米抗体噬菌体展示库构建

将实施例3中制备得到的抗体基因文库中取100倍以上库容量的活细胞进行接种扩培,培养至对数期后添加辅助噬菌体M13K07进行侵染,采用PEG-NaCl纯化噬菌体后即可得到噬菌体展示纳米抗体库,经梯度板计数结果显示噬菌体库滴度为8×10

综上可知,本发明公开了一种纳米抗体合成库及其构建方法,首先选择固定的抗体恒定区作为文库中抗体的基础骨架,选择的骨架来源于一个识别小分子物质的免疫库淘筛所得的纳米抗体,其框架的表达量30~50mg/L,且其在90℃极端温度下加热60min仍可保持50%活性;是不同于目前纳米抗体文库构建采用的通用框架,相比于采用cabBCII10骨架的纳米抗体表达量(均不超10mg/L)高出4~10倍,相比于通用框架的表达量也高出近一个数量级,具有高表达量、高热稳定性的特点,有助于稳定文库中抗体蛋白骨架结构,为后续抗体制备及实际应用提供良好的抗体性能基础。再通过数据统计、序列分析,并综合考虑到CDR3区不同长度对抗体可变区结构的改变后,将CDR3区随机化氨基酸个数设计为3种不同长度,CDR1、CDR2区氨基酸随机化个数固定。随后对三个CDR区均进行随机化构建全合成纳米抗体文库。

本发明不同于其他常见合成库采用报道的通用框架,而选择另外的高表达量高热稳定性纳米抗体的骨架区作为合成库构建基本骨架,并且不仅仅只对一个CDR区进行随机化,选择所有CDR区进行随机化,需要进行多次延伸拼接,相对难度更高,其中各片段的重叠延伸PCR反应条件经多次实验优化所得,最终以求获取更丰富的文库多样性(序列多样性、结构多样性),增加淘筛各类不同对象的可能性。其中,CDR序列长度的确定是根据统计不同的纳米抗体而进行选定的,本发明提供的构建方法对CDR3区设计了三种不同长度的氨基酸数目,这三种CDR3区的氨基酸长度有助于形成凹型、凸型、环型结构,增加了文库结构多样性。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

序列表

<110> 华南农业大学

<120> 一种纳米抗体合成库及其构建方法

<160> 16

<170> SIPOSequenceListing 1.0

<210> 1

<211> 17

<212> DNA

<213> ep1(SIPOSequenceListing 1.0)

<400> 1

cagctcgtgg agtctgg 17

<210> 2

<211> 15

<212> DNA

<213> ep2(SIPOSequenceListing 1.0)

<400> 2

atgggctggt accgc 15

<210> 3

<211> 38

<212> DNA

<213> ep3(SIPOSequenceListing 1.0)

<400> 3

cgcaaactct gtgaagggcc gattcgccat ctccagag 38

<210> 4

<211> 21

<212> DNA

<213> ep4(SIPOSequenceListing 1.0)

<400> 4

ggacacggct atgtattact g 21

<210> 5

<211> 88

<212> DNA

<213> N1(SIPOSequenceListing 1.0)

<400> 5

ctggcggtac cagcccatmn nagaggctgc acaggagagt ctcagagacc ccccaggttg 60

caccaagcct cccccagact ccacgagc 88

<210> 6

<211> 75

<212> DNA

<213> N2(SIPOSequenceListing 1.0)

<400> 6

cttcacagag tttgcgtagt amnnagctgc gaccaactcg cgccccctcc ctggaggctg 60

gcggtaccag cccat 75

<210> 7

<211> 98

<212> DNA

<213> N3(SIPOSequenceListing 1.0)

<400> 7

gtaatacata gccgtgtcct caggtttcag gctgttcatt tgcagataca cggtgttctt 60

ggcattgtct ctggagatgg cgaatcggcc cttcacag 98

<210> 8

<211> 57

<212> DNA

<213> N4(SIPOSequenceListing 1.0)

<400> 8

gaggagacgg tgacctgggt cccctggccc camnnacagt aatacatagc cgtgtcc 57

<210> 9

<211> 36

<212> DNA

<213> SfiⅠ-F(SIPOSequenceListing 1.0)

<400> 9

actggcccag gcggcccagg tgcagctcgt ggagtc 36

<210> 10

<211> 31

<212> DNA

<213> SfiⅠ-R(SIPOSequenceListing 1.0)

<400> 10

actggccggc ctggcctgag gagacggtga c 31

<210> 12

<211> 31

<212> DNA

<213> SfiⅠ-F1(SIPOSequenceListing 1.0)

<400> 12

actggcccag gcggcccagg tgcagctcgt g 31

<210> 12

<211> 50

<212> DNA

<213> SfiⅠ-R1(SIPOSequenceListing 1.0)

<400> 12

actggccggc ctggcctgag gagacggtga cctgggtccc ctggccccag 50

<210> 13

<211> 30

<212> DNA

<213> SOE-F(SIPOSequenceListing 1.0)

<400> 13

tactacgcaa actctgtgaa gggccgattc 30

<210> 14

<211> 30

<212> DNA

<213> SOE-R(SIPOSequenceListing 1.0)

<400> 14

gaatcggccc ttcacagagt ttgcgtagta 30

<210> 15

<211> 16

<212> DNA

<213> SOE-F1(SIPOSequenceListing 1.0)

<400> 15

cgcaaactct gtgaag 16

<210> 16

<211> 16

<212> DNA

<213> SOE-R1(SIPOSequenceListing 1.0)

<400> 16

cttcacagag tttgcg 16

技术分类

06120114736873