掌桥专利:专业的专利平台
掌桥专利
首页

防止多能干细胞中基因快速沉默的方法

文献发布时间:2024-04-18 20:02:40


防止多能干细胞中基因快速沉默的方法

优先权声明

本申请要求于2021年5月26日提交的美国临时申请序列号63/193,472的优先权,该临时申请的全部内容特此通过引用方式并入本文。

序列表的并入

序列表包含在名为“CDINP0103WO_ST25.TXT”的文件中,该文件为34,000字节(在Microsoft

背景技术

1.技术领域

总体来说,本公开涉及干细胞生物学领域。更具体而言,它涉及对诱导的多能干细胞中的基因进行密码子优化以减少基因的快速沉默的方法。

2.相关技术的描述

研究表明,看似相同的细胞系在性能上存在显著差异(Kyttala,2016)。在比较来自同一供体的多个克隆时检测到的这些差异被称为“克隆间变异”。认为这些克隆含有相同的DNA序列,并且在某些情况下得到证实。同一细胞系不同分化批次的产量和纯度不一致被称为“批次间变异”。在许多情况下,将分化性能的差异归因于表观遗传修饰;然而,仍有需求尚未得到满足,即鉴定特定的表观遗传机制和改变这些表观遗传机制以防止细胞系中的变异的方法。

发明内容

在第一实施方案中,本公开提供了一种经工程化改造以表达至少一种转基因的分离细胞系,其中该至少一种转基因(a)受与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子控制;(b)受选自由HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC组成的组的内源性基因控制;和/或(c)由经修饰以去除CpG基序从而提供稳定表达的序列编码。在某些方面,该细胞系是诱导性多能干细胞(iPSC)系。

在一些方面,经修饰以去除CpG基序从而提供稳定表达的序列与SEQ ID NO:14或SEQ ID NO:16具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性。在某些方面,经修饰以去除CpG基序从而提供稳定表达的序列是SEQ IDNO:14或SEQ ID NO:16。

在一些方面,存在至少一种转基因,其中该至少一种转基因(a)受与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子控制;和/或(b)受选自由HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC组成的组的内源性基因控制。在特定方面,该至少一种转基因由经修饰以去除CpG基序从而提供稳定表达的序列编码。

在某些方面,该至少一种转基因由经修饰以去除CpG基序从而提供稳定表达的序列编码,并且受与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子控制。在一些方面,该至少一种转基因由经修饰以去除CpG基序从而提供稳定表达的序列编码,并且受选自由HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC组成的组的内源性基因控制。在特定方面,该至少一种转基因由经修饰以去除CpG基序从而提供稳定表达的序列编码,并且受选自由HSP90AB1、ACTB、CTNNB1和MYL6组成的组的内源性基因控制。

在其他方面,该细胞系经工程化改造以表达至少第一转基因和第二转基因。在一些方面,第一转基因受与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子控制,并且第二转基因受选自由HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC组成的组的内源性基因控制。在其他方面,第一转基因受与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子控制,并且第二转基因受选自由HSP90AB1、ACTB、CTNNB1和MYL6组成的组的内源性基因控制。在一些方面,第一转基因和/或第二转基因由经修饰以去除CpG基序用于稳定表达的序列编码。在特定方面,去除了至少50%,诸如至少70%、80%、90%、95%、96%、97%、98%或99%的CpG基序。在特定方面,去除了所有CpG基序。在一些方面,将CpG基序密码子替换为并不稀有和/或不生成单核苷酸延伸(stretch)的密码子。在特定方面,将CpG基序密码子替换为表1中相应的密码子。

在一些方面,启动子是应答元件。在某些方面,启动子由应答元件驱动。

在一些方面,转基因是报告基因或选择标志物。在某些方面,报告基因是荧光或发光蛋白,诸如萤光素酶、绿色荧光蛋白(GFP)或红色荧光蛋白(RFP)。在某些方面,该至少一种转基因是选择标志物,诸如嘌呤霉素、新霉素或杀稻瘟素。在特定方面,该至少一种转基因是自杀基因。在一些方面,该至少一种转基因是胸苷激酶、TET或成肌细胞决定蛋白1(MYOD1)。

在特定方面,细胞系稳定表达转基因达至少30天,诸如至少2个月、3个月、4个月、5个月或更长时间。在特定方面,细胞系在六个月内,诸如在一年内、在两年内或在三年内稳定表达转基因。

在一些方面,该至少一种转基因由表达盒编码。在某些方面,通过电穿孔或脂质转染将该至少一种转基因导入细胞系中。在特定方面,将表达盒在基因组安全港位点,诸如PPP1R12C(AAVS1)基因座或ROSA基因座处插入。

在某些方面,启动子与SEQ ID NO:2、3、4、6或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性。在一些方面,启动子包含SEQID NO:2、3、4、6或17。

在特定方面,该方法包括基因编辑,具体而言,转基因包括基因编辑,诸如TALEN介导的基因编辑、CRISPR介导的基因编辑或ZFN介导的基因编辑。

另一实施方案提供了一种防止工程化细胞系中转基因表达沉默的方法,包括优化转基因序列以去除CpG基序。

在一些方面,优化包括替换基本上所有的CpG基序密码子。在某些方面,优化包括替换至少50%的CpG基序,诸如去除至少70%、80%、90%、95%、96%、97%、98%或99%的CpG基序。在特定方面,去除了所有CpG基序。在特定方面,将CpG基序密码子替换为并不稀有和/或不生成单核苷酸延伸的密码子。在一些方面,将CpG基序密码子替换为表1中相应的密码子。在特定方面,经优化以去除CpG基序的转基因序列包含与野生型转基因序列的GC含量百分比基本相似的GC含量百分比。

在一些方面,转基因序列是报告基因,诸如荧光蛋白,例如GFP或RFP。

在某些方面,转基因受组成型启动子的控制。在一些方面,组成型启动子在几乎所有细胞类型中都有表达。在特定方面,组成型启动子基本上在所有细胞类型中都有表达。在某些方面,组成型启动子在所有细胞类型中都有表达。

在特定方面,转基因受诱导型启动子的控制。在一些方面,转基因受EEF1A1启动子的控制。

在另外的方面,该方法进一步包括用丁酸钠、VPA或TSA处理细胞系。在特定方面,以0.25mM至0.5mM的浓度加入丁酸钠。

在一些方面,该细胞系是iPSC细胞系。在某些方面,该方法进一步包括分化iPSC细胞系。在一些方面,将iPSC细胞系分化为成熟细胞,诸如但不限于造血前体细胞、神经前体细胞、GABA能神经元、巨噬细胞、小胶质细胞或内皮细胞。

另一实施方案提供了包含与SEQ ID NOs:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子的表达载体。在一些方面,启动子与SEQ ID NO:2、3、4、6或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性。在某些方面,启动子包含SEQ ID NO:2、3、4、6或17。在特定方面,表达载体是pGL3质粒载体。在一些方面,该载体编码在所述启动子控制下的转基因。在特定方面,转基因是报告基因,诸如荧光或发光蛋白,例如萤光素酶、绿色荧光蛋白(GFP)或红色荧光蛋白(RFP)。

另一实施方案提供了一种生成具有稳定转基因表达的细胞系的方法,包括工程化改造该细胞系以表达本公开实施方案的载体(例如,包含与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子),其中该载体编码所述转基因。在一些方面,细胞系是多能细胞系,例如iPSC细胞系。

在一些方面,该方法包括将载体整合到19号染色体上的AAVS1基因座处。在某些方面,整合包括基因编辑,诸如CRISPR介导的基因编辑、TALEN介导的基因编辑或ZFN介导的编辑。

在其他方面,该方法进一步包括分化细胞系。在一些方面,将细胞系分化为造血前体细胞、神经前体细胞、GABA能神经元、巨噬细胞、小胶质细胞或内皮细胞。在特定方面,将细胞系培养至少30天,诸如至少2个月、3个月、4个月、5个月或更长时间。在特定方面,将细胞系培养超过六个月,诸如超过一年、超过两年或超过三年。在特定方面,细胞系稳定表达转基因至少30天,诸如至少2个月、3个月、4个月、5个月或更长时间。在特定方面,细胞系稳定表达转基因超过六个月,诸如超过一年、超过两年或超过三年。在一些方面,将细胞系培养至少六个月。在某些方面,细胞系在六个月时稳定表达转基因。

另一实施方案提供了一种分离的多能细胞系,其包含本公开实施方案的表达载体(例如,包含与SEQ ID NO:1-12或17具有至少90%(例如,至少91%、92%、93%、94%、95%、96%、97%、98%或99%)序列同一性的启动子)。

另一实施方案提供了一种生成稳定表达外源性转基因的细胞系的方法,包括工程化改造该细胞系以在内源性基因控制下表达该转基因,其中该内源性基因是HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC,诸如HSP90AB1、ACTB、CTNNB1或MYL6。

在一些方面,工程化改造包括基因编辑,诸如TALEN介导的基因编辑、CRISPR介导的基因编辑或ZFN介导的基因编辑。在一些方面,转基因是报告基因、选择标志物或自杀基因。

在某些方面,细胞系是多能细胞系,例如iPSC细胞系。

另一实施方案提供了分离的细胞系,其具有标记有转基因的内源性HSP90AB1、ACTB、CTNNB1、MYL6、UBA52、CAG、RPS和UBC。在一些方面,转基因是报告基因、选择标志物或自杀基因。在某些方面,细胞系是多能细胞系,例如iPSC细胞系。

本文进一步提供了一种用于检测细胞的测定法,包括培养本公开实施方案的细胞系并测量报告基因的表达。本文还提供了本公开实施方案的细胞系用于细胞测定法的用途,这些测定法诸如细胞活力测定法或用于筛选候选作用剂的测定法。在一些方面,该测定法是高通量测定法。在某些方面,该细胞测定法包括测量报告基因的表达。

另一实施方案提供了包含本公开实施方案的细胞系的组合物用于细胞测定法。

通过以下详细描述,本公开的其他目的、特征和优点将变得显而易见。然而,应该理解的是,在陈述本发明优选实施方案的同时,详细描述和具体实施例仅以说明的方式给出,因为根据该详细描述,在本发明的精神和范围内的多种变化和修改对本领域技术人员来说将变得显而易见。

附图说明

以下附图构成了本说明书的一部分,并且将这些附图包括进来以进一步说明本发明的某些方面。通过参考这些附图中的一幅或多幅并结合本文给出的具体实施方案的详细描述,可以更好地理解本发明。

图1A-1D:由EEF1A1p驱动的ZsGreen表达在iPSC中呈斑驳状。使用EEF1A1p-ZsGreen在PPP1R12C基因座处对iPSC 01278.103(图1A、1B)和01279.107(图1C、1D)进行工程化改造。使用明视野和荧光(GFP)显微术捕获工程化改造后11代(图1A-1B)或工程化改造后18代细胞(图1C-1D)中的GFP表达。

图2:AcGFP1 DNA序列(SEQ ID NO:13)的密码子优化产生了不含CpG的AcGFP1 DNA序列(SEQ ID NO:14)。

图3A-3B:随着时间的推移,不含CpG的AcGFP1表达稳定而AcGFP1表达未得到维持。随时间监测在AAVS1基因座处用EEF1A1p-不含CpG-AcGFP1(图3A)靶向的5个克隆和用EEF1A1p-AcGFP1(图3B)靶向的9个克隆中的GFP表达百分比。

图4A-4C:iPSC中AcGFP1的快速沉默。描绘了在PPP1R12C基因座(AAVS1安全港)处用三种盒EEF1A1p-mRFP1+PGKp-Puro、EEF1A1p-AcGFP1或EEF1A1p-不含CpG AcGFP1对iPSC进行工程化改造。图中标注的是细胞系8717和9650的工程化iPSC ID号,它们用于整个文件的后续实验中(图4A)。挑取并扩增表达AcGFP1的克隆,但其并未保持一致表达。培养两个月后,对AcGFP1工程化iPSC进行批量分选以检测AcGFP1表达。使用明视野和荧光(GFP)显微术捕获分选后12天(图4B)或分选后23天细胞(图4C)中的GFP表达。对于其他绿色荧光蛋白,包括单体mNeonGreen和四聚体ZsGreen,也观察到类似的沉默。

图5A-5B:用NaBut处理重新激活沉默的转基因。在不含CpG的AcGPF1培养物中少数细胞被沉默(<3%的细胞,图3A)。对这些沉默的细胞进行单细胞分选并扩增,以进一步研究它们的沉默并探索克服沉默的方法。在分选出无GFP表达后两个月,使用1mM、0.5mM或1μM的NaBut处理沉默的不含CpG的AcGFP1克隆。在NaBut处理9天后,通过流式细胞术测定细胞的GFP表达百分比,观察到不含CpG的AcGFP1的剂量依赖性重新激活。在先导实验成功后,NaBut处理的持续时间延长至46天,NaBut处理剂量为0.25mM和0.5mM,并且通过荧光显微术和流式细胞术随时间监测GFP表达水平。初步结果得到证实(图5A和5B,深蓝色条:处理第8天)。在整个实验过程中,NaBut处理的剂量依赖性效应是明显的(图5A和5B)。

图6:iPSC 9650(不含CpG-AcGFP1位于AAVS1处)分化。iPSC 9650在整个肝细胞分化(通过CXCR4、AAT和ALB表达测量)和诱导性神经元(iN)分化(通过TUJ表达测量)过程中维持GFP表达。

图7A-7C:1069的质粒:WT PuroR(图7A),1362的质粒:不含CpG的PuroR1(图7B)和1363的质粒:不含CpG的PuroR1(图7C)。

图8:从iPSC 9650-GFP生成内皮细胞的方案的示意性描述,该iPSC 9650-GFP使用不含CpG AcGFP1在AAVS1处进行工程化改造。

图9:将适应低氧的iPSC铺在Purecoat Amine板上,以启动血管内皮细胞的生成,持续6天。分化第6天时,iPSC来源的血管内皮细胞的代表性照片显示了存在二维形式的血管内皮集落,同时保留了GFP表达。

图10:使用4倍物镜观察培养第2代时9650-GFP来源的内皮细胞的形态,显示出GFP/BF重叠。

图11:源自9650-GFP iPSC的内皮细胞的纯度。将适应低氧的iPSC铺在PurecoatAmine板上以启动血管内皮细胞的生成,随后重新铺板以生成可在多次传代中增殖的纯内皮细胞。在传代时通过流式细胞术针对CD31、CD144和CD105的共表达进行染色来对内皮细胞的纯度进行定量。

图12:将适应低氧的iPSC铺在Purecoat Amine板上以启动血管内皮细胞的生成,随后重新铺板以生成可在多次传代中增殖的纯内皮细胞。在多次传代中通过流式细胞术对GFP表达强度进行定量。

图13:从iPSC生成造血前体细胞(HPC)的方案的示意性描述。

图14A-14C:收获适应低氧的iPSC,并在13-15天内将其分化为3D聚集体形式的HPC。在HPC分化过程结束时收获细胞,通过对伴随着GFP(图14A)或RFP(图14C)表达的CD34、CD45、CD31、CD41和CD235表达进行染色来对HPC纯度进行定量,以显示荧光在末期HPC中的保留。MACS分离后GFP与CD34的共表达大于90%(图14B)。

图15.生成HPC的效率:对于8717和9650,1个输入iPSC分别产生0.766个和0.225个HPC。

图16:从HPC生成小胶质细胞的示意图。

图17A-17B:来自细胞系9650-GFP(图17A)和8717-RFP(图17B)的小胶质细胞分化的相位和荧光图像。

图18:生成造血前体细胞(HPC)的效率。将CD34+MACS分选的9650-GFP来源的HPC和未分选的8717-RFP分化为小胶质细胞。对输入HPC和输出小胶质细胞的总存活数量进行定量。根据小胶质细胞分化第23天时存在的CD34+阳性细胞的纯度和绝对数量除以输入存活HPC的绝对数量来计算过程效率。

图19C-19D:分别从8717-RFP(图19A)和9650-GFP(图19C)iPSC生成的小胶质细胞第23天时的纯度概况。收获末期小胶质细胞并对PU.1、IBA、CX3CR、TREM2和P2RY12表达的存在进行染色,通过流式细胞术对其进行定量。伴随着GFP或RFP在末期细胞中的保留,对标志物的共表达进行定量(图19B、19D)。

图20:从HPC生成末期巨噬细胞的示意性表述。

图21:将源自8717-RFP的HPC进一步分化,以生成末期巨噬细胞。在分化流程的第44天和第51天时,通过对CD68表达的存在进行染色来对末期巨噬细胞的纯度评估进行定量。

图22:在巨噬细胞分化过程的不同天数中,8717-RFP细胞系的相位和荧光图像。以10倍的放大倍数捕获图像。

图23:将8717-RFP iPSC来源的HPC分化为末期巨噬细胞。对输入HPC和输出巨噬细胞的总存活数量进行定量。根据巨噬细胞分化第51天时存在的CD68+阳性细胞的纯度和绝对数量除以输入存活HPC的绝对数量来计算过程效率。

图24:在整个分化过程中保持工程化荧光染料的存在。在将iPSC分化为HPC并使其进一步生成纯的末期小胶质细胞和巨噬细胞的整个过程中,9650-GFP和8717-RFP iPSC保持了荧光染料的存在。

图25:在未使用双重SMAD抑制的情况下,从iPSC生成神经前体细胞(NPC)的方法的示意性描述。描述了所涉及的各个步骤以及所用培养基的组成。

图26A-26B:(图26A)在NPC分化过程的2D预条件化阶段期间红色和绿色荧光的可视化。图26B在收获之前捕获末期3D NPC培养物的荧光。所有图像均使用4倍物镜拍摄。

图27:8717-RFP和9650-GFP来源的NPC冻融后纯度的定量。将NPC冻融并使用相关同种型对照针对SSEA4、CD56和CD15表达的存在进行染色。

图28:NPC向GABA能神经元的分化方案。将NPC置于3D分化培养物中,并在PLO-层粘连蛋白包被的板上转变为2D培养物。在第18天时收获末期神经元,并通过流式细胞术对巢蛋白和β-微管蛋白3的纯度进行定量。

图29A-29B:在GABA能神经元分化的第2天(3D)(图29A)和第18天时(2D)(图29B)拍摄的明视野和荧光图像。ULAT25培养瓶中的3D培养物和6孔PLO-层粘连蛋白包被板上的2D培养物。以10倍的放大倍数拍摄所有图像。

图30:未分化的工程化iPSC中以及在GABA能分化的第13天和第18天时末期神经元培养物中GFP和RFP表达的保留。第13天时的样品是先进行染色,之后再铺在PLO-层粘连蛋白上,而第18天时的培养物是在GABA能神经元分化结束时进行染色。

图31:在分化的第18天时,收获源自9650-GFP和8717-RFP iPSC培养物的GABA能神经元,并通过流式细胞术针对巢蛋白和β-微管蛋白纯度进行染色。对末期培养物中GFP或RFP与巢蛋白和微管蛋白的共表达进行了定量。

图32A-32B:(图32A)示出了标准化萤光素酶(萤火虫/海肾比值,标准化为EEF1A1=100%)(HSP90AB1del400启动子和HSP90AB1启动子的表达约为EEF1A1的66%和75%)。(图32B)使用CAG启动子作为示例进行质粒设计,用于控制ZsGreen荧光蛋白,并使其靶向人iPSC中19号染色体上的AAVS1(PPP1R12C)安全港基因座。

图33:将表达ZsGreen(ZsG)荧光蛋白的工程化iPSC细胞系维持培养长达7个月(E8培养基/玻连蛋白包被板)并在Accuri C6仪器(BD)上使用流式细胞术定期检查绿色表达。大多数克隆随着时间的推移保持一致的流式谱,但RPS19启动子克隆之一(5363)除外,该克隆在8月的时间点显示许多细胞的荧光减弱。该图示出了标准化为未工程化iPSC=1的中位荧光水平。

图34A-34B:(图34A)ZsGreen(ZsG)工程化iPSC细胞系的流式细胞术图。(图34B)在分化的第21天时,所有细胞都出现了可见的神经元表型。流式细胞术显示许多细胞的CAG、UBC(v1)和HSP90AB1del400启动子的荧光减弱。UBCv2、UBA52和RPS19启动子显示出密集且稳定的表达,标记基因HSP90AB1、CTNNB1和MYL6也是如此。

说明性实施方案的描述

DNA甲基化在调节基因表达中发挥重要作用,包括诱导转录抑制、阻止转录因子与DNA结合、一些转录因子与DNA结合的必要条件、募集HDAC复合物、X染色体失活和CpG基序的免疫原性,例如TLR9。当甲基转移酶将甲基添加到胞嘧啶磷酸-鸟嘌呤(CpG)中胞嘧啶的第五个碳(5-mC)上时,哺乳动物中就会发生DNA甲基化。DNMT3A和DNMT3B(DNA甲基转移酶)负责从头甲基化(即甲基化先前未甲基化的DNA),并且已经证明DNMT3B在iPSC中处于开启状态。DNMT1负责复制后半甲基化DNA的甲基化,并且被表征为一种维持性甲基转移酶。最近出现了去甲基化研究,其中已将Gadd45a鉴定为DNA修复中DNA去甲基化的重要参与者,并将TET和TDG鉴定为DNA中5-mC氧化和切除的重要参与者。

通过基因组工程将转基因添加到iPSC中为随着时间的推移以及在整个分化过程中监测转基因的表达提供了机会。绿色荧光蛋白(GFP)和红色荧光蛋白(RFP)广泛用于生成融合蛋白,而不会显著干扰天然蛋白的组装和功能,这使它们成为体内分析的强大工具,并成为生物标志物以监测祖细胞群和确定新生细胞谱系的动力学。如市场上缺乏表达绿色荧光蛋白(GFP)的iPSC或分化细胞所证明的,需要在整个广泛传代和分化过程中维持转基因表达的方法。具体而言,图1示出了GFP在iPSC中的斑驳状表达。

因此,在某些实施方案中,本公开提供了通过优化转基因的序列以去除CpG基序从而防止转基因的快速沉默来维持转基因在细胞系中表达的方法。甲基化是除了RNA相关沉默和组蛋白修饰之外的主要表观遗传机制。在本研究中,对墨绿多管水母(Aequoreacoerulescens)绿色荧光蛋白(AcGFP1)的DNA序列进行修饰以去除CpG基序,如图2所示。结果显示,不含CpG的AcGFP1表达稳定,而野生型AcGFP1表达不稳定(图3)。因此,本公开的方法允许防止由于全局甲基化或其他表观遗传失调而导致的转基因沉默。

在另外的实施方案中,提供了通过本文提供的新型启动子(例如,SEQ ID NO:1-12或17)驱动转基因表达或通过对一些基因诸如HSP90AB1、ACTB、CTNNB1或MYL6加标签驱动转基因表达来维持转基因在细胞系中表达的方法。

此外,可以将本公开的细胞系分化为特定细胞类型并维持转基因的表达达3个月、6个月,或甚至超过12个月。在特定方面,将细胞系培养达至少30天,诸如至少2个月、3个月、4个月、5个月或更长时间。在特定方面,将细胞系培养超过六个月,诸如超过一年、超过两年或超过三年。在特定方面,细胞系稳定表达转基因达至少30天,诸如至少2个月、3个月、4个月、5个月或更长时间。在特定方面,细胞系稳定表达转基因超过六个月,诸如超过一年、超过两年或超过三年。在另外的方面,提供了用于细胞测定的方法,以使用本公开的细胞系进行细胞活力测定和筛选测定。

I.定义

术语“纯化的”并不要求绝对纯度;相反,它意在作为一个相对术语。因此,纯化的细胞群的纯度大于约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或是100%纯,或者最优选地,基本上不含其他细胞类型。

如本文所用的,术语“稳定表达”指的是比未修饰的序列更稳定的表达。举例来说,稳定表达可以指在一段时间诸如一个月、六个月、一年或超过一年内保持不变的表达。

就特定组分而言,如本文所用的“基本上不含”在本文中用于表示未将任何特定组分有意配制到组合物中和/或特定组分仅作为污染物存在或以痕量存在。因此,由组合物的任何非意图的污染引起的特定组分的总量远低于0.05%,优选低于0.01%。最优选的是这样一种组合物,其中用标准分析方法检测不到任何量的特定组分。

如本文在说明书中所用的,“一个”或“一种”可以表示一个/种或多个/种。如本文在一项或多项权利要求中所用的,当与词语“包含/包括”结合使用时,单词“一个”或“一种”可以表示一个/种或多于一个/种。

权利要求中使用术语“或”用于表示“和/或”,除非明确说明指的仅是备选方案或备选方案相互排斥,尽管本公开支持仅指备选方案和指“和/或”的定义。如本文所用的,“另一个/种”可以表示至少第二个/种或更多个/种。

术语“基本上”应理解为方法或组合物仅包括特定的步骤或材料,以及不会实质上影响这些方法和组合物的基本和新特征的那些步骤或材料。

术语“实质上不含/基本上不含”用于表示98%的所列组分和少于2%的组合物或颗粒实质上不含的组分。

如本文所用的术语“实质上”或“近似地”,可用于修饰任何定量的比较、值、测量或其他表述,可以允许它们变动,而不会导致与其相关的基本功能发生变化。

一般来说,术语“约”是指处于使用标准分析技术测量规定值时所确定的所述值的标准差范围内。该术语也可以用于指所述值的加或减5%。

如本文所用的,与野生型序列“实质上”相似的序列包含的GC含量百分比与野生型GC含量百分比相差5%以内。

术语“细胞群”在本文中用于指一组细胞,通常是共同类型的细胞。细胞群可以源自共同的祖细胞或者可以包含多于一种细胞类型。“富集”细胞群指的是源自起始细胞群(例如,未分级的异质性细胞群)的细胞群,其含有的特定细胞类型的百分比高于该细胞类型在起始细胞群中的百分比。细胞群可以富含一种或多种细胞类型并消耗了一种或多种细胞类型。

术语“干细胞”在本文中指的是在合适的条件下能够分化成范围广泛的多种特化细胞类型,而在其他合适的条件下能够自我更新并保持基本上未分化的多能状态的细胞。术语“干细胞”还涵盖多能细胞、专能(multipotent)细胞、前体细胞和祖细胞。示例性人类干细胞可以获自从骨髓组织中获得的造血或间充质干细胞、从胚胎组织中获得的胚胎干细胞或者从胎儿生殖器组织中获得的胚胎生殖细胞。示例性多能干细胞还可以通过表达与多能性相关的某些转录因子将体细胞重编程为多能状态而由体细胞产生;将这些细胞称为“诱导性多能干细胞”或“iPSC”。

术语“多能”指的是细胞分化为生物体中除胚外或胎盘细胞之外的所有其他细胞类型的特性。即使经过长期培养,多能干细胞也能够分化为所有三个胚层的细胞类型(例如,外胚层、中胚层和内胚层细胞类型)。多能干细胞可以是源自胚泡的内细胞团或通过核移植产生的胚胎干细胞。在其他实施方案中,多能干细胞是通过体细胞重编程而衍生的诱导性多能干细胞。

术语“分化”指的是非特化细胞变成更特化类型的过程,其中结构和/或功能特性发生变化。成熟细胞通常具有改变的细胞结构和组织特异性蛋白质。

如本文所用的,“未分化”指的是显示出未分化细胞的特征性标志物和形态学特征的细胞,这些标志物和形态学特征清楚地将其与胚胎或成体来源的终末分化细胞区分开来。

“胚状体(EB)”是多能干细胞的聚集体,其可以分化成内胚层、中胚层和外胚层的细胞。当允许多能干细胞在非贴壁培养条件下聚集时,会形成球体结构,从而形成悬浮状态的EB。

“分离的”细胞已从生物体或培养物中的其他细胞中实质性划分或纯化出来。举例来说,分离的细胞的纯度可以是至少99%、至少98%、至少95%或至少90%。

如本文所用的“细胞系”指的是源自一个细胞的细胞集合。可以将细胞系保持在培养管、培养瓶或培养皿中的生长培养基中。细胞系可以通过从允许扩增至多个细胞的单细胞的克隆扩增来形成。细胞系可以包含遗传上相同的细胞,并且可以以培养状态维持一段时间,例如几个月或几年。

“胚胎”指的是由接合子或具有人工重编程细胞核的活化卵母细胞通过一次或多次分裂而获得的细胞团。

“胚胎干(ES)细胞”是未分化的多能细胞,其获自早期胚胎,诸如胚泡期的内细胞团,或者通过人工方式(例如,核移植)产生,并且可以产生胚胎或成体中的任何分化的细胞类型,包括生殖细胞(例如,精子和卵子)。

“诱导性多能干细胞(iPSC)”是通过表达或诱导表达一系列因子(本文称为重编程因子)来重编程体细胞而生成的细胞。iPSC可以使用胎儿、出生后、新生儿、幼年或成人体细胞来产生。在某些实施方案中,可用于将体细胞重编程为多能干细胞的因子包括,例如Oct4(有时称为Oct3/4)、Sox2、c-Myc和Klf4、Nanog以及Lin28。在一些实施方案中,通过表达至少两种重编程因子、至少三种重编程因子或四种重编程因子来重编程体细胞,以将体细胞重编程为多能干细胞。

“无饲养层”或“不依赖饲养层”在本文中用于指作为饲养细胞层的替代物的补充有细胞因子和生长因子(例如,TGFβ、bFGF、LIF)的培养物。因此,“无饲养层”或不依赖饲养层的培养系统和培养基可用于培养多能细胞并将其维持在未分化和增殖状态。在一些情况下,无饲养层培养物利用基于动物的基质(例如,MATRIGEL

“饲养层”在本文中定义为细胞的包被层,诸如位于培养皿底部的上面。饲养细胞可以将营养物质释放到培养基中,并且提供一个表面,让其他细胞诸如多能干细胞可以附着在上面。

当与培养基、胞外基质或培养条件相关使用时,术语“确定的”或“完全确定的”是指其中几乎所有组分的化学组成和量都是已知的培养基、胞外基质或培养条件。举例来说,确定的培养基不含未确定的因子,诸如胎牛血清、牛血清白蛋白或人血清白蛋白中未确定的因子。总体来说,确定的培养基包括补充有重组白蛋白、化学确定的脂质和重组胰岛素的基础培养基(例如,杜氏改良Eagle培养基(DMEM)、F12或洛斯维·帕克纪念研究所培养基(RPMI)1640,含有氨基酸、维生素、无机盐、缓冲剂、抗氧化剂和能源)。完全确定的培养基的一个示例是Essential 8

对于用于人类细胞的培养基、胞外基质或培养系统,术语“无异种成分(Xeno-Free,XF)”是指其中所用材料不属于非人动物来源的条件。

II.工程化细胞系

在一些实施方案中,本文提供了经工程化改造以表达稳定表达的转基因的细胞系。稳定表达可以通过对转基因序列进行密码子优化以去除CpG基序、通过新型启动子(例如,SEQ ID NO:1-12或17)驱动表达或者通过带内源性基因(例如,HSP90AB1、ACTB、CTNNB1或MYL6)标记驱动表达来实现。

如本文所用的,“CpG基序”指的是核苷酸含有胞嘧啶“C”,后跟磷酸键“p”和鸟嘌呤“G”。提及“去除CpG基序”是指修饰C和/或G核苷酸以去除该基序。如本文所用的,就核酸分子而言,“人源化”意指核酸分子的序列或一部分序列与人类序列相似或非常相似,或者以其他方式使该分子在人类细胞中更具功能性。举例来说,可以基于人类中已知的密码子使用来优化密码子以供人类使用,从而增强核酸在人类细胞中表达的有效性,例如,实现更快的翻译速率和高准确性。

表1.示例性替换密码子。

/>

通过甲基化使基因关闭的过程可以由一系列级联事件来解释,这些级联事件最终导致染色质结构发生变化,形成转录弱化状态。基因中5'-CpG-3'的甲基化与甲基化DNA序列结合,同时与组蛋白去乙酰化酶(MBD-HDAC)和转录抑制蛋白(转录矫正蛋白)结合。人工基因合成技术允许合成选自这种可能性的任何核苷酸序列,其中由相应基因编码的氨基酸序列优选保持不变。经修饰的靶核酸序列由长寡核苷酸生成,例如通过逐步PCR,如实施例中所述,或者对于常规基因合成,由专业供应商(例如,Geneart GmbH、Qiagen AG)提供。

在一些方面,转基因中所有可以在遗传密码范围内去除的CpG都被去除。然而,也可以去除较少的CpG,例如50%、60%、75%、80%、85%、90%、95%、96%、97%、98%或99%。根据本公开的密码子优化构建体可以例如通过选择与所用表达系统中相同的密码子分布来制备。表达系统可以是哺乳动物系统,例如人类系统。优选地,密码子优化因此与人类基因的密码子选择相匹配。

在智人中,一些密码子的丰度较低,而其他密码子的丰度则适中或较高。如本文所用的,“稀有密码子”指的是在智人中频率小于0.2的密码子。为了避免在修饰DNA序列时使用稀有密码子,可以使用密码子频率表来选择频率至少为0.3的密码子,诸如至少为0.4、0.5、0.6、0.7、0.8或0.9的密码子。

表2.智人中的密码子频率。

举例来说,当修饰编码L即亮氨酸的序列时,有6种密码子需要评估(此处列为:密码子+频率):UUA 8%、UUG 13%、CUU 13%、CUC 20%、CUA 7%或CUG 40%。如果亮氨酸密码子CUC后面跟着一个以G开头的密码子,则出现CG基序,并且为了去除CG基序和避免使用稀有密码子,将亮氨酸密码子修饰为CUG比其他4种密码子更优选。

可以使用密码子CCC来完成对脯氨酸的密码子如CCG的修饰,以去除CG基序,但是如果蛋白质区域包含几个脯氨酸,则这种修饰将产生单核苷酸延伸重复。因此,其他密码子,例如CCU或CCA,可用于脯氨酸以避免单核苷酸延伸。如本文所用的,“单核苷酸延伸”指的是连续至少六个相同核苷酸的区域,诸如CCCCCC。

转基因序列可以编码RNA、衍生物或模拟物、肽或多肽、经修饰的肽或多肽、蛋白质或其经修饰的蛋白质。转基因还可以是不同野生型序列的嵌合和/或组装序列,例如,可以编码融合蛋白或嵌合型组装多基因构建体。转基因也可以包括合成序列。在这方面,核酸序列可以合成建模,例如通过使用计算机模型。

待表达的转基因可以是任何蛋白质的基因序列,例如重组蛋白、人工多肽、融合蛋白及其等同物。在一些方面,转基因是诊断性和/或治疗性肽、多肽或蛋白质。在一些方面,转基因是报告基因,例如但不限于GFP、RFP、萤光素酶、β-半乳糖苷酶或氯霉素乙酰转移酶。在一些方面,转基因是LacZ、mSEAP或Lucia。肽/蛋白质包括,例如,i)人类的酶(例如,天冬酰胺酶、腺苷脱氨酶、胰岛素、tPA、凝血因子、维生素K环氧化物还原酶),激素(例如,erythro),产生治疗性蛋白诸如促血细胞生成素、卵泡刺激素、雌激素)以及其他人源性蛋白质(例如,成骨蛋白、抗凝血酶),ii)可以用作疫苗的病毒蛋白、细菌蛋白,或源自寄生物的蛋白(例如,HIV、HBV、HCV、流感病毒、包柔氏螺旋体菌、嗜血杆菌(Haemophilus)、脑膜炎球菌、炭疽、肉毒杆菌毒素、白喉毒素、破伤风毒素、疟原虫等),或者iii)诊断剂。转基因可以是启动子或选择基因,例如杀稻瘟素或新霉素。

A.诱导性多能干细胞

在一些实施方案中,工程化的细胞系是iPSC。多能性的诱导最初于2006年使用小鼠细胞(Yamanaka等人2006)并于2007年使用人类细胞(Yu等人2007;Takahashi等人2007)通过导入与多能性相关的转录因子对体细胞进行重编程而实现。多能干细胞可以维持在未分化状态,并且可以分化成任何成体细胞类型。

除了生殖细胞外,任何体细胞都可以作为iPSC的起始点。举例来说,细胞类型可以是角质形成细胞、成纤维细胞、造血细胞、间充质细胞、肝细胞或胃细胞。T细胞也可以作为体细胞的来源用于重编程(美国专利号8,741,648)。对细胞分化的程度或从中收集细胞的动物年龄没有限制;在本文公开的方法中,甚至未分化的祖细胞(包括体干细胞)和终末分化的成熟细胞也可以用作体细胞的来源。iPSC可以在已知将人类ES细胞分化为特定细胞类型的条件下生长,并表达人类ES细胞标志物,包括:SSEA-1、SSEA-3、SSEA-4、TRA-1-60和TRA-1-81。

A.HLA匹配

主要组织相容性复合体(MHC)是同种异体器官移植免疫排斥的主要原因。有三种主要的I类MHC单体型(A、B和C)和三种主要的MHC II类单体型(DR、DP和DQ)。

如果供体细胞是HLA纯合的,即对于每种抗原呈递蛋白都含有相同的等位基因,则供体和接受体之间的MHC相容性会显著增加。大多数个体的MHC I类和II类基因是杂合的,但某些个体的这些基因是纯合的。这些纯合个体可以作为超级供体,从其细胞生成的移植物可以移植到对该单体型纯合或杂合的所有个体中。此外,如果纯合供体细胞具有在群体中出现频率高的单体型,则这些细胞可能应用于大量个体的移植疗法。

相应地,iPSC可以从要治疗的受试者的体细胞产生,或者从与患者具有相同或实质上相同的HLA类型的另一受试者的体细胞产生。在一种情况下,供体的主要HLA(例如,HLA-A、HLA-B和HLA-DR的三个主要基因座)与接受体的主要HLA相同。在某些情况下,体细胞供体可能是超级供体;因此,源自MHC纯合超级供体的iPSC可用于生成分化细胞。因此,可以将源自超级供体的iPSC移植到该单体型为纯合或杂合的受试者中。举例来说,iPSC在两个HLA等位基因诸如HLA-A和HLA-B上可能是纯合的。因此,从超级供体产生的iPSC可以用于本文公开的方法中,以产生可能与大量潜在接受体“匹配”的分化细胞。

B.重编程因子

可以使用本领域技术人员已知的方法对体细胞进行重编程以产生诱导性多能干细胞(iPSC)。本领域技术人员可以容易地产生诱导性多能干细胞;参见,例如已公布的美国专利申请号20090246875、已公布的美国专利申请号2010/0210014;已公布的美国专利申请号20120276636;美国专利号8,058,065;美国专利号8,129,187;美国专利号8,278,620;PCT公布号WO 2007/069666 A1和美国专利号8,268,620,其通过引用方式并入本文。总体来说,核重编程因子用于从体细胞产生多能干细胞。在一些实施方案中,使用Klf4、c-Myc、Oct3/4、Sox2、Nanog和Lin28中的至少两种、至少三种或至少四种。在其他实施方案中,使用Oct3/4、Sox2、c-Myc和Klf4。在一些方面,使用五种、六种、七种或八种重编程因子。

使用核重编程物质处理细胞,这些核重编程物质通常是能够从体细胞诱导出iPSC的一种或多种因子或者是编码这些物质的核酸(包括整合在载体中的形式)。核重编程物质通常至少包括Oct3/4、Klf4和Sox2或编码这些分子的核酸。可以将p53的功能性抑制剂、L-myc或者编码L-myc的核酸以及Lin28或Lin28b或者编码Lin28或Lin28b的核酸用作另外的核重编程物质。Nanog也可以用于核重编程。如在已公布的美国专利申请号20120196360中所公开的,用于产生iPSC的示例性重编程因子包括(1)Oct3/4、Klf4、Sox2、L-Myc(可以将Sox2替换为Soxl、Sox3、Soxl5、Soxl7或Soxl8;可以将Klf4替换为Klfl、Klf2或Klf5);(2)Oct3/4、Klf4、Sox2、L-Myc、TERT、SV40大T抗原(SV40LT);(3)Oct3/4、Klf4、Sox2、L-Myc、TERT、人乳头瘤病毒(HPV)16E6;(4)Oct3/4、Klf4、Sox2、L-Myc、TERT、HPV16 E7;(5)Oct3/4、Klf4、Sox2、L-Myc、TERT、HPV16 E6、HPV16 E7;(6)Oct3/4、Klf4、Sox2、L-Myc、TERT、Bmil;(7)Oct3/4、Klf4、Sox2、L-Myc、Lin28;(8)Oct3/4、Klf4、Sox2、L-Myc、Lin28、SV40LT;(9)Oct3/4、Klf4、Sox2、L-Myc、Lin28、TERT、SV40LT;(10)Oct3/4、Klf4、Sox2、L-Myc、SV40LT;(11)Oct3/4、Esrrb、Sox2、L-Myc(可以将Esrrb替换为Esrrg);(12)Oct3/4、Klf4、Sox2;(13)Oct3/4、Klf4、Sox2、TERT、SV40LT;(14)Oct3/4、Klf4、Sox2、TERT、HP VI 6E6;(15)Oct3/4、Klf4、Sox2、TERT、HPV16 E7;(16)Oct3/4、Klf4、Sox2、TERT、HPV16 E6、HPV16 E7;(17)Oct3/4、Klf4、Sox2、TERT、Bmil;(18)Oct3/4、Klf4、Sox2、Lin28;(19)Oct3/4、Klf4、Sox2、Lin28、SV40LT;(20)Oct3/4、Klf4、Sox2、Lin28、TERT、SV40LT;(21)Oct3/4、Klf4、Sox2、SV40LT;或者(22)Oct3/4、Esrrb、Sox2(可以将Esrrb替换为Esrrg)。在一个非限制性实例中,使用Oct3/4、Klf4、Sox2和c-Myc。在其他实施方案中,使用Oct4、Nanog和Sox2;参见,例如美国专利号7,682,828,其通过引用方式并入本文。这些因子包括但不限于Oct3/4、Klf4和Sox2。在其他实例中,因子包括但不限于Oct 3/4、Klf4和Myc。在一些非限制性实例中,使用Oct3/4、Klf4、c-Myc和Sox2。在其他非限制性实例中,使用Oct3/4、Klf4、Sox2和Sal 4。一些因子如Nanog、Lin28、Klf4或c-Myc可以提高重编程效率,并且可以从几种不同的表达载体中表达。举例来说,可以使用整合型载体,例如基于EBV元件的系统(美国专利号8,546,140)。在另一方面,可以通过蛋白转导将重编程蛋白直接导入体细胞。重编程可以进一步包括使细胞与一种或多种信号传导受体接触,这些信号传导受体包括糖原合酶激酶3(GSK-3)抑制剂、促分裂原活化的蛋白激酶激酶(MEK)抑制剂、转化生长因子β(TGF-β)受体抑制剂或信号传导抑制剂、白血病抑制因子(LIF)、p53抑制剂、NF-κB抑制剂或其组合。那些调节剂可能包括小分子、抑制性核苷酸、表达盒或蛋白质因子。预计几乎可以使用任何iPS细胞或细胞系。

参考WO 2007/069666中提到的NCBI登录号,可以获得这些核重编程物质的小鼠和人cDNA序列,该专利申请通过引用方式并入本文。用于导入一种或多种重编程物质或者编码这些重编程物质的核酸的方法是本领域已知的,并且公开于例如已公布的美国专利申请号2012/0196360和美国专利号8,071,369中,这两篇文献都通过引用方式并入本文。

一旦衍生出来,可以将iPSC在足以维持多能性的培养基中培养。iPSC可以与开发用于培养多能干细胞,更具体地说是胚胎干细胞的各种培养基和技术一起使用,如描述于美国专利号7,442,548和美国专利公布号2003/0211603的。在小鼠细胞的情况下,在普通培养基中添加作为分化抑制因子的白血病抑制因子(LIF)来进行培养。在人类细胞的情况下,需要添加碱性成纤维细胞生长因子(bFGF)来代替LIF。可以使用本领域技术人员已知的用于培养和维持iPSC的其他方法。

在某些实施方案中,可以使用未确定的条件;例如,可以将多能细胞在成纤维细胞饲养细胞或已暴露于成纤维细胞饲养细胞的培养基上培养,以维持干细胞处于未分化状态。在一些实施方案中,将细胞在经过辐照或抗生素处理以终止细胞分裂的小鼠胚胎成纤维细胞作为饲养细胞的共存下培养。备选地,可以使用确定的且不依赖饲养层的培养系统,诸如TESR

C.质粒

在一些实施方案中,可以对iPSC进行修饰以表达外源性核酸,例如包括与启动子可操作地连接的增强子和编码第一标志物的核酸序列。该构建体还可以包括其他元件,诸如用于翻译起始的核糖体结合位点(内部核糖体结合序列)和转录/翻译终止子。总体来说,用该构建体转染细胞是有利的。用于稳定转染的合适载体包括但不限于逆转录病毒载体、慢病毒载体和仙台病毒。

在一些实施方案中,编码标志物的质粒由以下构成:(1)高拷贝数复制起点,(2)可选择标志物,例如但不限于用于卡那霉素抗生素筛选的新霉素抗性基因,(3)转录终止序列,包括酪氨酸酶增强子,和(4)用于引入各种核酸盒的多克隆位点;以及(5)编码与酪氨酸酶启动子可操作地连接的标志物的核酸序列。本领域已知有许多质粒载体用于诱导编码蛋白质的核酸。这些包括但不限于在以下文献中公开的载体:美国专利号6,103,470;美国专利号7,598,364;美国专利号7,989,425;和美国专利号6,416,998,这些文献通过引用方式并入本文。在一些方面,该质粒包含“自杀基因”,在施用前药或药物后,该基因会使基因产物转化为杀伤其宿主细胞的化合物。可以使用的自杀基因、前药或药物组合的实例是例如但不限于截短型EGFR和西妥昔单抗;单纯疱疹病毒-胸苷激酶(HSV-tk)和更昔洛韦、阿昔洛韦或FIAU;氧化还原酶和放线菌酮;胞嘧啶脱氨酶和5-氟胞嘧啶;胸苷激酶胸苷酸激酶(Tdk::Tmk)和AZT;以及脱氧胞苷激酶和阿糖胞苷。

病毒基因递送系统可以是基于RNA或基于DNA的病毒载体。游离型基因递送系统可以是质粒、基于EB病毒(EBV)的游离型载体、基于酵母的载体、基于腺病毒的载体、基于猿猴病毒40(SV40)的游离型载体、基于牛乳头瘤病毒(BPV)的载体或慢病毒载体。

标志物包括但不限于荧光蛋白(例如,绿色荧光蛋白或红色荧光蛋白)、酶(例如,辣根过氧化物酶或碱性磷酸酶或萤火虫/海肾萤光素酶或nanoluc)或者其他蛋白质。标志物可以是蛋白质(包括分泌型、细胞表面型或内部蛋白质;由细胞合成或摄取);核酸(诸如mRNA或酶活性核酸分子)或多糖。包括任何此类细胞组分的决定簇,其可通过对所关注细胞类型的标志物具有特异性的抗体、凝集素、探针或核酸扩增反应来检测。标志物还可以通过生化或酶测定法或者依赖于基因产物功能的生物响应来鉴定。编码这些标志物的核酸序列可以与酪氨酸酶增强子可操作地连接。另外,还可以包括其他基因,例如可能影响干细胞分化或细胞功能或生理学或病理学的基因。

D.递送系统

将核酸诸如DNA或RNA导入本公开的工程化细胞系中可以使用任何合适的核酸递送方法以转化细胞,如本文所述的或如本领域普通技术人员已知的方法。此类方法包括但不限于直接递送DNA,例如通过离体转染(Wilson等人,1989,Nabel等人,1989),通过注射(美国专利号5,994,624、5,981,274、5,945,100、5,780,448、5,736,524、5,702,932、5,656,610、5,589,466和5,580,859,每篇文献都通过引用方式并入本文),包括显微注射(Harland和Weintraub,1985;美国专利号5,789,215,通过引用方式并入本文);通过电穿孔(美国专利号5,384,253,通过引用方式并入本文;Tur-Kaspa等人,1986;Potter等人,1984);通过磷酸钙沉淀(Graham和Van Der Eb,1973;Chen和Okayama,1987;Rippe等人,1990);通过使用DEAE-葡聚糖继之以聚乙二醇(Gopal,1985);通过直接声波加载(sonic loading)(Fechheimer等人,1987);通过脂质体介导的转染(Nicolau和Sene,1982;Fraley等人,1979;Nicolau等人,1987;Wong等人,1980;Kaneda等人,1989;Kato等人,1991)和受体介导的转染(Wu和Wu,1987;Wu和Wu,1988);通过微弹轰击(PCT申请号WO 94/09699和95/06128;美国专利号5,610,042;5,322,783、5,563,055、5,550,318、5,538,877和5,538,880,并且每篇文献都通过引用方式并入本文);通过碳化硅纤维搅动(Kaeppler等人,1990;美国专利号5,302,523和5,464,765,每篇文献都通过引用方式并入本文);通过土壤杆菌(Agrobacterium)介导的转化(美国专利号5,591,616和5,563,055,每篇文献都通过引用方式并入本文);通过脱水/抑制介导的DNA摄取(Potrykus等人,1985),以及此类方法的任意组合。通过应用诸如这些技术,可以稳定或瞬时转化一个或多个细胞器、一个或多个细胞、一个或多个组织或者一个或多个生物体。

1.病毒载体

在本公开的某些方面中可以提供病毒载体。在生成重组病毒载体时,通常将非必要基因替换为异源性(或非天然)蛋白质的基因或编码序列。病毒载体是一种利用病毒序列将核酸和可能的蛋白质导入细胞的表达构建体。某些病毒能够通过受体介导的胞吞作用感染细胞或进入细胞,以及整合到宿主细胞基因组中并稳定有效地表达病毒基因,这使得它们成为将外来核酸转移到细胞(例如,哺乳动物细胞)中的诱人候选者。下文描述了可用于递送本公开某些方面的核酸的病毒载体的非限制性实例。

逆转录病毒有望成为基因递送载体,因为它们能够将其基因整合到宿主基因组中,转移大量外来遗传材料,感染广泛的物种和细胞类型,并且包装在特殊的细胞系中(Miller,1992)。

为了构建逆转录病毒载体,将核酸插入病毒基因组中以代替某些病毒序列,从而产生复制缺陷型病毒。为了产生病毒体,构建了一种含有gag、pol和env基因但不含LTR和包装组件的包装细胞系(Mann等人,1983)。当将含有cDNA以及逆转录病毒LTR和包装序列的重组质粒导入特殊的细胞系时(例如,通过磷酸钙沉淀),包装序列允许重组质粒的RNA转录本包装成病毒颗粒,然后将其分泌到培养基中(Nicolas和Rubenstein,1988;Temin,1986;Mann等人,1983)。然后收集含有重组逆转录病毒的培养基,任选进行浓缩,并用于基因转移。逆转录病毒载体能够感染很多种细胞类型。然而,整合和稳定表达需要宿主细胞的分裂(Paskind等人,1975)。

慢病毒是复杂的逆转录病毒,其除了常见的逆转录病毒基因gag、pol和env外,还包含其他具有调节或结构功能的基因。慢病毒载体是本领域众所周知的(参见,例如Naldini等人,1996;Zufferey等人,1997;Blomer等人,1997;美国专利6,013,516和5,994,136)。

重组慢病毒载体能够感染非分裂细胞,并可用于体内和离体基因转移和核酸序列表达。举例来说,在美国专利5,994,136中描述了能够感染非分裂细胞的重组慢病毒,其中合适的宿主细胞用两种或更多种携带包装功能(即gag、pol和env,以及rev和tat)的载体转染,该专利通过引用方式并入本文。

2.游离型载体

在本公开的某些方面,还可以提供使用基于质粒或脂质体的染色体外(即游离型)载体。这种游离型载体可以包括例如基于oriP的载体,和/或编码EBNA-1衍生物的载体。这些载体可以允许将大片段DNA导入细胞并维持在染色体外,每个细胞周期复制一次,有效地分配到子细胞,并且实质上不引起免疫应答。

尤其地,EBNA-1是基于oriP的表达载体复制所需的唯一病毒蛋白,其不会引起细胞免疫应答,因为它已经形成一种有效的机制可以绕过在MHC I类分子上呈递其抗原所需的处理过程(Levitskaya等人,1997)。此外,EBNA-1可以以反式方式发挥作用以增强克隆基因的表达,在一些细胞系中诱导克隆基因的表达高达100倍(Langle-Rouault等人,1998;Evans等人,1997)。最后,制备这种基于oriP的表达载体成本低廉。

在某些方面,重编程因子由包含在一种或多种外源游离型基因元件中的表达盒表达(参见美国专利公布2010/0003757,其通过引用方式并入本文)。因此,iPSC可以基本上不含外源性基因元件,诸如来自逆转录病毒或慢病毒载体的元件。这些iPSC通过使用染色体外复制型载体(即游离型载体)来制备,这些载体能够以游离方式进行复制,以使iPSC基本上不含外源性载体或病毒元件(参见美国专利号8,546,140,其通过引用方式并入本文;Yu等人,2009)。一些DNA病毒,诸如腺病毒、猿猴空泡病毒40(SV40)或牛乳头瘤病毒(BPV),或者含有芽殖酵母ARS(自主复制序列)的质粒在哺乳动物细胞中以染色体外或游离方式进行复制。这些游离型质粒本质上没有与整合型载体相关的所有这些缺点(Bode等人,2001)。举例来说,基于嗜淋巴细胞疱疹病毒包括如上文定义的EB病毒(EBV)的载体,可以在染色体外复制,并有助于将重编程基因递送至体细胞。有用的EBV元件是OriP和EBNA-1,或者它们的变体或功能等同物。游离型载体的另一个优点是,外源性元件在导入细胞后会随着时间的推移而消失,从而产生基本上不含这些元件的自我维持性iPSC。

其他染色体外载体包括其他基于嗜淋巴细胞疱疹病毒的载体。嗜淋巴细胞疱疹病毒是一种在淋巴母细胞(例如,人B淋巴母细胞)中复制并变成其自然生命周期一部分的质粒的疱疹病毒。单纯疱疹病毒(HSV)并不是“嗜淋巴细胞”疱疹病毒。示例性嗜淋巴细胞疱疹病毒包括但不限于EBV、卡波西氏肉瘤疱疹病毒(KSHV);松鼠猴疱疹病毒(HS)和马立克病病毒(MDV)。另外,还考虑了基于附加体的载体的其他来源,例如酵母ARS、腺病毒、SV40或BPV。

本领域技术人员完全有能力通过标准重组技术构建载体(参见,例如Maniatis等人,1988和Ausubel等人,1994,这两篇文献都通过引用方式并入本文)。

载体还可以包括其他组分或功能,其进一步调节基因递送和/或基因表达,或者以其他方式为所靶向细胞提供有益特性。此类其他组分包括例如影响结合或靶向细胞的组分(包括介导细胞类型或组织特异性结合的组分);影响细胞摄取载体核酸的组分;影响摄取后多核苷酸在细胞内定位的组分(诸如介导核定位的作用剂);以及影响多核苷酸表达的组分。

此类组分还可包括标志物,例如可检测标志物和/或选择标志物,其可用于检测或选择已摄取并表达由载体递送的核酸的细胞。此类组分可以作为载体的天然特征提供(诸如使用具有介导结合和摄取的组分或功能的某些病毒载体),或者可以对载体进行修饰以提供这种功能。多种此类载体是本领域已知的并且通常是可获得的。当载体维持在宿主细胞中时,该载体可以在有丝分裂期间作为自主结构由细胞稳定复制,并入宿主细胞的基因组中或者维持在宿主细胞的细胞核或细胞质中。

3.调节元件

可用于本公开的重编程载体中包含的表达盒优选含有(按照5'-至-3'方向)与蛋白质编码序列可操作地连接的真核转录启动子、包括间插序列的剪接信号和转录终止/多腺苷酸化序列。

a.启动子/增强子

本文提供的表达构建体包含驱动重编程基因表达的启动子。启动子通常包含用于定位RNA合成起始位点的序列。这方面最著名的实例是TATA盒,但是在一些缺乏TATA盒的启动子,例如哺乳动物末端脱氧核苷酰转移酶基因的启动子和SV40晚期基因的启动子中,覆盖起始位点本身的离散元件有助于固定起始位置。另外的启动子元件调节转录起始的频率。通常情况下,这些位于起始位点上游30-110bp的区域,尽管已经证明一些启动子也含有起始位点下游的功能性元件。为了使编码序列处于启动子的“控制之下”,将转录阅读框的转录起始位点的5'端置于所选启动子的“下游”(即3'方向)。“上游”启动子刺激DNA的转录并促进编码RNA的表达。

启动子元件之间的间距通常是灵活的,因此当元件相对于彼此反转或移动时,启动子功能得以保留。在tk启动子中,可将启动子元件之间的间距增加到50bp,然后活性才开始下降。根据启动子的不同,似乎各个元件可以合作或独立地发挥作用以激活转录。启动子可以与或可以不与“增强子”结合使用,“增强子”是指参与核酸序列的转录激活的顺式作用调节序列。

启动子可以是与核酸序列天然相关的启动子,这可以通过分离位于编码区段和/或外显子上游的5'非编码序列来获得。这种启动子可以称为“内源性的”。类似地,增强子可以是与核酸序列天然相关的增强子,位于该序列的下游或上游。备选地,通过将编码核酸区段置于重组或异源启动子的控制下,将获得某些优势,该启动子指的是在其自然环境中通常不与核酸序列相关的启动子。重组或异源增强子也指在其自然环境中通常不与核酸序列相关的增强子。此类启动子或增强子可以包括其他基因的启动子或增强子,和从任何其他病毒或原核或真核细胞中分离出的启动子或增强子,以及非“天然存在”的启动子或增强子,即含有不同转录调节区域的不同元件,和/或改变表达的突变。举例来说,重组DNA构建中最常用的启动子包括β-内酰胺酶(青霉素酶)、乳糖和色氨酸(trp)启动子系统。除了以合成方式产生启动子和增强子的核酸序列之外,还可以结合本文公开的组合物,使用重组克隆和/或核酸扩增技术,包括PCRTM,来产生序列(参见美国专利号4,683,202和5,928,906,每篇文献都通过引用方式并入本文)。而且,可以设想的是,也可以使用指导非细胞核的细胞器诸如线粒体、叶绿体等中的序列转录和/或表达的调控序列。

当然,重要的是使用启动子和/或增强子来有效地指导DNA区段在选定用于表达的细胞器、细胞类型、组织、器官或生物体中的表达。分子生物学领域的技术人员通常了解使用启动子、增强子和细胞类型组合来表达蛋白质(参见,例如Sambrook等人,1989,其通过引用方式并入本文)。所用的启动子可以是组成型的、组织特异性的、诱导型的,和/或在合适的条件下可用于指导所导入的DNA区段的高水平表达,例如有利于重组蛋白和/或肽的大规模生产。启动子可以是异源的或内源性的。

另外,任何启动子/增强子组合(例如,根据真核生物启动子数据库EPDB)也可用于驱动表达。使用T3、T7或SP6细胞质表达系统是另一个可能的实施方案。如果提供适当的细菌聚合酶,无论是作为递送复合物的一部分还是作为另外的基因表达构建体,真核细胞可以支持从某些细菌启动子的细胞质转录。

启动子的非限制性实例包括早期或晚期病毒启动子,诸如SV40早期或晚期启动子、巨细胞病毒(CMV)立即早期启动子、劳斯肉瘤病毒(RSV)早期启动子;真核细胞启动子,诸如β肌动蛋白启动子(Ng,1989;Quitsche等人,1989)、GADPH启动子(Alexander等人,1988,Ercolani等人,1988)、金属硫蛋白启动子(Karin等人,1989;Richards等人,1984);以及多联应答元件启动子,诸如环AMP应答元件启动子(cre)、血清应答元件启动子(sre)、佛波酯启动子(TPA)和靠近最小TATA盒的应答元件启动子(tre)。还可以使用人生长激素启动子序列(例如,在Genbank上描述的人生长激素最小启动子,登录号为X05244,核苷酸283-341)或小鼠乳腺肿瘤启动子(可从ATCC获取,货号为ATCC 45007)。

组织特异性转基因表达,特别是对于源自重编程过程的造血细胞和造血细胞前体中的报告基因表达,作为一种鉴定所衍生的造血细胞和前体细胞的方式可能是可取的。为了提高特异性和活性,已经考虑使用顺式作用调节元件。举例来说,可以使用造血细胞特异性启动子。许多此类造血细胞特异性启动子是本领域已知的。

在某些方面,本公开的方法还涉及增强子序列,即增加启动子活性并具有顺式作用潜力的核酸序列,并且不管它们的方向如何,即使跨越相对较长的距离(距离靶启动子多达几千个碱基)。然而,增强子的功能不一定局限于如此较长距离,因为它们也可以在紧邻给定启动子的情况下发挥作用。

已经鉴定了许多造血细胞启动子和增强子序列,并且可用于本公开的方法。参见,例如美国专利5,556,954;美国专利申请20020055144;美国专利申请20090148425。

b.起始信号和关联表达

特定的起始信号也可用于本公开提供的表达构建体中以有效翻译编码序列。这些信号包括ATG起始密码子或邻近序列。可能需要提供外源翻译控制信号,包括ATG起始密码子。本领域普通技术人员将能够很容易确定这一点并提供必要的信号。众所周知,起始密码子必须与所需编码序列的阅读框“位于相同的读码框内”,以确保整个插入序列的翻译。外源性翻译控制信号和起始密码子可以是天然的,也可以是合成的。通过包含适当的转录增强子元件,可以提高表达效率。

在某些实施方案中,内部核糖体进入位点(IRES)元件用于创建多基因或多顺反子信使。IRES元件能够绕过5'甲基化帽依赖性翻译的核糖体扫描模型,并在内部位点处开始翻译(Pelletier和Sonenberg,1988)。已经描述了来自小核糖核酸病毒科的两个成员(脊髓灰质炎病毒和脑心肌炎病毒)的IRES元件(Pelletier和Sonenberg,1988),以及来自哺乳动物信使的IRES元件(Macejak和Sarnow,1991)。IRES元件可以连接至异源开放阅读框。多个开放阅读框可以一起转录,每个阅读框都由一个IRES分开,从而产生多顺反子mRNA。借助于IRES元件,核糖体可以进入每个开放阅读框以实现有效翻译。使用单个启动子/增强子转录单个mRNA可以有效表达多个基因(参见,美国专利号5,925,565和5,935,819,每篇文献都通过引用方式并入本文)。

另外,某些2A序列元件可用于在本公开提供的构建体中创建重编程基因的连锁表达或共表达。举例来说,切割序列可用于通过连接开放阅读框形成单个顺反子来共表达基因。一个示例性切割序列是F2A(口蹄疫病毒2A)或“2A样”序列(例如,明脉扁刺蛾(Thoseaasigna)病毒2A;T2A)(Minskaia和Ryan,2013)。在特定的实施方案中,F2A切割肽用于多谱系构建体中基因的连锁表达。

c.复制起点

为了在宿主细胞中增殖载体,其可以含有一个或多个复制位点的起点(通常称为“ori”),举例来说,对应于如上所述EBV的oriP的核酸序列,或者在重编程过程中具有相似或更高功能的基因工程化oriP,它是复制起始处的特定核酸序列。备选地,可以采用如上所述其他染色体外复制型病毒的复制起点或自主复制序列(ARS)。

d.选择和可筛选标志物

在某些实施方案中,含有核酸构建体的细胞可以通过在表达载体中包含标志物而在体外或体内进行鉴定。这种标志物将赋予细胞可识别的变化,从而允许轻松鉴定含有表达载体的细胞。一般而言,选择标志物是一种赋予允许选择的属性的标志物。阳性选择标志物是标志物的存在允许其选择的标志物,而阴性选择标志物是标志物的存在阻止其选择的标志物。阳性选择标志物的一个示例是药物抗性标志物。

通常,包含药物选择标志物有助于转化子的克隆和鉴定,例如,赋予对新霉素、嘌呤霉素、潮霉素、DHFR、GPT、博来霉素和组氨醇具有抗性的基因是有用的选择标志物。除了赋予允许根据条件的实施来区分转化子的表型的标志物之外,也考虑了其他类型的标志物,包括可筛选标志物诸如GFP,其基于比色分析。备选地,可以使用可筛选酶类作为阴性选择标志物,诸如单纯疱疹病毒胸苷激酶(tk)或氯霉素乙酰转移酶(CAT)。本领域技术人员还会了解如何使用免疫学标志物,可能与FACS分析相结合。据信所用的标志物并不重要,只要它能够与编码基因产物的核酸同时表达即可。选择和可筛选标志物的其他实例是本领域技术人员所熟知的。

E.基因编辑

在一些实施方案中,本公开的方法包括通过序列特异性或靶向性的核酸酶进行基因编辑,这些核酸酶包括结合DNA的靶向核酸酶,诸如锌指核酸酶(ZFN)和转录激活因子样效应物核酸酶(TALEN),以及RNA引导性核酸酶,诸如CRISPR相关核酸酶(Cas),将它们专门设计为靶向基因的序列或其一部分。

在一些实施方案中,通过诱导基因中的一个或多个双链断裂和/或一个或多个单链断裂来进行基因编辑,通常是以靶向的方式。在一些实施方案中,双链或单链断裂由核酸酶完成,这种核酸酶例如内切核酸酶,诸如基因靶向性核酸酶。在一些方面,在基因的编码区例如在外显子中诱导断裂。举例来说,在一些实施方案中,诱导发生在编码区的N-端部分附近,例如在第一外显子、第二外显子或随后的外显子中。

在一些方面,双链或单链断裂通过细胞修复过程进行修复,例如通过非同源性末端接合(NHEJ)或同源介导修复(HDR)。在一些方面,修复过程容易出错,并导致基因破坏,诸如移码突变,例如双等位基因移码突变,这可能导致基因的完全敲除。

在一些实施方案中,基因编辑通过使用DNA靶向性分子来实现,这种DNA靶向性分子诸如DNA结合蛋白或DNA结合核酸,或者含有它们的复合物、化合物或组合物,其与基因特异性结合或杂交。在一些实施方案中,DNA靶向性分子包含DNA结合结构域,例如锌指蛋白(ZFP)DNA结合结构域、转录激活因子样蛋白(TAL)或TAL效应物(TALE)DNA结合结构域、簇状规律间隔性短回文重复序列(CRISPR)DNA结合结构域或来自大范围核酸酶的DNA结合结构域。锌指、TALE和CRISPR系统结合结构域可经过工程化以结合预定的核苷酸序列,例如通过工程化(改变一个或多个氨基酸)天然存在的锌指或TALE蛋白的识别螺旋区。工程化DNA结合蛋白(锌指或TALE)是非天然存在的蛋白质。合理的设计标准包括应用取代规则和计算机化算法来处理数据库中的信息,该数据库存储了现有ZFP和/或TALE设计的信息和结合数据。参见,例如美国专利号6,140,081;6,453,242;和6,534,261;另见WO 98/53058;WO 98/53059;WO 98/53060;WO 02/016536和WO 03/016496以及美国专利公布号2011/0301073。

在一些实施方案中,DNA靶向性分子、复合物或组合含有DNA结合分子和一个或多个另外的结构域,诸如有助于抑制或破坏基因的效应结构域。举例来说,在一些实施方案中,基因编辑通过融合蛋白进行,该融合蛋白包含DNA结合蛋白和异源调节结构域或其功能性片段。在一些方面,结构域包括,例如转录因子结构域诸如激活因子、阻遏子、辅激活因子、辅阻遏子、沉默子,癌基因,DNA修复酶及其相关因子和修饰物,DNA重排酶及其相关因子和修饰物、染色质相关蛋白及其修饰物例如激酶、乙酰化酶和去乙酰化酶,以及DNA修饰酶例如甲基转移酶、拓扑异构酶、解旋酶、连接酶、激酶、磷酸酶、聚合酶、内切核酸酶及其相关因子和修饰物。参见,例如美国专利申请公布号2005/0064474;2006/0188987和2007/0218528,其全部内容通过引用方式并入本文,以获得关于DNA结合结构域和核酸酶切割结构域融合的详细信息。在一些方面,另外的结构域是核酸酶结构域。因此,在一些实施方案中,通过基因或基因组编辑来促进基因编辑,其使用工程化蛋白诸如核酸酶和含核酸酶的复合物或融合蛋白,由与非特异性DNA切割分子如核酸酶融合或复合的序列特异性DNA结合结构域构成。

在一些方面,通过诱导靶向双链断裂或单链断裂,刺激细胞DNA修复机制,包括容易出错的非同源性末端接合(NHEJ)或同源介导修复(HDR),这些靶向性嵌合核酸酶或含核酸酶的复合物进行精确的基因修饰。在一些实施方案中,核酸酶是内切核酸酶,诸如锌指核酸酶(ZFN)、TALE核酸酶(TALEN)和RNA引导的内切核酸酶(RGEN),例如CRISPR相关(Cas)蛋白或大范围核酸酶。

在一些实施方案中,提供了供体核酸,例如编码基因工程化抗原受体的供体质粒或核酸,并在引入DSB后通过HDR在基因编辑位点处将其插入。因此,在一些实施方案中,破坏基因和导入抗原受体例如CAR是同时进行的,由此通过敲入或插入编码CAR的核酸来部分地破坏该基因。

在一些实施方案中,未提供供体核酸。在一些方面,引入DSB后NHEJ介导的修复会导致插入或缺失突变,从而可能造成基因破坏,例如通过产生错义突变或移码。

1.ZFP和ZFN

在一些实施方案中,DNA靶向性分子包括DNA结合蛋白,诸如一种或多种锌指蛋白(ZFP)或转录激活因子样蛋白(TAL),它们与效应蛋白如内切核酸酶融合。实例包括ZFN、TALE和TALEN。

在一些实施方案中,DNA靶向性分子包括以序列特异性方式与DNA结合的一种或多种锌指蛋白(ZFP)或其结构域。ZFP或其结构域是一种蛋白质或较大蛋白质内的一种结构域,它们通过一个或多个锌指以序列特异性方式结合DNA,这些锌指是结合结构域内的氨基酸序列区域,其结构通过锌离子的配位而稳定化。术语锌指DNA结合蛋白通常简称为锌指蛋白或ZFP。在ZFP中有靶向特定DNA序列的人工ZFP结构域,通常长9-18个核苷酸,由单个手指的组装而生成。

ZFP包括其中单个指状结构域长度约为30个氨基酸并且包含α螺旋的ZFP,这种α螺旋包含两个恒定的组氨酸残基,通过锌与单个β转角的两个半胱氨酸进行配位,并具有两个、三个、四个、五个或六个指。一般来说,通过在锌指识别螺旋上的四个螺旋位置(-1、2、3和6)进行氨基酸取代可以改变ZFP的序列特异性。因此,在一些实施方案中,ZFP或含ZFP的分子是非天然存在的,例如,经过工程化改造以结合所选择的靶位点。

在一些方面,MeCP2的破坏是通过使基因中的第一靶位点与第一ZFP接触从而破坏该基因来进行的。在一些实施方案中,使基因中的靶位点与包含六个指和调节结构域的融合ZFP接触,从而抑制基因的表达。

在一些实施方案中,接触步骤进一步包括使基因中的第二靶位点与第二ZFP接触。在一些方面,第一和第二靶位点是相邻的。在一些实施方案中,第一和第二ZFP共价连接。在一些方面,第一ZFP是包含一个调节结构域或至少两个调节结构域的融合蛋白。

在一些实施方案中,第一和第二ZFP是融合蛋白,各自包含一个调节结构域或各自包含至少两个调节结构域。在一些实施方案中,调节结构域是转录阻遏子、转录激活因子、内切核酸酶、甲基转移酶、组蛋白乙酰转移酶或组蛋白去乙酰化酶。

在一些实施方案中,ZFP由可操作地连接至启动子的ZFP核酸编码。在一些方面,该方法进一步包括首先将核酸以脂质:核酸复合物或裸核酸的形式施用至细胞的步骤。在一些实施方案中,ZFP由表达载体编码,该表达载体包含与启动子可操作地连接的ZFP核酸。在一些实施方案中,ZFP由可操作地连接至诱导型启动子的核酸编码。在一些方面,ZFP由可操作地连接至弱启动子的核酸编码。

在一些实施方案中,靶位点位于基因转录起始位点的上游。在一些方面,靶位点与基因转录起始位点相邻。在一些方面,靶位点与位于基因转录起始位点下游的RNA聚合酶暂停位点相邻。

在一些实施方案中,DNA靶向性分子是或包含与DNA切割结构域融合以形成锌指核酸酶(ZFN)的锌指DNA结合结构域。在一些实施方案中,融合蛋白包含来自至少一种liS型限制性酶的切割结构域(或切割半结构域)以及一个或多个锌指结合结构域,这些结构域可以经过工程化,也可以未经工程化。在一些实施方案中,切割结构域来自liS型限制性内切核酸酶Fok I。Fok I通常催化DNA的双链切割,在一条链上距离其识别位点9个核苷酸处,在另一条链上距离其识别位点13个核苷酸处。

在一些实施方案中,ZFN靶向工程化细胞中存在的基因。在一些方面,ZFN有效地生成双链断裂(DSB),例如在基因编码区的预定位点处。典型的靶向区域包括外显子、编码N末端区域的区域、第一外显子、第二外显子以及启动子或增强子区域。在一些实施方案中,ZFN的瞬时表达促进了工程化细胞中靶基因的高效和永久破坏。尤其是在一些实施方案中,ZFN的递送导致基因的永久破坏,其效率超过50%。

许多基因特异性工程化锌指可在市场上获得。举例来说,Sangamo Biosciences(Richmond,CA,USA)已经与Sigma-Aldrich(St.Louis,MO,USA)合作开发了一个用于锌指构建的平台(CompoZr),允许研究人员完全绕过锌指构建和验证,并为数千种蛋白质提供特异性靶向锌指(Gaj等人,Trends in Biotechnology,2013,31(7),397-405)。在一些实施方案中,使用市售的锌指或者定制设计锌指。

2.TAL、TALE和TALEN

在一些实施方案中,DNA靶向性分子包含天然存在的或工程化的(非天然存在的)转录激活因子样蛋白(TAL)DNA结合结构域,诸如在转录激活因子样蛋白效应物(TALE)蛋白中,参见例如美国专利公布号2011/0301073,其全部内容通过引用方式并入本文。

TALE DNA结合结构域或TALE是包含一个或多个TALE重复结构域/单元的多肽。重复结构域参与TALE与其同类靶DNA序列的结合。单个“重复单元”(也称为“重复”)的长度通常为33-35个氨基酸,并且与天然存在的TALE蛋白内的其他TALE重复序列至少表现出一些序列同源性。每个TALE重复单元包含构成重复可变双残基(RVD)的1或2个DNA结合残基,通常位于重复序列的12和/或13位。已经确定了用于这些TALE的DNA识别的天然(规范)密码,使得12和13位的HD序列引起与胞嘧啶(C)结合,NG与T结合,NI与A结合,NN与G或A结合,NO与T结合,并且非规范(非典型)RVD也是已知的。参见,美国专利公布号2011/0301073。在一些实施方案中,通过设计对靶DNA序列具有特异性的TAL阵列,TALE可以靶向任何基因。靶序列通常以胸苷开始。

在一些实施方案中,该分子是DNA结合性内切核酸酶,例如TALE核酸酶(TALEN)。在一些方面,TALEN是一种融合蛋白,其包含源自TALE的DNA结合结构域和用于切割核酸靶序列的核酸酶催化结构域。

在一些实施方案中,TALEN识别并切割基因中的靶序列。在一些方面,DNA的切割导致双链断裂。在一些方面,断裂刺激同源重组或非同源性末端接合(NHEJ)的比率。总体来说,NHEJ是一种不完美的修复过程,通常会导致切割位点处DNA序列发生变化。在一些方面,修复机制涉及通过直接重新连接(Critchlow和Jackson,1998)或经由所谓的微同源介导的末端接合将剩余的两个DNA末端重新接合起来。在一些实施方案中,经由NHEJ进行修复会导致较小的插入或缺失,可用于破坏基因并由此抑制基因。在一些实施方案中,修饰可以是至少一个核苷酸的置换、缺失或添加。在一些方面,可以通过本领域众所周知的方法来鉴定和/或选择其中发生了切割诱导的诱变事件即继NHEJ事件后的诱变事件的细胞。

在一些实施方案中,将TALE重复序列组装起来以特异性靶向基因。已经构建了靶向18,740个人类蛋白质编码基因的TALEN文库。定制设计的TALE阵列可以通过以下供应商从商业渠道获取:Cellectis Bioresearch(Paris,France)、TransposagenBiopharmaceuticals(Lexington,KY,USA)和Life Technologies(Grand Island,NY,USA)。

在一些实施方案中,将TALEN作为由一种或多种质粒载体编码的转基因导入。在一些方面,质粒载体可以包含选择标志物,这种选择标志物提供了对接受了所述载体的细胞的鉴定和/或选择。

3.RGEN(CRISPR/Cas系统)

在一些实施方案中,使用一种或多种DNA结合核酸进行破坏,诸如通过RNA引导性内切核酸酶(RGEN)进行破坏。举例来说,可以使用簇状规律间隔性短回文重复序列(CRISPR)和CRISPR相关(Cas)蛋白进行破坏。一般来说,“CRISPR系统”统称为参与CRISPR相关(“Cas”)基因表达或指导其活性的转录本和其他元件,包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如,tracrRNA或活性部分tracrRNA)、tracr伴侣序列(在内源性CRISPR系统的背景下涵盖“直接重复”和tracrRNA加工的部分直接重复)、引导序列(在内源性CRISPR系统的背景下也称为“间隔区”)和/或来自CRISPR基因座的其他序列和转录本。

CRISPR/Cas核酸酶或CRISPR/Cas核酸酶系统可以包括以序列特异性方式结合DNA的非编码RNA分子(引导)RNA和具有核酸酶功能(例如,两个核酸酶结构域)的Cas蛋白(例如,Cas9)。CRISPR系统的一个或多个元件可以源自I型、II型或III型CRISPR系统,例如源自包含内源性CRISPR系统的特定生物体,诸如酿脓链球菌(Streptococcus pyogenes)。

在一些方面,将Cas核酸酶和gRNA(包括对靶序列具有特异性的crRNA和固定tracrRNA的融合物)导入细胞中。一般来说,利用互补碱基配对,位于gRNA5'端的靶位点将Cas核酸酶导向靶位点,例如基因。靶位点的选择可基于其紧邻前间隔序列邻近基序(PAM)序列诸如典型的NGG或NAG的5'方向的位置。在这方面,通过修饰引导RNA的前20、19、18、17、16、15、14、13、12、11或10个核苷酸以对应于靶DNA序列从而将gRNA导向到所需序列。一般来说,CRISPR系统的特征在于促进在靶序列的位点处形成CRISPR复合物的元件。典型地,“靶序列”通常是指将引导序列设计成与其具有互补性的序列,其中靶序列和引导序列之间的杂交促进CRISPR复合物的形成。不一定需要完全互补性,只要有足够的互补性以引起杂交并促进CRISPR复合物的形成即可。

CRISPR系统可以在靶位点处诱导双链断裂(DSB),然后进行如本文所述的破坏。在其他实施方案中,视为“切口酶”的Cas9变体用于在靶位点处对单链进行切口。例如,为了提高特异性,可以使用成对的切口酶,每个切口酶由一对不同的gRNA靶向序列指导,使得在同时引入切口时,就会引入5'突出末端。在其他实施方案中,将催化活性丧失的Cas9融合至异源效应结构域,诸如转录阻遏子或激活因子,以影响基因表达。

靶序列可以包括任何多核苷酸,例如DNA或RNA多核苷酸。靶序列可以位于细胞的细胞核或细胞质中,例如在细胞的细胞器内。总体来说,可用于重组到包含靶序列的靶向基因座中的序列或模板被称为“编辑模板”或“编辑多核苷酸”或“编辑序列”。在一些方面,外源性模板多核苷酸可称为编辑模板。在一些方面,重组是同源重组。

典型地,在内源性CRISPR系统的情况下,CRISPR复合物的形成(包括与靶序列杂交并与一种或多种Cas蛋白复合的引导序列)导致在靶序列中或附近(例如,距离靶序列1、2、3、4、5、6、7、8、9、10、20、50个或更多个碱基对以内)出现一条或两条链的切割。Tracr序列可以包含野生型tracr序列的全部或一部分或者由其组成(例如,野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个或更多个核苷酸),也可以形成CRISPR复合物的一部分,诸如通过沿着tracr序列的至少一部分与可操作地连接至引导序列的tracr伴侣序列的全部或一部分杂交。Tracr序列与tracr伴侣序列具有足够的互补性以进行杂交并参与CRISPR复合物的形成,诸如在最佳比对时沿着tracr伴侣序列的长度具有至少50%、60%、70%、80%、90%、95%或99%的序列互补性。

可以将驱动CRISPR系统的一个或多个元件表达的一种或多种载体导入细胞中,使得CRISPR系统的元件的表达指导在一个或多个靶位点处形成CRISPR复合物。也可以将组分以蛋白质和/或RNA的形式递送到细胞中。举例来说,Cas酶、连接至tracr伴侣序列的引导序列和tracr序列都可以各自可操作地连接至分别的载体上的分别的调节元件。备选地,由相同或不同调节元件表达的两个或更多个元件可以组合在单一载体中,同时一个或多个另外的载体提供不包括在第一载体中的CRISPR系统的任何组分。载体可以包含一个或多个插入位点,诸如限制性内切核酸酶识别序列(也称为“克隆位点”)。在一些实施方案中,一个或多个插入位点位于一种或多种载体的一个或多个序列元件的上游和/或下游。当使用多个不同的引导序列时,可以使用单一表达构建体将CRISPR活性导向细胞内多个不同的相应靶序列。

载体可以包含可操作地连接到编码CRISPR酶的酶编码序列的调节元件,这种CRISPR酶诸如Cas蛋白。Cas蛋白的非限制性实例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csfl、Csf2、Csf3、Csf4、其同源物或其修饰形式。这些酶是已知的;举例来说,酿脓链球菌Cas9蛋白的氨基酸序列可以见于SwissProt数据库,其登录号为Q99ZW2。

CRISPR酶可以是Cas9(例如,来自酿脓链球菌或肺炎链球菌(S.pneumonia))。CRISPR酶可以指导在靶序列的位置处切割一条链或两条链,诸如在靶序列内和/或在靶序列的互补序列内。载体可以编码相对于相应野生型酶发生突变的CRISPR酶,使得突变型CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。举例来说,来自酿脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸的置换(D10A)将Cas9从切割双链的核酸酶转化为切口酶(切割单链)。在一些实施方案中,Cas9切口酶可以与一个或多个引导序列(例如两个引导序列)组合使用,这些引导序列分别靶向DNA靶标的正义链和反义链。这种组合允许两条链都出现切口并用于诱导NHEJ或HDR。

在一些实施方案中,对编码CRISPR酶的酶编码序列进行密码子优化,以便在特定细胞如真核细胞中表达。真核细胞可以是特定生物体的细胞或源自特定生物体的细胞,这些生物体诸如哺乳动物,包括但不限于人、小鼠、大鼠、兔、狗或非人灵长类动物。一般来说,密码子优化是指修饰核酸序列以增强在所关注的宿主细胞中表达的过程,其通过将天然序列的至少一个密码子替换为在该宿主细胞的基因中更频繁或最频繁使用的密码子,同时保持天然氨基酸序列。不同的物种对特定氨基酸的某些密码子表现出特定的偏好。密码子偏好(生物体之间密码子使用的差异)通常与信使RNA(mRNA)的翻译效率相关,而翻译效率又被认为取决于待翻译密码子的特性以及特定转运RNA(tRNA)分子的可用性等。细胞中选定的tRNA的主导地位通常反映了肽合成中最频繁使用的密码子。相应地,可以基于密码子优化对基因进行定制,以在给定生物体中实现最佳基因表达。

一般来说,引导序列是与靶多核苷酸序列具有足够互补性以与靶序列杂交并指导CRISPR复合物与靶序列进行序列特异性结合的任何多核苷酸序列。在一些实施方案中,当使用合适的比对算法进行最佳比对时,引导序列与其相应的靶序列之间的互补程度为约或大于约50%、60%、75%、80%、85%、90%、95%、97.5%、99%或更大。

最佳比对可以通过使用任何合适的用于比对序列的算法来确定,这些算法的非限制性示例包括Smith-Waterman算法、Needleman-Wunsch算法、基于Burrows-Wheeler变换的算法(例如,Burrows Wheeler Aligner)、Clustal W、Clustal X、BLAT、Novoalign(Novocraft Technologies,ELAND(Illumina,San Diego,Calif.)、SOAP(可在soap.genomics.org.cn上获得)以及Maq(可在maq.sourceforge.net上获得)。

CRISPR酶可以是包含一个或多个异源蛋白结构域的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何另外的蛋白序列,以及任选地位于任何两个结构域之间的接头序列。可以与CRISPR酶融合的蛋白结构域的实例包括但不限于表位标签、报告基因序列和具有以下一种或多种活性的蛋白结构域:甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血凝素(HA)标签、Myc标签、VSV-G标签和硫氧还蛋白(Trx)标签。报告基因的实例包括但不限于谷胱甘肽-5-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)和自发荧光蛋白,包括蓝色荧光蛋白(BFP)。CRISPR酶可以与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列融合,这些蛋白质或蛋白质片段包括但不限于麦芽糖结合蛋白(MBP)、S-标签、Lex ADNA结合结构域(DBD)融合物、GAL4ADNA结合结构域融合物以及单纯疱疹病毒(HSV)BP16蛋白融合物。

F.iPSC的分化

在一些实施方案中,提供了从多能干细胞(PSC)如人iPSC的基本上单细胞悬液中产生分化细胞的方法。在一些实施方案中,将PSC培养至汇合前以防止任何细胞聚集。在某些方面,通过使PSC与细胞解离酶(诸如以TRYPSIN

一旦以已知的细胞密度获得PSC的单细胞悬液,通常就会将细胞接种在合适的培养容器中,诸如组织培养板,诸如烧瓶、6孔板、24孔板或96孔板。用于培养一种或多种细胞的培养容器可以包括但不特别限于:烧瓶、组织培养瓶、皿、培养皿、组织培养皿、多皿(multi dish)、微板(micro plate)、微孔板、多板(multi plate)、多孔板、微玻片、腔室玻片、管、培养盘、

在某些方面,将PSC诸如iPSC以适于有效分化的细胞密度进行铺板。总体来说,将细胞以约1,000至约75,000个细胞/cm

通常将PSC,诸如iPSC在包被有一种或多种细胞粘附蛋白的培养板上培养,以促进细胞粘附,同时保持细胞活力。举例来说,优选的细胞粘附蛋白包括胞外基质蛋白,诸如玻连蛋白、层粘连蛋白、胶原蛋白和/或纤连蛋白,它们可用于包被培养表面作为一种为多能细胞生长提供固相支持物的手段。术语“胞外基质”是本领域公认的。其成分包括以下一种或多种蛋白质:纤连蛋白、层粘连蛋白、玻连蛋白、肌腱蛋白(tenascin)、巢蛋白(entactin)、血小板反应蛋白、弹性蛋白、明胶、胶原蛋白、原纤维蛋白、分区蛋白(merosin)、锚蛋白、软骨粘连蛋白、连接蛋白、骨涎蛋白、骨钙素、骨桥蛋白、外连蛋白(epinectin)、透明质蛋白(hyaluronectin)、粗纤维调节素(undulin)、表皮整联配体蛋白(epiligrin)和缰蛋白(kalinin)。在示例性方法中,将PSC在包被有玻连蛋白或纤连蛋白的培养板上生长。在一些实施方案中,细胞粘附蛋白是人类蛋白质。

胞外基质(ECM)蛋白可以是天然来源并从人或动物组织中纯化出来,或者备选地,ECM蛋白在本质上可以是基因工程化重组蛋白或合成蛋白。ECM蛋白可以是全蛋白或肽片段形式的蛋白,其是天然的或工程化的。可用于细胞培养基质的ECM蛋白的实例包括层粘连蛋白、I型胶原蛋白、IV型胶原蛋白、纤连蛋白和玻连蛋白。在一些实施方案中,基质组合物包括纤连蛋白的合成产生的肽片段或重组纤连蛋白。在一些实施方案中,基质组合物无异种成分。举例来说,在培养人类细胞的无异种成分基质中,可以使用人类来源的基质成分,其中可以排除任何非人动物成分。

在一些方面,基质组合物中的总蛋白质浓度可以是约1ng/mL至约1mg/mL。在一些优选实施方案中,基质组合物中的总蛋白质浓度为约1μg/mL至约300μg/mL。在更优选的实施方案中,基质组合物中的总蛋白质浓度为约5μg/mL至约200μg/mL。

可以用支持每个特定细胞群生长所需的营养物来培养细胞。总体来说,将细胞培养在生长培养基中,该培养基包括碳源、氮源和维持pH的缓冲剂。培养基还可以包含脂肪酸或脂质、氨基酸(例如非必需氨基酸)、一种或多种维生素、生长因子、细胞因子、抗氧化物质、丙酮酸、缓冲剂和无机盐。示例性生长培养基含有最低必需培养基,诸如杜氏改良Eagle培养基(DMEM)或ESSENTIAL 8

相应地,通常在铺板后,将PSC在完全确定培养基中培养。在某些方面,接种后约18-24小时,吸出培养基并向培养物中加入新鲜培养基,如E8

在一些实施方案中,培养基可以含有或可以不含血清的任何替代物。血清的替代物可以包括适当含有白蛋白(诸如富含脂质的白蛋白、白蛋白代替物如重组白蛋白、植物淀粉、葡聚糖和蛋白水解物)、转铁蛋白(或其他铁转运蛋白)、脂肪酸、胰岛素、胶原前体、微量元素、2-巯基乙醇、3'-硫代甘油或其等同物的材料。可以通过例如在国际公布号WO 98/30679中公开的方法来制备血清的替代物。备选地,为了更方便,可以使用任何市售材料。市售材料包括KNOCKOUT

还可以适当确定其他培养条件。举例来说,培养温度可以是约30至40℃,例如至少或约31、32、33、34、35、36、37、38、39℃,但不特别限于此。在一个实施方案中,在37℃培养细胞。CO

G.iPSC或分化细胞的冷冻保存

可以将通过本文公开的方法产生的细胞进行冷冻保存,参见例如PCT公布号2012/149484A2,其通过引用方式并入本文。可以将细胞在含有或不含基质的情况下进行冷冻保存。在若干实施方案中,储存温度的范围为约-50℃至约-60℃、约-60℃至约-70℃、约-70℃至约-80℃、约-80℃至约-90℃、约-90℃至约-100℃,及其重叠范围。在一些实施方案中,较低的温度用于储存(例如维持)冷冻保存的细胞。在若干实施方案中,使用液氮(或其他类似液体冷却剂)来储存细胞。在进一步的实施方案中,细胞储存时间超过约6小时。在另外的实施方案中,细胞储存约72小时。在若干实施方案中,细胞储存48小时至约一周。在另外其他的实施方案中,将细胞储存约1、2、3、4、5、6、7或8周。在另外的实施方案中,将细胞储存1、2、3、4、5、6、7、8、9、10、11或12个月。细胞也可以储存更长时间。细胞可以单独冷冻保存或置于基质上冷冻保存,诸如置于本文公开的任何基质上。

在一些实施方案中,可以使用另外的冷冻保护剂。举例来说,可以将细胞冷冻保存在包含一种或多种冷冻保护剂的冷冻保存溶液中,这些冷冻保护剂诸如DM80、血清白蛋白,例如人或牛血清白蛋白。在某些实施方案中,该溶液包含约1%、约1.5%、约2%、约2.5%、约3%、约4%、约5%、约6%、约7%、约8%、约9%或约10%的DMSO。在其他实施方案中,该溶液包含约1%至约3%、约2%至约4%、约3%至约5%、约4%至约6%、约5%至约7%、约6%至约8%、约7%至约9%或约8%至约10%的二甲亚砜(DMSO)或白蛋白。在一个具体实施方案中,该溶液包含2.5%的DMSO。在另一个具体实施方案中,该溶液包含10%的DMSO。

在冷冻保存过程中,可以将细胞以例如约1℃/分钟的速度冷却。在一些实施方案中,冷冻保存温度为约-80℃至约-180℃或约-125℃至约-140℃。在一些实施方案中,将细胞冷却至4℃,之后以约1℃/分钟的速度冷却。可以将冷冻保存的细胞转移至液氮的气相中,之后再冻融以供使用。在一些实施方案中,例如,一旦细胞达到约-80℃,就将它们转移到液氮储存区。也可以使用控速冷冻机完成冷冻保存。可以冻融冷冻保存的细胞,例如在约25℃至约40℃的温度冻融,并且通常在约37℃的温度冻融。

III.工程化细胞系的用途

某些方面提供了一种产生具有稳定转基因表达的细胞系的方法,该细胞系可用于许多重要的研究、开发和商业目的。

通过本文公开的方法产生的细胞系可用于iPSC或分化细胞领域中目前已知的任何方法和应用。举例来说,可以提供一种评估化合物的方法,包括在细胞系上测定化合物的药理学或毒理学性质。还可以提供一种评估化合物对细胞培养物影响的方法,包括:a)使本文提供的细胞培养物与该化合物接触;并且b)测定该化合物对细胞培养物的影响。

A.测试化合物筛选

细胞培养物可在商业上用于筛选影响这类细胞及其各种后代特征的因素(诸如溶剂、小分子药物、肽、寡核苷酸)或环境条件(诸如培养条件或操作)。举例来说,测试化合物可以是化学化合物、小分子、多肽、生长因子、细胞因子或其他生物剂。

在一个实施方案中,一种方法包括使细胞培养物与测试剂进行接触,并确定测试剂是否调节群体内细胞的活性或功能。在一些应用中,筛选测定法用于鉴定调节细胞增殖、改变细胞分化或影响细胞活力的作用剂。筛选测定可以在体外或体内进行。筛选和鉴定候选作用剂的方法包括适合高通量筛选的方法。举例来说,可以将细胞培养物定位或放置在培养皿、烧瓶、滚瓶或培养板(例如,单个多孔皿或皿,诸如8、16、32、64、96、384和1536多孔板或多孔皿)上,任选在确定的位置上,用于鉴定潜在的治疗分子。可以筛选的文库包括,例如小分子文库、siRNA文库和腺病毒转染载体文库。

其他筛选应用涉及测试药物化合物对视网膜组织维护或修复的影响。可以完成筛选,是因为将该化合物设计为对细胞具有药理学作用,或者是因为一种设计成在别处具有作用的化合物可能对这种组织类型的细胞产生非意图的副作用。

B.治疗和移植

其他实施方案还可以提供细胞系用于治疗疾病或病症的用途。在另一方面,本公开提供了一种治疗有此需要的个体的方法,包括向所述个体施用包含工程化细胞的组合物。

为了确定细胞组合物对于治疗施用的适用性,可以首先在合适的动物模型中测试细胞。一方面,评估细胞系在体内存活和维持其表型的能力。将该组合物移植至免疫缺陷动物(例如,裸鼠或者通过化学方式或辐射导致免疫缺陷的动物)中。在生长一段时间后收获组织,并评估多能干细胞来源的细胞是否仍然存在。

如本文所用的,疾病或病症是指生物体中由例如感染或遗传缺陷引起的病理状况,并且其特征在于可识别的症状。如本文所述的示例性疾病是赘生性疾病,例如癌症。如本文所用的,赘生性疾病是指涉及癌症的任何病症,包括肿瘤发生、生长、转移和进展。

如本文所用的,癌症是由任何类型的恶性肿瘤引起或以任何类型的恶性肿瘤为特征的疾病的术语,包括转移性癌症、淋巴肿瘤和血癌。示例性癌症包括但不限于白血病、淋巴瘤、胰腺癌、肺癌、卵巢癌、乳腺癌、宫颈癌、膀胱癌、前列腺癌、神经胶质瘤、腺癌、肝癌和皮肤癌。人类的示例性癌症包括膀胱肿瘤、乳腺肿瘤、前列腺肿瘤、基底细胞癌、胆道癌、膀胱癌、骨癌、脑癌和CNS癌(例如神经胶质瘤)、宫颈癌、绒毛膜癌、结肠和直肠癌、结缔组织癌、消化系统癌症;子宫内膜癌、食管癌、眼癌;头和颈癌;胃癌;上皮内瘤变;肾脏癌;喉癌;白血病;肝癌;肺癌(例如,小细胞和非小细胞肺癌);淋巴瘤,包括霍奇金和非霍奇金淋巴瘤;黑色素瘤;骨髓瘤、神经母细胞瘤、口腔癌(例如唇癌、舌癌、口癌和咽癌);卵巢癌;胰腺癌、视网膜母细胞瘤;横纹肌肉瘤;直肠癌、肾癌、呼吸系统癌症;肉瘤、皮肤癌;胃部癌症、睾丸癌、甲状腺癌;子宫癌、泌尿系统癌症以及其他癌症和肉瘤。通常在狗、猫和其他宠物中诊断的示例性癌症包括但不限于淋巴肉瘤、骨肉瘤、乳腺肿瘤、肥大细胞瘤、脑肿瘤、黑色素瘤、腺鳞癌、类癌性肺肿瘤、支气管腺肿瘤、细支气管腺癌、纤维瘤、粘液软骨瘤、肺肉瘤、神经肉瘤、骨瘤、乳头状瘤、视网膜母细胞瘤、尤文氏肉瘤、威耳姆氏肿瘤、伯基特氏淋巴瘤、小神经胶质细胞瘤、神经母细胞瘤、破骨细胞瘤、口部瘤变、纤维肉瘤、骨肉瘤和横纹肌肉瘤、生殖器鳞状细胞癌、传染性性病肿瘤、睾丸肿瘤、精原细胞瘤、睾丸支持细胞肿瘤、血管外皮细胞瘤、组织细胞瘤、绿色瘤(例如,粒细胞肉瘤)、角膜乳头状瘤、角膜鳞状细胞癌、血管肉瘤、胸膜间皮瘤、基底细胞瘤、胸腺瘤、胃部肿瘤、肾上腺癌、口部多发性乳头瘤病、血管内皮瘤和囊腺瘤、滤泡性淋巴瘤、肠淋巴肉瘤、纤维肉瘤和肺鳞状细胞癌。在啮齿类动物例如雪貂中诊断的示例性癌症包括但不限于胰岛素瘤、淋巴瘤、肉瘤、神经瘤、胰岛细胞瘤、胃MALT淋巴瘤和胃腺癌。影响农业家畜的示例性瘤变包括但不限于白血病、血管外皮细胞瘤和牛眼部瘤变(在牛中);包皮纤维肉瘤、溃疡性鳞状细胞癌、包皮癌、结缔组织瘤变和肥大细胞瘤(在马中);肝细胞癌(在猪中);淋巴瘤和肺腺瘤病(在绵羊中);肺肉瘤、淋巴瘤、劳斯肉瘤、网状内皮细胞增生症、纤维肉瘤、肾母细胞瘤、B细胞淋巴瘤和淋巴细胞性白细胞组织增生(在禽类物种中);视网膜母细胞瘤、肝部瘤变、淋巴肉瘤(淋巴母细胞淋巴瘤)、浆细胞样白血病和鱼鳔肉瘤(在鱼类中)、干酪性淋巴结炎(CLA):由细菌假性结核棒状杆菌(Corynebacterium pseudotuberculosis)造成的绵羊和山羊的慢性感染性传染病,以及由羊肺腺瘤病(jaagsiekte)造成的绵羊的传染性肺肿瘤。

还提供了通过本文公开的方法产生的细胞系的药物组合物。这些组合物可以包括至少约1x10

合适的聚合物载体还包括由合成或天然聚合物形成的多孔网或海绵,以及聚合物溶液。举例来说,基质是聚合物网或海绵,或者聚合物水凝胶。可以使用的天然聚合物包括蛋白质,诸如胶原蛋白、白蛋白和纤维蛋白;以及多糖,诸如海藻酸盐和透明质酸的聚合物。合成聚合物包括可生物降解型聚合物和不可生物降解型聚合物。举例来说,可生物降解型聚合物包括羟基酸的聚合物,诸如聚乳酸(PLA)、聚乙醇酸(PGA)和聚乳酸-乙醇酸(PGLA)、聚原酸酯、聚酸酐、聚磷嗪及其组合。不可生物降解型聚合物包括聚丙烯酸酯、聚甲基丙烯酸酯、乙烯醋酸乙烯酯和聚乙烯醇。

可以使用可形成具有延展性的离子或共价交联水凝胶的聚合物。水凝胶是当有机聚合物(天然的或合成的)通过共价键、离子键或氢键发生交联以形成三维开放晶格结构时所形成的物质,该结构截留水分子以形成凝胶。可用于形成水凝胶的材料的实例包括多糖诸如海藻酸盐、聚磷嗪和聚丙烯酸酯,它们以离子方式交联,或者嵌段共聚物,诸如PLURON1CS

C.出于商业、治疗和研究目的的分配

在一些实施方案中,提供了一种试剂系统,其包括在制备、分配或使用过程中的任何时候存在的一组细胞或细胞的组合。培养物组包括本文所述的细胞群与未分化的多能干细胞或其他分化的细胞类型的任意组合,它们通常共有相同的基因组。可以将每种细胞类型包装在一起或者包装在不同容器中,可以在同一机构进行,也可以在不同地点进行,可以在相同或不同的时间进行,可以在同一实体或具有商业关系的不同实体的控制下。

药物组合物可以任选地包装在合适的容器中,并附有用于所需目的的书面说明,该所需目的诸如重建细胞功能以改善疾病或组织损伤。

IV.实施例

包括以下实施例来说明本发明的优选实施方案。本领域技术人员应当理解,以下实施例中公开的技术代表了本发明人发现的在本发明的实践中表现良好的技术,因此可以将它们视为构成其实践的优选模式。然而根据本公开,本领域技术人员应该理解,在不脱离本发明的精神和范围的情况下,可以对所公开的具体实施方案进行许多更改,并且仍然获得相同或类似的结果。

实施例1-密码子优化以防止基因沉默

为了测试甲基化是否是转基因沉默的原因,从已知被沉默(例如,GFP)或推测被沉默(例如,PuroR和NeoR)的基因的编码区中去除所有CpG基序。由于易于目视检查,因此对该概念进行了严格测试,比较了WT AcGFP1和不含CpG的AcGFP1。在SEQ ID NO:13和SEQ IDNO:14之间去除了CpG基序后氨基酸序列没有改变。

AcGFP1 DNA序列(SEQ ID NO:13):

atggtgagcaagggCGcCGagctgttcacCGgcatCGtgcccatcctgatCGagctgaatggCGatgtgaatggccacaagttcagCGtgagCGgCGagggCGagggCGatgccacctaCGgcaagctgaccctgaagttcatctgcaccacCGgcaagctgcctgtgccctggcccaccctggtgaccaccctgagctaCGgCGtgcagtgcttctcaCGctacccCGatcacatgaagcagcaCGacttcttcaagagCGccatgcctgagggctacatccaggagCGcaccatcttcttCGaggatgaCGgcaactacaagtCGCGCGcCGaggtgaagttCGagggCGataccctggtgaatCGcatCGagctgacCGgcacCGatttcaaggaggatggcaacatcctgggcaataagatggagtacaactacaaCGcccacaatgtgtacatcatgacCGacaaggccaagaatggcatcaaggtgaacttcaagatcCGccacaacatCGaggatggcagCGtgcagctggcCGaccactaccagcagaatacccccatCGgCGatggccctgtgctgctgccCGataaccactacctgtccacccagagCGccctgtccaaggaccccaaCGagaagCGCGatcacatgatctacttCGgcttCGtgacCGcCGcCGccatcacccaCGgcatggatgagctgtacaagTAA

不含CpG的AcGFP1 DNA序列(SEQ ID NO:14):

ATGGTGAGCAAGGGCGCCGAGCTGTTCACCGGCATCGTGCCCATCCTGATCGAGCTGAATGGCGATGTGAATGGCCACAAGTTCAGCGTGAGCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCTGTGCCCTGGCCCACCCTGGTGACCACCCTGAGCTACGGCGTGCAGTGCTTCTCACGCTACCCCGATCACATGAAGCAGCACGACTTCTTCAAGAGCGCCATGCCTGAGGGCTACATCCAGGAGCGCACCATCTTCTTCGAGGATGACGGCAACTACAAGTCGCGCGCCGAGGTGAAGTTCGAGGGCGATACCCTGGTGAATCGCATCGAGCTGACCGGCACCGATTTCAAGGAGGATGGCAACATCCTGGGCAATAAGATGGAGTACAACTACAACGCCCACAATGTGTACATCATGACCGACAAGGCCAAGAATGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGATGGCAGCGTGCAGCTGGCCGACCACTACCAGCAGAATACCCCCATCGGCGATGGCCCTGTGCTGCTGCCCGATAACCACTACCTGTCCACCCAGAGCGCCCTGTCCAAGGACCCCAACGAGAAGCGCGATCACATGATCTACTTCGGCTTCGTGACCGCCGCCGCCATCACCCACGGCATGGATGAGCTGTACAAG

对所关注基因的DNA序列进行精心修饰以去除所有CG基序,取而代之的是这样的密码子,这些密码子1)并不稀有,2)不产生单核苷酸延伸,并且3)保持了与该基因的WT形式相似的GC含量百分比。举例来说,对于不含CpG的AcGFP1,AcGFP1的WT形式(SEQ ID NO:13)的GC含量为59%,而新的不含CpG的AcGFP1(SEQ ID NO:14)的GC含量为52%。

EEF1A1启动子用于在iPSC中PPP1R12C基因座处表达AcGFP1。与WT AcGFP1相比对不含CpG的AcGFP1的测试表明,通过去除蛋白质编码序列中的CpG克服了基因表达的沉默(图3)。

然而,5个月后,尽管已从AcGFP1中去除了CpG,但仍检测到少量百分比的细胞没有GFP表达(3%)。为了研究这一群体,通过单细胞分选分离出没有GFP表达的克隆。细胞用丁酸钠(NaBut)处理,丁酸钠是一种组蛋白去乙酰化酶(HDAC)抑制剂,能够去除染色质结构并诱导去甲基化。观察到NaBut处理的结果是剂量依赖性重新激活GFP表达(图5)。

将不含CpG的AcGFP1 iPSC分化为肝细胞或神经元,并且观察到高百分比的GFP阳性分化细胞(图6)。

为了验证该结果,对pUC57-KanR(m)中的PuroRv1(基于Invivogen氨基酸序列合成)进行了密码子优化。PuroR的不含CpG序列(SEQ ID NO:15)如下所示。

质粒1346不含CpG的PuroR:

ATGACTGAATACAAACCAACTGTTAGACTGGCAACTAGAGATGATGTTCCAAGAGCAGTTAGAACCCTGGCTGCTGCATTTGCTGACTACCCTGCAACCAGACACACTGTGGACCCAGACAGACACATTGAAAGAGTGACTGAACTGCAGGAGCTGTTCCTGACCAGAGTGGGCCTGGACATTGGCAAAGTGTGGGTGGCAGATGATGGTGCTGCTGTGGCAGTGTGGACCACCCCTGAATCTGTTGAAGCTGGTGCAGTGTTTGCTGAGATTGGCCCAAGAATGGCAGAACTGTCTGGCAGCAGACTGGCAGCACAACAGCAGATGGAAGGTCTGCTGGCACCACACAGACCAAAAGAACCTGCTTGGTTCCTGGCAACTGTGGGTGTGAGCCCTGACCACCAGGGTAAGGGCCTGGGCTCTGCAGTGGTGCTGCCTGGTGTGGAAGCAGCTGAAAGAGCAGGTGTGCCTGCTTTCCTGGAGACCTCAGCTCCAAGAAACCTGCCTTTCTATGAAAGACTGGGCTTCACTGTGACTGCTGATGTGGAAGTGCCAGAAGGCCCAAGAACTTGGTGCATGACTAGAAAACCAGGTGCTTGATAATGA(SEQ ID NO:15)

质粒1347和1363中不含CpG的PuroRv2:

ATGACTGAATACAAACCAACTGTTAGACTGGCAACTAGAGATGATGTTCCAAGAGCAGTTAGAACCCTGGCTGCTGCATTTGCTGACTACCCTGCAACCAGACACACTGTGGACCCAGACAGACACATTGAAAGAGTGACTGAACTGCAGGAGCTGTTCCTGACCAGAGTGGGCCTGGACATTGGCAAAGTGTGGGTGGCAGATGATGGTGCTGCTGTGGCAGTGTGGACCACCCCTGAATCTGTTGAAGCTGGTGCAGTGTTTGCTGAGATTGGCCCAAGAATGGCAGAACTGTCTGGCAGCAGACTGGCAGCACAACAGCAGATGGAAGGTCTGCTGGCACCACACAGACCAAAAGAACCTGCTTGGTTCCTGGCAACTGTGGGTGTGAGCCCTGACCACCAGGGTAAGGGCCTGGGCTCTGCAGTGGTGCTGCCTGGTGTGGAAGCAGCTGAAAGAGCAGGTGTGCCTGCTTTCCTGGAGACCTCAGCTCCAAGAAACCTGCCTTTCTATGAAAGACTGGGCTTCACTGTGACTGCTGATGTGGAATGCCCAAAGGACAGAGCAACTTGGTGCATGACTAGAAAACCAGGTGCTTGATAATGA(SEQ ID NO:16)

通过电穿孔将不含CpG的PuroR盒导入iPSC中。观察到具有不含CpG的PuroRv1和PuroRv2的细胞能够赋予药物抗性。

表2.WT PuroR与不含CpG的PuroR的药物抗性比较。

/>

iPSC细胞系2.038转染了编码由组成型启动子驱动的嘌呤霉素基因(WT或不含CpG)的质粒。当加入单独的mTeSR1、mTeSR1与0.1ug/mL嘌呤霉素或mTeSR1与0.3ug/mL嘌呤霉素时,iPSC的生长按0(-)至3(+++)的等级评分。使用未转染的细胞系(2.038)作为对照嘌呤霉素处理对照。

表3.WT PuroR与不含CpG的PuroR比较。

表4.WT PuroR与不含CpG的PuroR在电穿孔后第4天和选择第3天时的活力。

/>

iPSC细胞系2.038转染了编码由组成型启动子驱动的嘌呤霉素基因(WT或不含CpG)的质粒。当加入单独的mTeSR1、mTeSR1与0.1ug/mL嘌呤霉素或mTeSR1与0.3ug/mL嘌呤霉素时,iPSC的生长按0(-)至3(+++)的等级评分。使用未转染的细胞系(2.038)作为对照嘌呤霉素处理对照。

表5.筛选克隆以验证正确的基因组工程化而在AAVS1切割位点处未出现脱靶整合或突变。进行骨架PCR以确认未出现质粒的脱靶整合。

表6.用于工程化细胞系的质粒。

这些结果表明CpG在iPSC细胞系的转基因沉默中发挥显著作用。另外,这些结果表明,全局甲基化或其他表观遗传失调在iPSC的缺陷性分化中发挥重要作用。因此,本公开的去除部分或全部CpG基序的优化方法可用于防止转基因沉默。

实施例2-CpG优化的iPSC的分化

使用不含CpG的AcGFP1和mRFP1转染的iPSC在培养的许多次传代中组成性地保留了荧光染料的表达。下一步是检查在iPSC分化为祖细胞以及从工程化iPSC生成终末期谱系期间荧光染料的保留。结果表明,使用不含CpG的质粒转染的工程化iPSC成功生成了纯的内皮细胞、造血细胞、巨噬细胞和小胶质细胞群。

从9650 GFP iPSC中生成iPSC来源的内皮细胞:未分化的9650-GFP是在E8存在的情况下维持在MATRIGEL

在一种示例性方法中,在含有1uM H1152的基于SFD的内皮培养基存在的情况下并在常氧条件下,以10k/cm

表7.用于生成iPSC来源的内皮细胞的示例性培养基配方。

从GFP工程化的9650和RFP工程化的8717iPSC中生成造血祖细胞(HPC):将在E8存在的情况下维持在基质胶或玻连蛋白上的GFP工程化9650和RFP工程化8717iPSC适应低氧至少5-10代。将细胞从近汇合的iPSC中分出来,并在补充有5uM布雷他汀或1uM H1152的无血清确定(SFD)培养基存在的情况下,以0.25-0.5百万个细胞/ml的密度将细胞铺在旋转瓶中。铺板后24小时,更换为补充有50ng/ml BMP4、VEGF和FGF2的SFD培养基。在分化过程的第五天时,将细胞置于含有50ng/ml Flt-3配体、SCF、TP0、IL3和IL6以及10U/ml肝素的培养基中。在整个分化过程中,每48小时对细胞进行补料。整个过程是在低氧条件下进行的。通过对CD4和CD34表达进行定量来确定HPC的纯度。流程概要如图14所示。使用CD34抗体通过磁力分选进一步纯化HPC。

从第12天开始评估HPC纯度,并持续至CD34表达达到>20%,如图14A中所概述。分化的HPC培养物保留了GFP的表达,如图14B所示。在第15天时进行细胞系9650的CD34

表8.用于从iPSC生成HPC的无血清确定培养基(SFD)、EB#1和MK#5的示例性配方。

小胶质细胞的生成:在常氧条件下,将纯化的HPC置于小胶质细胞分化培养基(MDM)中。每48小时使用2X MDM对培养物进行补料,分化过程在23天后结束。该过程在图16中列出。在图17A和17B中可以观察到整个小胶质细胞分化过程中细胞的形态和荧光。可以在图18中看到从HPC到小胶质细胞的过程效率。

评估了终末期小胶质细胞培养物的纯度。通过流式细胞术检测了CD45、CD33、TREM2和CD11b的细胞表面表达,以及PU.1、IBA、P2RY12、TREM2、CX3CR1和TMEM119的细胞内表达(图19A和19B)。

表9.小胶质细胞分化培养基。

表10.小胶质细胞分化培养基2X。

巨噬细胞的生成:在HPC分化的第17天,用细胞系8717-RFP启动巨噬细胞分化。在图20中概述了从HPC的巨噬细胞过程的概要。表11描述了用于这部分分化的培养基汇编。在第20天时,消化聚集体并向下铺在CMP培养基中。此时,将培养物转入常氧环境。一周后,将培养物更换为巨噬细胞培养基,此后每4天补加2X巨噬细胞培养基。在第44天和第51天时评估CD68纯度,并显示在图21中。在第52天时收获细胞并冷冻保存。在图22中可以看到细胞的形态和荧光。图23描述了从HPC到巨噬细胞的过程效率。通过流式细胞术测量的从iPSC到HPC、小胶质细胞和巨噬细胞的荧光强度如图24所示。

表11.培养基配方。

从8717-RFP和9650-GFP工程化的iPSC生成神经前体细胞(NPC):神经祖细胞(NPC)是自我更新的祖细胞,具有生成神经元和神经胶质的能力(Breunig等人,2011)。有许多已确立的方案用于从原代神经细胞和iPSC生成NPC,其效率有所不同(Shi等人,2012a,Shi等人,2012b)。最近的大多数方案都依赖于SMAD信号传导通路的抑制。本公开的方法描述了一种简易方案,其利用iPSC向外胚层的自发趋势而无需使用双重SMAD抑制途径,从不同的iPSC细胞系中生成NPC。在未使用双重SMAD抑制的情况下从iPSC生成神经前体细胞(NPC)的方法的示意性描述。在图25中描述了所涉及的各个步骤以及所使用培养基的组成。简言之,将以游离方式重编程的iPSC细胞系8717-RFP和9650-GFP维持在基质胶/层粘连蛋白/玻连蛋白包被的板上和E8培养基中。在开始分化以生成NPC之前,将iPSC维持在低氧条件下。为了启动神经前体分化,收获iPSC,并在rock抑制剂存在的情况下使用E8培养基以15K/cm

从神经前体细胞生成GABA能神经元:通过冻融NPC并将细胞置于图28中概述的分化途径中来测试NPC的潜能。简言之,将NPC置于下游分化方案中以产生GABA能神经元。将NPC冻融,并以0.3e6/mL的密度接种在补充有N2和NEAA的DMEM/F12中,在10μM布雷他汀存在的情况下培养24小时以形成聚集体。使用补充有N2和NEAA以及分别为100ng/mL和1.5μM的音猬因子(Sonic Hedgehog Signaling Molecule(SHH))和三元取代嘌呤(Purmorphamine)的DMEM/F12,每天对培养物进行完全培养基更换,持续10天。在接下来的48小时内,对培养物补加补充有N2、NEAA和5μM DAPT的DMEM/F12,之后使用DMEM/F12、N2、NEAA和10μM布雷他汀,以200,000/cm

实施例3-用于稳定表达的启动子

在iPSC细胞系中,实现随着时间的推移以及分化后的稳定转基因表达是具有挑战性的。许多启动子表现出沉默或可变表达,并且之前的研究已经证明了一些启动子如PGK和EEF1A1具有这种情况。进行了以下研究,以确定可用于在iPSC和分化细胞类型中提供稳定表达的启动子或可带标记的基因座。通常是在分化过程中,DNA甲基化发生显著变化,并可能影响表达;因此,最好的启动子需要在分裂细胞和细胞分裂极少的静止细胞(例如成熟、完全分化的心肌细胞)中都具有活性。

克隆的启动子:将以下启动子鉴定为可能在所有细胞类型中组成型表达的候选者。有些是从现有质粒中克隆出来的(CAG、PGK、UBC-形式1、EEF1A1、ACTB)。其他区域是最近生成的(通过PCR从基因组DNA中或通过合成),目的是鉴定会在iPSC和分化细胞中均提供稳定表达的启动子。新型启动子包括RPS19、UBA52、HSP90AB1、UBC的一个扩展区域(形式2)、UBB、RPSA、NACA和COX8A。将序列克隆到pGL3质粒载体中(替换MluI和NcoI限制性位点之间的SV40启动子),以便能够比较驱动萤光素酶报告基因时的启动子强度。

表12:启动子序列

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

瞬时转染过程中萤光素酶的表达:将启动子-pGL3质粒瞬时转染至iPSC中以确定表达强度。使用96wp形式,将50uL的E8培养基+10uM布雷他汀添加到每个孔中。通过添加16.5uL的以下试剂制备品,对每个质粒以一式三份进行测定。使用Accutase收获iPSC细胞系01279.107的6wp中的一个孔,将其重悬于3.5mL的E8培养基+10uM布雷他汀中,并向每个孔中加入50uL。一天后,使用双重萤光素酶报告测定系统(Promega)对细胞进行测定。

表13:试剂组成。

标准化萤光素酶(萤火虫/海肾比值,标准化为EEF1A1=100%)如下所示(HSP90AB1del400启动子和HSP90AB1启动子的表达约为EEF1A1的66%和75%)。需要达到或高于PGK启动子水平的表达值,因此选择RPS19、UBA52、HSP90AB1和UBC进行进一步研究。

ZsGreen构建体在AAVS1安全港基因座处整合:为了检查候选启动子在染色体环境中驱动的长期表达,将它们克隆到控制ZsGreen荧光蛋白的质粒中,并使其靶向人iPSC中19号染色体上的AAVS1安全港基因座(质粒设计如下所示,以CAG启动子为例)。通过CRISPR介导的基因编辑将质粒整合到iPSC细胞系01279.107中,应用嘌呤霉素筛选,再挑取抗性集落并通过PCR进行基因分型。扩增正确靶向的杂合克隆。

表14:生成的克隆。

适于带标记以产生组成型表达的基因组位点:除了来自安全港的启动子驱动型表达之外,在大多数细胞类型中表达的特定基因还可以用报告基因标记,以实现组成型表达。选定基因HSP90AB1、ACTB、CTNNB1和MYL6进行评估,并通过TALEN介导的基因编辑用ZsGreen和F2A切割序列进行标记。扩增正确靶向的杂合克隆。

表15:iPSC克隆和基因座。

在iPSC中的ZsGreen表达:将表达ZsGreen荧光蛋白的工程化iPSC细胞系以培养状态维持长达7个月(E8培养基/玻连蛋白包被板)并在Accuri C6仪器(BD)上使用流式细胞术定期检查绿色表达。大多数克隆随着时间的推移保持一致的流式概况,但RPS19启动子克隆之一(5363)除外,该克隆在8月的时间点显示许多细胞的荧光减弱。

分化:为了确定分化后表达的稳定性,使工程化细胞系接受分化方案的处理,以将它们导向神经元或心肌细胞类型。

表16:神经元方案。

/>

/>

在分化的第21天时,所有细胞都出现了可见的神经元表型。流式细胞术显示许多细胞对于CAG、UBC(v1)和HSP90AB1del400启动子的荧光减弱。UBCv2、UBA52和RPS19启动子显示出密集且稳定的表达,标记基因HSP90AB1、CTNNB1和MYL6也是如此。

表17:心脏方案。

/>

在分化的第21天时,CAG、UBC(v1)、RPS19和HSP90AB1del400启动子细胞系表现出不同程度的表达沉默。UBC(v2)和UBA52启动子显示出密集且稳定的表达,标记基因HSP90AB1、ACTB、CTNNB1和MYL6也是如此。

新生成的启动子区域UBCv2、UBA52、RPS19和HSP90AB1del400在培养期间的4个月内实现了稳定的iPSC表达,而到7个月时只有RPS19在此时显示出一定的沉默。结果表明,基因座HSP90AB1、ACTB、CTNNB1和MYL6实现了稳定表达带标记的ZsGreen报告子。在两种不同的分化方案下,UBCv2和UBA52报告子表现稳定,由基因HSP90AB1、CTNNB1和MYL6驱动的表达也是如此。

****

本文公开的和要求保护的所有方法均可以根据本公开来制定和实施,而无需进行不必要的实验。尽管本发明的组合物和方法已经以优选实施方案的形式进行了描述,但是对于本领域的技术人员来说显而易见的是,在不脱离本发明的概念、精神和范围的前提下,可以对本文所述的方法和步骤或步骤的顺序进行变动。更具体地说,显然,某些在化学上和生理学上都相关的作用剂可以替代本文所述的作用剂,同时将获得相同或相似的结果。对于本领域技术人员来说显而易见的是,所有这些类似的替代和修改都被视为处于如所附权利要求所定义的本发明的精神、范围和概念内。

参考文献

以下参考文献在一定程度上提供了对本文所述的示例性程序或其他细节的补充,这些参考文献明确通过引用方式并入本文。

Alexander等人,Proc.Nat.Acad.Sci.USA,85:5092-5096,1988

Ausubel等人,Current Protocols in Molecular Biology,GreenePubl.Assoc.Inc.

&John Wiley&Sons,Inc.,MA,1996Blomer等人,1997

Chen和Okayama,Mol.Cell Biol.,7(8):2745-2752,1987

Chen等人,Nature Methods 8:424-429,2011

Ercolani等人,J.Biol.Chem.,263:15335-15341,1988

Evans等人,见:Cancer Principles and Practice of Oncology,Devita等人(编著),

Lippincot-Raven,NY,1054-1087,1997

Fechheimer等人,Proc Natl.Acad.Sci.USA,84:8463-8467,1987

Fraley等人,Proc.Natl.Acad.Sci.USA,76:3348-3352,1979

Gaj等人,Trends in Biotechnology,2013,31(7),397-405

Graham和Van Der Eb,Virology,52:456-467,1973

国际公布号WO 02/016536

国际公布号WO 03/016496

国际公布号WO 2003/0211603

国际公布号WO 2007/069666

国际公布号WO 2007/069666

国际公布号WO 2012/0196360

国际公布号WO 94/09699

国际公布号WO 95/06128

国际公布号WO 98/30679

国际公布号WO 98/53058

国际公布号WO 98/53059

国际公布号WO 98/53060

Kaeppler等人,Plant Cell Reports 9:415-418,1990

Kaneda等人,Science,243:375-378,1989

Karin等人,Cell,36:371-379,1989

Kato等人,J.Biol.Chem.,266:3361-3364,1991

Kyttala等人,Stem Cell Reports,6(2):200-12,2016

Langle-Rouault等人,J.Virol.,72(7):6181–6185,1998

Levitskaya等人,Proc.Natl.Acad.Sci.USA,94(23):12616–12621,1997

Ludwig等人,Nat.Biotechnol.,24:185-187,2006b

Ludwig等人,Nat.Methods,3:637-646,2006a

Macejak和Sarnow,Nature,353:90-94,1991

Maniatis等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor

Press,Cold Spring Harbor,N.Y.,1988

Mann等人,Cell,33:153-159,1983

Nabel等人,Science,244(4910):1342-1344,1989

Naldini等人,Science,272(5259):263-267,1996

Ng,Nuc.Acid Res.,17:601-615,1989

Nicolas和Rubenstein,见:Vectors:A survey of molecular cloning vectorsand their uses,Rodriguez和Denhardt编著,Stoneham:Butterworth,第494-513页,1988

Nicolau和Sene,Biochim.Biophys.Acta,721:185-190,1982

Nicolau等人,Methods Enzymol.,149:157-176,1987

Paskind等人,Virology,67:242-248,1975

Pelletier和Sonenberg,Nature,334(6180):320-325,1988

Potrykus等人,Mol.Gen.Genet.,199(2):169-177,1985

Potter等人,Proc.Natl.Acad.Sci.USA,81:7161-7165,1984

Quitsche等人,J.Biol.Chem.,264:9539-9545,1989

Richards等人,Cell,37:263-272,1984

Rippe等人,Mol.Cell Biol.,10:689-695,1990

Sambrook和Russell,Molecular Cloning:A Laboratory Manual,第3版ColdSpring Harbor 1997

Takahashi等人,Cell,131:861-872,2007

Temin,见:Gene Transfer,Kucherlapati(编著),NY,Plenum Press,149-188,1986

Tur-Kaspa等人,Mol.Cell Biol.,6:716-718,1986

美国专利号4,683,202

美国专利号5,302,523美国专利号5,322,783美国专利号5,384,253美国专利号5,464,765美国专利号5,538,877美国专利号5,538,880美国专利号5,550,318美国专利号5,556,954美国专利号5,563,055美国专利号5,563,055美国专利号5,580,859美国专利号5,589,466美国专利号5,591,616美国专利号5,610,042美国专利号5,656,610美国专利号5,702,932美国专利号5,736,524美国专利号5,780,448美国专利号5,789,215美国专利号5,925,565美国专利号5,928,906美国专利号5,935,819美国专利号5,945,100美国专利号5,981,274美国专利号5,994,136美国专利号5,994,136美国专利号5,994,624美国专利号6,013,516美国专利号6,103,470美国专利号6,140,081美国专利号6,416,998美国专利号6,453,242美国专利号6,534,261美国专利号7,442,548

美国专利号7,598,364

美国专利号7,989,425

美国专利号8,058,065

美国专利号8,071,369

美国专利号8,129,187

美国专利号8,268,620

美国专利号8,278,620

美国专利号8,546,140

美国专利号8,546,140

美国专利号8,741,648

美国专利公布号2002/0076747

美国专利公布号20020055144

美国专利公布号2005/0064474

美国专利公布号2006/0188987

美国专利公布号2007/0218528

美国专利公布号20090148425

美国专利公布号20090246875

美国专利公布号2010/0003757

美国专利公布号2010/0210014

美国专利公布号2011/0301073

美国专利公布号2011/0301073

美国专利公布号20120276636Wilson等人,Science,244:1344-1346,1989Wong等人,Gene,10:87-94,1980Yamanaka等人,Cell,131(5):861-72,2007Zufferey等人,Nat.Biotechnol.,15(9):871-875,1997

相关技术
  • 一种用于鉴定多能干细胞内源和外源多能性基因表达的检测引物组、试剂盒及检测方法
  • 用于修复基因突变的基因修复试剂盒及多能干细胞的制备方法
技术分类

06120116586520