掌桥专利:专业的专利平台
掌桥专利
首页

干细胞衍生谱系条形编码

文献发布时间:2023-06-19 12:07:15



相关申请的交叉引用

本申请要求2018年8月18日提交的美国临时专利申请号62/765,016的权益,将其公开内容通过引用以其整体特此并入。

关于联邦政府资助研究或开发的声明

本发明是在由美国国立卫生研究院授予的授权号R44TR002572-03下在美国政府支持下完成的。美国政府享有本发明的一定权利。

技术领域

本发明涉及用于制备含有用以鉴别活共培养物中的独特细胞谱系的谱系条形码的干细胞衍生多色报告细胞系的方法以及使用所述干细胞衍生多色报告细胞系例如在活细胞中实时监测途径、表型、测定、化合物作用模式和模型疾病的方法。

背景技术

确定对内部或外部刺激的细胞特定反应需要可视化和监测细胞的类型、表型和途径以及它们之间的动态相互作用。目前可视化此类反应的方法效率低、成本高,并且对在细胞和分子水平上发生的多参数动态过程提供非常有限的见解。例如,传统上使用体内临床前动物模型进行药物发现和/或对药物候选物的毒理学评价,所述体内临床前动物模型是低通量的、成本高、不能充分预测在人体内的毒性,并且对化合物治疗作用机制或化合物毒性易感性提供很少的见解。类似地,常规使用的基于细胞的测定(如蛋白质印迹)提供了对使用活细胞中的时间谱分析(profiling)将更好地表征和理解的过程的端点读出,并且在通量上也是极其有限的。这些传统方法的通量远远不及新化学品产生的速度,不管它们是出于药学上的、农业上的还是其他目的(如营养、化妆品、个人护理等)开发的化合物。对这些新化学品的功效或可能对人类健康构成的风险评价的需要要求开发新的筛选工具,所述新的筛选工具可以在与每周评价数十万种化合物兼容的通量下对与此类化合物相关的机制提供有意义的见解。尽管基于细胞的方法(如免疫荧光显微术和活力测定)已经以高通量形式展示,但这些方法仍然局限于在死细胞系统中测定的端点读出,这严重限制了它们的生理相关性并极大地限制了它们对谱分析疾病相关活细胞中复杂多参数过程的适用性。理想的是,新的筛选工具将能够解决工具的严重不足以使得能够可视化和定量基于细胞的生理学相关模型中特定细胞生理学的变化,如通过基于干细胞的测定和疾病模型实现的那些。这些需求可以通过适当配置的干细胞活细胞方法来解决,这是本发明的重点。

概述的本发明提供了实施称为谱系条形编码的谱系特异性标记方法以作为用于需要高通量技术的药物发现和毒理学筛选的模型稳健地鉴别活干细胞培养物和共培养物中的独特细胞谱系从而建立用于化合物谱分析和药物靶标发现的测定的手段。

多重测定披露于通过引用以其整体并入本文的PCT/US2018//032834中。

本文引用的所有参考文献(包括专利申请和出版物)均通过引用以其整体并入。

发明内容

在一些方面,本发明提供了一种多顺反子报告载体,其包含:与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

在一些方面,本发明提供了一种多顺反子报告载体,其包含:与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在一些方面,本发明提供了一种多顺反子报告载体,其包含:与编码细胞器特异性多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述细胞器特异性多肽是H2B。在一些实施方案中,所述组成型启动子是巨细胞病毒a(CMV)、胸苷激酶(TK)、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在以上方面和实施方案的一些实施方案中,所述第一启动子和所述第二启动子处于不同的取向。在一些实施方案中,所述第一启动子和所述第二启动子通过隔离子核酸分开。在一些实施方案中,所述顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。在一些实施方案中,所述一种或多种自切割肽是病毒自切割肽。在一些实施方案中,所述一种或多种病毒自切割肽是一种或多种2A肽。在一些实施方案中,一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。

在一些实施方案中,所述报告多肽还包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。在一些实施方案中,所述肽接头包含序列Gly-Ser-Gly。

在一些实施方案中,所述报告多肽是荧光报告多肽。在一些实施方案中,每个顺反子的所述报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

在一些实施方案中,所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。在一些实施方案中,所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。在一些实施方案中,所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。在一些实施方案中,所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

在一些实施方案中,所述谱系特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑或皮肤谱系的细胞具有特异性。在一些实施方案中,所述谱系特异性启动子是亚谱系特异性启动子。在一些实施方案中,所述谱系特异性启动子是心脏特异性启动子。在一些实施方案中,所述心脏特异性启动子是MCLV2v、SLN、SHOX2、MYBPC3、TNNI3或α-MHC启动子。在一些实施方案中,所述谱系特异性启动子是神经特异性启动子。在一些实施方案中,所述神经特异性启动子是vGAT、TH、GFAP或vGLUT1启动子。

在一些实施方案中,所述载体还包含位于所述开放阅读框的3'的位点特异性重组酶序列。在一些实施方案中,所述载体还包含编码选择性标记的核酸,其中当所述位点特异性重组酶序列尚未重组时,编码所述选择性标记的核酸不与所述启动子可操作地连接,并且当所述位点特异性重组酶序列与其靶位点特异性重组酶序列重组时,编码所述选择性标记的核酸与所述启动子可操作地连接。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸序列和/或attP核酸和/或loxP核酸序列。在一些实施方案中,所述选择性标记赋予对潮霉素、Zeocin

在一些实施方案中,所述一种或多种多肽包含可用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用或毒性反应的多肽。

在一些方面,本发明提供了一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。

在一些方面,本发明提供了一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。在一些实施方案中,所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在一些方面,本发明提供了一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含与编码管家多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。在一些实施方案中,所述管家多肽是H2B。

在一些实施方案中,所述组成型启动子是巨细胞病毒a(CMV)、胸苷激酶(TK)、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述第一启动子和所述第二启动子处于不同的取向。在一些实施方案中,所述第一启动子和所述第二启动子通过隔离子核酸分开。

在一些实施方案中,所述启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在一些实施方案中,所述顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。在一些实施方案中,所述一种或多种自切割肽是病毒自切割肽。在一些实施方案中,所述一种或多种病毒自切割肽是一种或多种2A肽。在一些实施方案中,所述一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。在一些实施方案中,所述报告多肽还包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。在一些实施方案中,所述肽接头包含序列Gly-Ser-Gly。

在一些实施方案中,所述报告多肽是荧光报告多肽。在一些实施方案中,每个顺反子的所述报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

在一些实施方案中,所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。在一些实施方案中,所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。在一些实施方案中,所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。在一些实施方案中,所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

在一些实施方案中,其中所述谱系特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑或皮肤谱系的细胞具有特异性。在一些实施方案中,所述谱系特异性启动子是亚谱系特异性启动子。在一些实施方案中,所述谱系特异性启动子是心脏特异性启动子。在一些实施方案中,所述心脏特异性启动子是MCLV2v、SLN、SHOX2、MYBPC3、TNNI3或α-MHC启动子。在一些实施方案中,所述谱系特异性启动子是神经特异性启动子。在一些实施方案中,所述神经特异性启动子是vGAT、TH、GFAP或vGLUT1启动子。

在一些实施方案中,将编码一种或多种多肽的核酸框内插入所述一个或多个MCS中。在一些实施方案中,至少一个顺反子包含编码细胞器特异性多肽的核酸。在一些实施方案中,所述细胞器特异性多肽是H2B。在一些实施方案中,至少一个顺反子包含编码细胞器标记的核酸。在一些实施方案中,所述细胞器标记包含与所述报告多肽融合的H2B、α-辅肌动蛋白2或线粒体靶向信号。

在一些实施方案中,本发明提供了如本文所述的多报告干细胞,其中所述一种或多种多肽包含可用于在所述干细胞分化之后谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型的多肽。在一些实施方案中,其中所述谱分析是在单一细胞上进行的。在一些实施方案中,其中所述报告多肽可以通过显微术、高通量显微术、荧光激活细胞分选(FACS)、发光或使用读板仪来可视化。在一些实施方案中,在所述干细胞分化之前、期间或之后分析所述报告多肽。

在一些实施方案中,将所述多顺反子报告构建体整合在所述多报告干细胞基因组中的第一特定位点处。在一些实施方案中,本发明的多报告干细胞还包含整合在所述多报告干细胞基因组中的第二特定位点处的核酸。在一些实施方案中,整合在所述多报告干细胞基因组中的第二特定位点处的核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas9表达载体或诱导型Cas9表达载体。

在一些方面,本发明提供了一种多报告载体文库,其中所述文库包含如本文所述的两种或更多种多顺反子报告载体,其中所述两种或更多种多顺反子报告载体包含与报告多肽融合的不同转基因,其中当引入细胞时,每种载体上的所述不同转基因中的两个或更多个以基本上1:1化学计量表达。在一些方面,本发明提供了一种多报告载体文库,其中所述文库包含如本文所述的两种或更多种多顺反子报告载体,其中所述两种或更多种多顺反子报告载体包含与融合至不同报告多肽的转基因可操作地连接的不同谱系特异性启动子,使得所述报告多肽的表达可以基于所述谱系特异性启动子来区分细胞类型。在一些实施方案中,将相同的转基因与所述不同的谱系特异性启动子和所述不同的报告多肽可操作地连接。在一些实施方案中,所述转基因编码管家多肽和/或细胞器特异性多肽。在一些实施方案中,所述转基因编码H2B、α-辅肌动蛋白2或线粒体靶向信号。

在一些实施方案中,本发明提供了如本文所述的多报告载体文库,其中所述报告载体编码一个或多个转基因,所述一个或多个转基因可以用于在所述细胞分化之后谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型。

在一些实施方案中,所述生物途径或表型是与疾病相关的途径或表型。在一些实施方案中,所述疾病是癌症、心血管疾病、神经退行性或神经系统疾病或自身免疫性疾病。在一些实施方案中,所述生物途径或表型是与所述细胞内的毒性反应机制相关的途径或表型。在一些实施方案中,所述生物途径或表型是与衰老相关的途径或表型。在一些实施方案中,所述生物途径是与细胞增殖、细胞分化、细胞存活、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、氧化应激、染色质/表观遗传学、MAPK信号传导、PI3K/Akt信号传导、蛋白质合成、翻译控制、蛋白质降解、细胞周期和检查点控制、细胞代谢、发育和分化信号传导、免疫学和炎症信号传导、酪氨酸激酶信号传导、膜泡运输、细胞骨架调控、泛素途径相关的途径。

在一些实施方案中,本发明提供了一种多报告细胞文库,其中所述文库中的每种细胞包含如本文所述的多顺反子报告载体,其中所述文库中的细胞包含不同的多顺反子报告载体。在一些实施方案中,每种多顺反子报告载体包含与共同报告多肽融合、与共同谱系特异性启动子可操作地连接的共同转基因。在一些实施方案中,每种多顺反子报告载体包含与不同报告多肽融合并与不同谱系特异性启动子可操作地连接的共同转基因。

在一些实施方案中,本发明提供了一种包含如本文所述的两种或更多种多报告细胞的多报告细胞文库,其中所述文库中的两种或更多种多报告细胞包含不同的多顺反子报告载体。

在一些实施方案中,所述文库包含多能细胞、多潜能细胞和/或祖细胞。在一些实施方案中,所述文库包含不同的多能细胞、多潜能细胞和/或祖细胞。在一些实施方案中,所述多能细胞或所述多潜能细胞包括诱导多能干细胞、多潜能细胞、造血细胞、内皮祖受体细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中的一种或多种。在一些实施方案中,在引入所述多顺反子报告载体之后,使所述多能细胞多报告细胞或所述多潜能细胞多报告细胞分化。在一些实施方案中,将不同的多顺反子报告载体引入等基因受体细胞。

在一些实施方案中,本发明提供了如本文所述的多报告细胞文库,其中在引入所述多顺反子报告载体之后,使所述多能细胞或所述多潜能细胞分化。在一些实施方案中,将不同的多顺反子报告载体引入等基因多能或多潜能受体细胞。在一些实施方案中,所述多顺反子报告载体编码一个或多个转基因,所述一个或多个转基因可以用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型,并且其中与所述谱系特异性启动子可操作地连接的转基因的表达用于鉴定细胞类型或分化阶段。在一些实施方案中,所述生物途径或表型是与疾病相关的途径或表型。在一些实施方案中,所述疾病是癌症、心血管疾病、神经退行性或神经系统疾病或自身免疫性疾病。在一些实施方案中,所述生物途径或表型是与所述细胞内的毒性反应机制相关的途径或表型。.在一些实施方案中,所述生物途径或表型是与衰老相关的途径或表型。在一些实施方案中,所述生物途径是与细胞增殖、细胞分化、细胞存活、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、氧化应激、染色质/表观遗传学、MAPK信号传导、PI3K/Akt信号传导、蛋白质合成、翻译控制、蛋白质降解、细胞周期和检查点控制、细胞代谢、发育和分化信号传导、免疫学和炎症信号传导、酪氨酸激酶信号传导、膜泡运输、细胞骨架调控或泛素途径相关的途径。

在一些实施方案中,本发明的文库包含两种或更多种不同谱系的细胞。在一些实施方案中,所述不同谱系的细胞包含谱系特异性报告多肽。

在一些方面,本发明提供了一种试剂盒,其包含一种或多种如本文所述的多顺反子报告载体。在一些实施方案中,本发明提供了一种试剂盒,其包含一种或多种如本文所述的多报告干细胞。在一些实施方案中,所述试剂盒包含排列在多孔板中的多顺反子报告干细胞的文库。在一些实施方案中,将所述多孔板中的干细胞低温保存。

在一些方面,本发明提供了一种谱分析活细胞中的两种或更多种多肽的方法,所述方法包括确定如本文所述的多报告干细胞的转基因中的两个或更多个的表达和/或位置。在一些实施方案中,在所述干细胞分化之前、期间或之后进行谱分析。在一些实施方案中,所述方法用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型。

在一些实施方案中,在一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。在一些实施方案中,在1分钟、5分钟、10分钟、15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、12小时、24小时、2天、4天、7天、14天、21天、30天、1个月、3个月、6个月、9个月、1年或超过1年中的一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。

在一些实施方案中,本发明提供了一种测量药剂对活细胞中两种或更多种多肽的谱的影响的方法,所述方法包括使如本文所述的多报告干细胞经受所述药剂,以及确定所述两个或更多个转基因响应于所述药剂在所述细胞中的表达和/或位置。在一些实施方案中,在所述干细胞分化之前、期间或之后进行谱分析。在一些实施方案中,所述药剂是药物或药物候选物。在一些实施方案中,所述药剂是癌症药物或癌症药物剂。在一些实施方案中,所述方法是毒理学筛选。在一些实施方案中,确定所述两个或更多个转基因的表达和/或位置是在多报告细胞文库中进行的。在一些实施方案中,通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定所述文库中细胞的谱系。在一些实施方案中,使用单一细胞获得所述谱。在一些实施方案中,通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定所述单一细胞的谱系。

在一些实施方案中,本发明提供了一种测量药剂对一池不同谱系的活细胞中两种或更多种多肽的谱的影响的方法,所述方法包括使一池如本文所述的多报告干细胞经受所述药剂,以及确定所述两个或更多个转基因响应于所述药剂在所述细胞中的表达和/或位置。在一些实施方案中,在所述干细胞分化之前、期间或之后进行谱分析。在一些实施方案中,所述药剂是药物或药物候选物。在一些实施方案中,所述药剂是癌症药物或癌症药物剂。在一些实施方案中,所述方法是毒理学筛选。在一些实施方案中,确定所述两个或更多个转基因的表达和/或位置是在多报告细胞文库中进行的。在一些实施方案中,通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定所述文库中细胞的谱系。在一些实施方案中,使用单一细胞获得所述谱。在一些实施方案中,通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定细胞的谱系。

在一些实施方案中,通过显微术、高通量显微术、荧光激活细胞分选(FACS)、发光、使用读板仪、质谱或深度测序来测量所述两个或更多个转基因的表达和/或位置。

在一些方面,本发明提供了一种用于接受多顺反子报告载体的受体细胞,其中所述受体细胞包含整合到宿主细胞基因组中的特定位点的重组核酸,其中所述重组核酸包含与编码融合多肽的核酸可操作地连接的第一启动子,其中所述融合多肽包含报告结构域和选择性标记结构域,并且其中所述核酸包含位于编码所述融合多肽的核酸的5'端处的两个位点特异性重组酶核酸序列。在一些实施方案中,所述核酸包含位于所述两个特异性重组酶核酸序列的5'的两个ATG序列。在一些实施方案中,所述启动子是组成型启动子。在一些实施方案中,所述组成型启动子是CMV启动子、TK启动子、eF1-α启动子、UbC启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸序列和/或attP核酸序列和/或loxP核酸序列。在一些实施方案中,所述位点特异性重组酶序列包含PhiC31 attP核酸序列和Bxb1 attP核酸序列。在一些实施方案中,所述融合多肽的报告结构域是荧光报告结构域。在一些实施方案中,所述荧光报告结构域选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。在一些实施方案中,所述融合多肽的报告结构域是mCherry报告结构域。在一些实施方案中,所述融合多肽的选择性标记结构域赋予对潮霉素、Zeocin

在本发明的一些实施方案中,所述受体细胞包含用于接受第一多顺反子报告载体的第一重组核酸和用于接受第二表达构建体的第二重组核酸,其中将所述第一重组核酸整合到宿主细胞基因组中的第一特定位点中,并且将所述第二重组核酸整合到宿主细胞基因组中的第二特定位点中。在一些实施方案中,所述第二重组核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas表达载体、诱导型Cas表达载体、组成型Cas9表达载体或诱导型Cas9表达载体。在一些实施方案中,由所述受体细胞制备报告细胞,其中将多顺反子报告载体整合到所述第一特定位点中,并且将组成型或诱导型Cas表达载体(例如,Cas9表达载体)整合到第二特定位点中。在一些实施方案中,本发明提供了一种方法,其中将如本文所述的报告细胞排列在多孔板中,并且用作使用单一或寡核苷酸合并sgRNA的筛选的基础。

在一些方面,本发明提供了一种用于产生用以接受多顺反子报告载体的受体细胞的方法,所述方法包括将重组核酸引入细胞,其中所述重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第一核酸、第一启动子、两个ATG序列、两种位点特异性重组酶核酸、编码第一报告多肽和选择性标记的核酸、用于将同源重组靶向至所述细胞中的特定位点的第二核酸、第二启动子和编码第二报告多肽或细胞毒性多肽的核酸,其中表达所述第一报告多肽而不表达所述第二报告多肽或细胞毒性多肽指示将所述重组核酸靶向整合至细胞基因组中的所述特定位点,并且表达所述第一报告多肽和所述第二报告多肽或细胞毒性多肽指示随机整合在细胞基因组中。在一些实施方案中,使用以下将所述重组核酸整合到所述细胞的基因组中:a)包含核酸酶和指导RNA的RNA指导的重组系统,b)TALEN核酸内切酶,或c)ZFN核酸内切酶。在一些实施方案中,选择表达所述第一报告多肽但不表达所述第二报告多肽或细胞毒性多肽的细胞。在一些实施方案中,所述位点特异性重组酶核酸包含FRT核酸序列和/或attP核酸序列和/或loxP核酸序列。在一些实施方案中,所述第一报告多肽是荧光多肽,并且所述第二报告多肽是不同的荧光多肽。在一些实施方案中,所述第一报告多肽和所述第二报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。在一些实施方案中,所述第一报告多肽是mCherry报告物,并且所述第二报告多肽是GFP。在一些实施方案中,所述第一报告多肽是荧光多肽,并且所述第二报告多肽是细胞毒性多肽。在一些实施方案中,所述第一选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP,并且所述细胞毒性多肽选自胸苷激酶(TK,例如HSV TK)或白喉毒素A(DTA)。在一些实施方案中,所述第一报告多肽是mCherry报告物,并且所述细胞毒性多肽是HSV TK或DTA。在一些实施方案中,所述选择性标记赋予对潮霉素、Zeocin

在一些实施方案中,制备受体细胞的所述方法还包括将第二重组核酸引入用于接受第二多顺反子报告载体的细胞,其中所述第二重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第三核酸、第三启动子、两个ATG序列、两种位点特异性重组酶核酸、编码第三报告多肽和选择性标记的核酸、用于将同源重组靶向至所述细胞中的特定位点的第四核酸、第四启动子和编码第四报告多肽或细胞毒性(例如,杀伤)多肽的核酸,其中表达所述第三报告多肽而不表达所述第四报告多肽或细胞毒性多肽指示将所述重组核酸靶向整合至细胞基因组中的所述特定位点,并且表达所述第三报告多肽和所述第四报告或细胞毒性多肽指示随机整合在细胞基因组中。

附图说明

图1A示出了多顺反子载体,其可以从单一启动子表达多达4种转录物。所述平台含有用于将报告物整合在A中所示的受体位点中的attB Bxb1特异性位点。我们的平台被配置成使得能够即插即用式插入/交换启动子、抗性标记、荧光标记物和目的蛋白质。图1B显示MTS-mVenus(线粒体)和TagBFP-H2B(DNA/细胞核)在使用多顺反子平台的WTC hiPSC系中的瞬时表达展示了这些报告物的正确且独立的定位。图1C显示hiPSC WTC受体细胞稳定表达重组在受体位点处的TagBFP对照报告物。图像示出了在对照TagBFP报告物重组和抗生素选择之后的WTC

图2A描写了iPSC受体细胞系和由其衍生的3种心脏谱系特异性报告细胞系。一旦使细胞分化,它们就会表达不同的经标记的标记,这取决于它们是哪一种谱系:心室、心房或结。图2B描绘了用于心肌细胞谱系特异性表达的多顺反子构建体。CM-功能性描绘了在心室、心房和结hiPSC-CM中实现谱系特异性核条形编码以监测CM细胞的功能性改变的构建体。组装了用于监测CM结构性改变的三种不同的策略:构建体携带伴有3种经标记的细胞结构(细胞核/DNA,H2B;线粒体,MTS;和肌节,ACTN)(FP-荧光蛋白)的同时表达的谱系特异性核条形编码。CM-结构性-1-最小载体大小配置;CM-结构性-2-增加的启动子活性配置;CM-结构性-3-增加的表达配置。心肌细胞谱系特异性条形编码构建体以及用于一般CM表达和用于未分化hiPSC中的表达的2种对照构建体。

图3A和图3B示出了用CM-结构性-1瞬时转染的iPSC衍生心肌细胞,所述CM-结构性-1携带在WTC-11hiPSC衍生心肌细胞中在组成型启动子CAGGS(图3A)或3种心肌细胞谱系特异性启动子(MLC2v、SHOX2和SLN)(图3B)的控制下的经荧光标记的MTS(线粒体)、ACTN2(辅肌动蛋白)和H2B(细胞核),展示了这些报告物的表达。比例尺10μm。

图4A和图4B描绘了当使用CM-谱系特异性启动子时CM-Tox2系统相对于CM-Tox1的表达增加,以驱动单一报告物的表达。在转染后4天可视化的用CM-结构性1或2瞬时转染的iPSC衍生心肌细胞的代表性图像。图4A用由组成型启动子CAGGS驱动的CM-Tox1(左)和CM-Tox2(右)转染的iPSC衍生CM在转染细胞的数量或表达水平方面没有显示出任何显著性差异。图4B用由结谱系特异性启动子SHOX2驱动的CM-Tox1(左)和CM-Tox2(右)转染的iPSC衍生CM。在这种情况下,转染细胞的数量和H2B-Venus的表达水平都有明显增加。比例尺10μm。

图5示出了用CM-结构性-2瞬时转染的iPSC衍生心肌细胞,所述CM-结构性-2使用tTA-TRE系统来在3种心肌细胞谱系特异性启动子(MLC2v、SHOX2和SLN)的控制下驱动标记的MTS(线粒体)、ACTN2(辅肌动蛋白)和H2B(细胞核)在WTC-11HiPSC衍生心肌细胞中的表达,展示了这些报告物的正确定位。比例尺10μm。

图6A描绘了经培养的iPSC衍生心肌细胞针对2种心脏标记的免疫标记。将衍生自WTC iPSC的第15天心肌细胞用针对心脏标记α-辅肌动蛋白和心肌肌钙蛋白T的抗体标记,并且通过显微术来检查。代表性图像示出了肌节组构的特征性图案(箭头状物)。图6B iPSC衍生心肌细胞的流式细胞术。将衍生自WTC(第26天)和NCRM-5(第16天)iPSC的心肌细胞用针对心脏标记心肌肌钙蛋白T的抗体标记,并且通过流式细胞术来检查(灰色柱状图)。将对照样品用相同同种型一抗标记(黑色柱状图)。cTnT阳性细胞的群体和百分比由括号(标记为“抗cTnT+”)表示。

图7A描写了iPSC受体细胞系和由其衍生的4种神经谱系特异性报告细胞系。一旦使细胞分化,它们就会表达不同的经标记的标记,这取决于它们是哪一种谱系:GABA能、多巴胺能、谷氨酸能和星形胶质细胞。图7B描绘了用于神经谱系特异性表达的多顺反子构建体。(A)在GABA能、多巴胺能、谷氨酸能和星形胶质细胞hiPSC中实现谱系特异性核条形编码的谱系特异性构建体。用于组装构建体以实现伴有3种经标记的细胞结构(细胞核/DNA,H2B;线粒体,MTS;和膜,palm)(FP-荧光蛋白)的同时表达的谱系特异性核条形编码的三种不同策略。NP-Tox1-增加的启动子活性配置;NP-Tox2-最小载体大小配置;NP-Tox3-增加的表达配置。神经谱系特异性条形编码构建体以及用于未分化hiPSC中的一般表达的对照构建体。

图8描绘了即插即用式受体位点设计。可定制的设计(用虚线和非虚线指示)允许选择1)整合的基因座;2)用于报告构建体重组的整合酶;3)荧光团和选择标记以及4)阴性或荧光随机整合标记。受体位点设计含有:CAG组成型启动子;在不同框中的2个替代性ATG;用于通过PhiC31进入重组的attP位点;用于通过BxB1进入重组的attP位点;与嘌呤霉素基因融合的mCherry荧光标记(或与吉欧霉素抗性基因(吉欧霉素))或杀稻瘟菌素融合的TagBFP);以及阴性选择标记(白喉毒素-A(DT-A)或单纯疱疹病毒胸苷激酶(HSV-TK))或位于AAVS1-右同源臂(AAVS1-R)之后的随机整合GFP标记的选择。HSV-TK允许在将细胞暴露于鸟苷类似物更昔洛韦(GCV)之后,具有随机质粒整合的细胞的选择性自杀效应。HSV-TK将GCV磷酸化为单磷酸GCV,其通过宿主激酶进一步转化为二磷酸GCV和三磷酸GCV。三磷酸GCV导致过早的DNA链终止和细胞凋亡。另一方面,DTA是白喉毒素的片段,其一旦在细胞中表达,就会抑制蛋白质合成,从而导致细胞死亡。GFP允许在随机整合与靶向整合之间进行区分。具有随机整合的细胞由于GFP表达而发出绿色荧光,而具有靶向整合的细胞由于CMV-GFP的丢失而不发出绿色荧光,因为CMV-GFP位于整合到细胞中的受体位点区域(在AAVS1-L与AAVS1-R之间或在H11-L与H11-R之间,用黑线指示)之外。这些随机整合标记可以由CMV、CAG或eiFα组成型启动子驱动。虚线和非虚线方框指示可以重排列的区域,灰色阴影方框指示存在于待整合在不同的基因组基因座中的每种质粒中的区域。

具体实施方式

本发明提供了干细胞谱系特异性标记,其可以谱分析干细胞衍生的分化活细胞的异质群体中的单独细胞谱系(例如,在单一活细胞中)。在一些方面,本发明提供了多顺反子报告载体,其包含:与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

在一些方面,本发明提供了多顺反子报告载体,其包含:与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在一些方面,本发明提供了多顺反子报告载体,其包含:与编码核多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述管家多肽是H2B。

在一些实施方案中,本发明提供了多顺反子报告载体,其包含:与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为1:1化学计量。在一些方面,本发明提供了用于接受多顺反子报告载体的受体细胞。在又其他方面,本发明提供了用于多重高内涵测定的多报告细胞,其中所述多报告细胞包含本文所述的任何多顺反子报告载体。本文所述的多报告细胞可以用于活细胞测定中作为谱分析或区分细胞行为的方面和可以由候选治疗剂或其他化合物或其他刺激物或其组合诱导的对这些行为的扰动的手段,以谱分析活细胞(例如,单一活细胞)中多种多肽的表达和活性,所述细胞行为的方面包括但不限于单独或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用,细胞行为的方面包括但不限于生物途径、生物途径之间的串扰、细胞稳态、细胞器稳态和毒性。

基于活细胞显微术的高通量筛选提供了在细胞系统中筛选化合物的机会,所述细胞系统重演无法通过终点测定捕获的信号转导和细胞表型的动态性质。干细胞或人诱导多能干细胞(iPSC)通过以可扩展至高通量应用的形式提供生理相关性和高再现性而具有作为在活细胞筛选中使用的细胞模型的巨大潜力。

本文描述了新型的方法、具有条形码化谱系的干细胞和多重高通量测定,所述方法、干细胞和多重高通量测定提供了在干细胞中细胞应激、稳态和相关事件的机制和表型读出,所述干细胞具有在体外分化为多种细胞类型的潜力。已知多种多样的化学品会扰动稳态并且引起细胞应激,并且因此在理解候选治疗剂或其他化学品的活性机制或毒性机制或基因扰动的情境下,其是细胞生理学监测的重要方面。本文所述的方法可以用于询问治疗剂的作用机制和任何潜在的附带细胞毒性以及其他化学品(如工业和环境化学品)的潜在毒性和谱分析基因操纵的生物效应的能力。

在一些实施方案中,所述方法、细胞和多重高通量测定用于谱分析心脏毒性。心脏毒性易感性导致进入跨治疗适应症的I期临床试验的大约三分之一的治疗性化合物失败。因此,在药物发现过程中早期谱分析心脏毒性信号的改进方法将有助于改善进入临床试验的化合物的有效性和成功率。

心脏毒性代表癌症治疗的有害副作用,导致相当大的发病率和死亡率。用于治疗癌症的细胞毒性剂和靶向疗法(包括经典的化学治疗剂、抗体和小分子酪氨酸激酶抑制剂以及化学预防剂)全部均影响心血管系统,并且可能导致严重的影响,如心力衰竭、心室功能异常和心肌缺血。癌症疗法诱导的心肌病的上升表明,在评价和开发任何抗癌药物期间必须仔细权衡心脏毒性的风险。

由于缺乏在生物学相关的心脏细胞中实时监测毒理学的这个方面的系统,人们尚未完全了解将癌症疗法与心肌病联系起来的分子机制,包括应激诱导的转录因子对细胞存活或死亡的具体贡献。本文所述的测定通过提供多重荧光报告系统满足了此需求,所述荧光报告系统使用人干细胞衍生报告心肌细胞提供了细胞应激和细胞器稳态的读出。通过将此方法适应于其他IPS细胞衍生谱系和亚谱系,还可以针对神经毒性、发育毒性、肝毒性或任何其他类型的组织毒性评估分子和潜在治疗剂对癌症和其他疾病的影响。

此外,也不甚了解支持由于心脏毒性在I期临床试验中的高失败率的分子机制,并且本文所述的测定通过提供多重荧光报告系统解决了这一问题,所述多重荧光报告系统使用人干细胞衍生报告心肌细胞提供了细胞应激和细胞器稳态的读出。

使用原代心肌细胞、原代神经元或其他原代细胞类型的主要限制是与获得和维持这些细胞相关的技术困难。例如,虽然永生化心脏细胞很方便,因为它们可以容易地增殖、搏动,并且在一些情况下可以稳定地维持心脏表型,但是它们的代谢和形态可能与心肌细胞不同,因此在毒理学研究中限制了它们的使用。衍生自干细胞或iPSC的心肌细胞克服了这些缺点,并且提供了不仅评估分子对终末分化细胞的影响,而且通过不同的分化阶段研究各种分子的发展或影响的工具。这是特别重要的,因为对祖细胞和分化细胞的可靠测试虽然有价值但是很少。此外,可以从人类受试者中产生iPSC,以检查各种患病表型和正常表型。

在一些实施方案中,所述方法、干细胞和多重高通量测定用于谱分析神经毒性。神经毒性和发育神经毒性是数百种环境污染物和职业化学品、天然毒素和药物的重要不利健康影响,例如导致儿童的神经和发育缺陷以及成人的神经系统变化(如成瘾)。

已经开发、实施和验证了神经毒性和发育神经毒性的体内测试指南。然而,此类体内测试是耗时的、昂贵的且需要使用大量的动物。衍生自干细胞或iPSC的神经细胞克服了这些缺点,并且提供了不仅评估分子对终末分化细胞的影响,而且通过不同的分化阶段研究各种分子的发展或影响的工具。这是特别重要的,因为对祖细胞和分化细胞的可靠测试对于谱分析发育神经毒性是必不可少的。此外,可以从人类受试者中产生iPSC,以检查各种患病表型和正常表型。

需要新的方法来大规模地可视化和定量活干细胞衍生神经细胞中细胞间和亚细胞相互作用的时空调节,以剖析中枢神经系统(CNS)疾病进展的机制,使能够发现用于这些障碍的疗法并查明化学实体的神经毒性易感性。

在一些实施方案中,将所述方法、细胞和多重高通量测定用于毒性谱分析。例如,将所述方法、具有条形码化谱系的干细胞和多重高通量测定用于药物发现,以评价心脏毒性。

在一些实施方案中,将所述方法、具有条形码化谱系的干细胞和多重高通量测定用于合并测定。将谱系特异性标记方法与多种(例如,2、3、4、5种等)针对每种细胞谱系不同排列的结构性荧光报告物相结合使得能够开发利用不同CM谱系的合并群体的测定,所述不同CM谱系可以通过其独特的荧光条形码来鉴定和监测。这使得能够开发利用混合细胞谱系的共培养的更多生理学相关测定,与基于单一细胞谱系的纯化群体的测定形成对比,已知所述单一细胞谱系在与其他谱系分离时表现出改变的表型。此外,通过我们的荧光条形编码方法实现的合并的心脏毒性测定使得能够并行评估三种或四种细胞谱系,与经纯化的细胞群体需要运行单独的测定形成对比。

在一些实施方案中,所述方法、具有条形码化谱系的干细胞和多重高通量测定用于在更先进的干细胞衍生细胞模型的情境下鉴定和监测细胞谱系。干细胞在开发先进模型(如3D培养物、微流控使能的“器官芯片”和3D生物打印模型)中的使用是一个迅速发展的领域,在药物发现、毒性测试和基础研究方面具有应用。有趣的是,尽管这些方法的生理相关性和复杂性增加,但可用于表征这些模型的工具多少受到限制,并且广义地包括用活细胞相容性染料对活培养物的染色以及固定样品的切片和免疫荧光染色。为了完全实现这些复杂的新模型的能力,需要将使得能够对功能性、结构性和机械性参数进行可靠、实时监测的新方法。

在一些实施方案中,所述方法、具有条形码化谱系的干细胞和多重高通量测定用于将结构性和功能性读出与若干参数读出集成。经集成的测定测量涵盖结构性和功能性读出的组合的若干参数。

在一些实施方案中,所述方法、具有条形码化谱系的干细胞和多重高通量测定用于通过实施评估早期发育阶段期间特定神经谱系中化合物的毒性的高内涵筛选测定来检查发育神经毒性,发育神经毒性已经被公认为是发育障碍(如自闭症、注意缺陷障碍、智力迟钝或脑性瘫痪)的原因。

在一些实施方案中,将所述方法、具有条形码化谱系的干细胞和多重高通量测定用于药物发现。例如,将所述方法、细胞和多重高通量测定用于治疗神经退行性变的药物发现。在一些实施方案中,本发明提供了干细胞衍生细胞在用于治疗神经退行性疾病的药物开发中的用途。

在一些实施方案中,将所述方法、具有条形码化谱系的干细胞和多重高通量测定用于药物发现。例如,将所述方法、细胞和多重高通量测定用于治疗成瘾的药物发现。在一些实施方案中,本发明提供了干细胞衍生细胞在用于治疗成瘾的药物开发中的用途。

定义

如本文所用,“载体”是指包含有待在体外或在体内递送至宿主细胞中的核酸的重组质粒或病毒。

如本文所用的术语“多核苷酸”或“核酸”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸)聚合形式。因此,此术语包括但不限于单链、双链或多链DNA或RNA;基因组DNA;cDNA;DNA-RNA杂合体;或者包含嘌呤和嘧啶碱基或其他天然的核苷酸碱基、经化学修饰的或经生化修饰的核苷酸碱基、非天然的核苷酸碱基或衍生的核苷酸碱基的聚合物。核酸的骨架可以包含糖和磷酸基团(如通常可以在RNA或DNA中发现的)或者经修饰的或经取代的糖或磷酸基团。可替代地,核酸的骨架可以包含合成亚基(如氨基磷酸酯)的聚合物,并且因此可以是寡脱氧核苷氨基磷酸酯(P-NH

术语“多肽”和“蛋白质”可互换使用以指代氨基酸残基的聚合物,并且不限于最小长度。氨基酸残基的此类聚合物可以含有天然或非天然氨基酸残基,并且包括但不限于氨基酸残基的肽、寡肽、二聚体、三聚体和多聚体。所述定义涵盖了全长蛋白质及其片段两者。所述术语还包括多肽的翻译后修饰,例如糖基化、唾液酸化、乙酰化、磷酸化等。此外,出于本发明的目的,“多肽”是指包括对天然序列的修饰如缺失、添加和取代(通常是保守性的)的蛋白质,只要所述蛋白质维持所需活性即可。这些修饰可能是故意的(如通过定点诱变),或者可能是偶然的(如通过产生蛋白质的宿主的突变或由于PCR扩增引起的错误)。

如本文所用,“生物传感器”是指附着于另外的蛋白质序列使其对小生物分子或其他生理细胞内过程敏感的报告化合物。在非限制性例子中,生物传感器是包括遗传编码的荧光多肽的荧光生物传感器。将生物传感器引入细胞、组织或生物中,以允许作为FRET效率差异、荧光蛋白的转位或单一报告蛋白的报告物特性的调节进行检测(例如,通过荧光显微术)。许多生物传感器允许长期成像,并且可以被设计为特异性靶向细胞区室或细胞器。生物传感器的另一个优点是,它们允许对信号传导途径进行研究或对生物分子进行测量,同时在很大程度上保留空间和时间细胞过程。

“受体细胞”是已经被工程化为在其基因组中具有受体构建体的细胞。

“受体构建体”是如下核苷酸序列,其包含可以具有报告核酸的核酸序列。

术语“转基因”是指引入细胞中并且能够被转录成RNA并且任选地在适当条件下翻译和/或表达的核酸。

除非进一步定义,否则如本文所用,“干细胞”是指任何非体细胞。不是终末分化或终末定型的细胞的任何细胞都可以称为干细胞。这包括胚胎干细胞、诱导多能干细胞、造血干细胞、祖细胞和部分分化的祖细胞。干细胞可以是全能干细胞、多能干细胞或多潜能干细胞。出于本申请的目的,具有分化为两种不同类型的细胞的潜力的任何细胞均被视为干细胞。

如本文所用的“iPS”细胞是指通过对非多能细胞进行重编程而获得的任何多能细胞。经重编程的细胞可能已经通过对任何胚胎或胚胎外组织谱系的祖细胞、部分分化细胞或完全分化细胞进行重编程而产生。

如本文所用的“重编程”是指使至少部分分化为多能状态的细胞去分化的过程。

如本文所用,“免疫赦免细胞”是指当引入外源宿主生物中时引起免疫应答减弱的细胞。

如本文所用,“顺反子”是指等同于基因并且编码单一功能单元(例如,单一多肽或包含转基因产物和报告结构域的融合多肽)的核酸区段。如本文所用,多顺反子载体是包含两个或更多个顺反子的核酸。在一些实施方案中,多顺反子载体在单一开放阅读框中包含两个或更多个顺反子。在一些实施方案中,单一开放阅读框在翻译时产生两种或更多种彼此分离的多肽。

如本文所用,关于两种或更多种报告多肽的表达的术语“基本上1:1化学计量表达”是指两种或更多种报告多肽的表达,其中两种或更多种报告多肽的表达水平大致相同。在一些实施方案中,两种或更多种报告多肽的表达相等或变化不超过彼此的约5%、10%、15%、20%或25%中的任一个。

如本文所用,“位点特异性重组酶序列”是指位点特异性重组系统的靶序列。位点特异性重组系统包括但不限于Tyr重组酶、Ser整合酶、具有loxP靶序列的Cre重组酶、具有FRT靶序列的FLP重组酶。Tyr重组酶和Ser整合酶(例如,PhiC31)整合酶的位点特异性重组核酸序列包括但不限于attB和attP。CRE重组酶的位点特异性重组核酸序列包括但不限于loxP。FLP重组酶的位点特异性重组核酸序列包括但不限于FRT。

如本文所用,“谱系特异性启动子”是指以条件方式,即仅在特定细胞谱系中启动特定基因转录的DNA区域。谱系特异性启动子用于将报告基因和转基因的表达限制于所述启动子在其中具有活性的谱系中。一些谱系特异性启动子也是亚谱系特异性启动子。

如本文所用,“亚谱系特异性启动子”是指以条件方式,即在特定细胞亚谱系中启动特定基因转录的DNA区域。亚谱系特异性启动子用于将报告基因和转基因的表达限制于所述启动子在其中具有活性的亚谱系中。

如本文所用,“谱系条形码”是指在谱系或亚谱系特异性启动子的控制下、各自与细胞标记可操作地连接的一种或多种荧光蛋白。在一些实施方案中,细胞标记是细胞器标记。谱系条形码允许基于不同的荧光标志来鉴定所述谱系或亚谱系特异性启动子在其中具有活性的细胞。谱系条形码可以用于在谱系特异性或亚谱系特异性启动子控制下将与细胞标记可操作连接的不同荧光蛋白插入细胞基因组中的方法中。在一些方面,谱系条形码的目的是根据预先存在的分类来鉴定未知谱系。混合群体中的每种细胞谱系都将可基于不同的荧光标志来鉴定。

本文对“约”某一值或参数的提及包括(并描述)针对该值或参数本身的实施方案。例如,提及“约X”的描述包括“X”的描述。

除非另外指示,否则如本文所用,冠词的单数形式“一个/一种(a)”、“一种/一种(an)”和“所述(the)”包括复数指示物。

应理解,本文所述的本发明的方面和实施方案包括“包含多个方面和实施方案”、“由多个方面和实施方案组成”和/或“基本上由多个方面和实施方案组成”。

受体细胞

本公开文本提供了多报告细胞和用于产生多报告细胞的方法,所述多报告细胞和方法可以用于谱分析活干细胞中的两种或更多种多肽,并且经由谱系特异性启动子提供关于所述细胞身份的信息。通过将多顺反子报告载体克隆到受体细胞的插入位点中来开发多报告细胞。通过将编码受体序列的重组核酸掺入到细胞基因组中来开发受体细胞。所述受体序列包含允许将所述多顺反子报告载体位点特异性整合到所述受体细胞基因组中的插入位点。如本文所述,所述多顺反子报告载体包含编码两种或更多种多肽的核酸,其中所述多肽与报告结构域融合。编码目的多肽的两个或更多个核酸序列位于同一开放阅读框内,从而允许重组肽的基本上1:1化学计量表达。

在一些方面,本发明提供了用于接受多顺反子报告载体的受体细胞,其中所述受体细胞包含整合到宿主细胞基因组中的特定位点的重组核酸,其中所述重组核酸包含与编码融合多肽的核酸可操作地连接的第一启动子,其中所述融合多肽包含报告结构域和选择性标记结构域,并且其中所述核酸包含位于编码所述融合多肽的核酸的5'端处的位点特异性重组酶核酸序列。

在一些实施方案中,所述启动子(例如,所述第一启动子)是组成型启动子。组成型启动子的例子包括但不限于巨细胞病毒即刻早期(CMV)启动子、胸苷激酶(TK)启动子、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述启动子是诱导型启动子。诱导型启动子的例子包括但不限于四环素响应型启动子、雷帕霉素调控型启动子和固醇诱导型启动子。在一些实施方案中,所述诱导型启动子是四环素响应型启动子。

在本发明的一些实施方案中,所述受体位点包含位点特异性重组酶序列。位点特异性重组酶序列的例子包括但不限于FRT核酸序列、attP核酸序列和loxP核酸序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸。在一些实施方案中,所述位点特异性重组酶序列是attP核酸。在一些实施方案中,所述位点特异性重组酶序列是attB核酸。在一些实施方案中,所述位点特异性重组酶序列是loxP核酸。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attP序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attB序列。

在一些实施方案中,所述受体位点包含编码报告多肽的核酸。在一些实施方案中,所述受体位点包含编码选择多肽的核酸。在一些实施方案中,所述受体位点包含编码与选择多肽(例如,选择结构域)融合的报告多肽(例如,报告结构域)的核酸。在一些实施方案中,所述报告多肽在所述融合多肽的N末端,并且所述选择多肽在所述融合多肽的C末端。在其他实施方案中,所述选择多肽在所述融合多肽的N末端,并且所述报告多肽在所述融合多肽的C末端。

报告肽是可以例如经由显微术、读板仪、FACS、化学方式、质谱或深度测序容易地鉴定的肽。例如,所述报告结构域可以是荧光或发光多肽。在一些实施方案中,所述报告结构域可以是绿色荧光蛋白(GFP)或其任何衍生物。在一些实施方案中,所述报告结构域是非GFP衍生荧光肽。在一些实施方案中,所述报告结构域编码GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP或smURFP。所述报告结构域可以是萤光素酶。所述报告结构域可以是酶,其在表达时允许通过化学反应的产物可视化表达。在一些实施方案中,所述报告物是萤火虫萤光素酶或海肾萤光素酶。在一些实施方案中,所述报告结构域是β-葡糖醛酸糖苷酶或β-半乳糖苷酶。

选择性标记结构域可以是赋予对细胞通常不具抗性的分子的抗性或以细胞通常不具抗性的剂量赋予抗性的多肽。例如,所述选择性标记结构域可以是赋予对抗生素的抗性的多肽。在一些实施方案中,所述选择性标记是赋予对杀稻瘟菌素、遗传霉素、潮霉素、嘌呤霉素、新霉素、Zeocin

在一些实施方案中,所述受体细胞包含受体位点,所述受体位点包含编码融合多肽的核酸,所述融合多肽包含报告结构域和选择结构域。在一些实施方案中,所述融合多肽的报告结构域是mCherry报告结构域。在一些实施方案中,所述融合多肽的选择性标记结构域赋予对潮霉素、Zeocin

在一些实施方案中,所述受体位点还包含编码基因表达阻遏多肽的核酸。在一些实施方案中,所述受体位点包含与启动子可操作地连接的编码四环素阻遏多肽的核酸。在一些实施方案中,所述组成型启动子是CMV启动子、TK启动子、eF1-α、UbC启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述启动子是人β-肌动蛋白启动子或CAG启动子。

将所述受体位点整合在所述受体细胞基因组中的特定位点处。在一些实施方案中,所述特定位点是所述受体细胞基因组中的无害位点。例如,将核酸插入所述特定位点中对所述受体细胞的功能影响很小。在一些实施方案中,将所述重组核酸整合在腺相关病毒S1(AAVS1)基因座、趋化因子(CC基序)受体5(CCR5)基因座、小鼠ROSA26基因座的人直向同源物、Hipp 11(H11)基因座或柠檬酸裂解酶β样基因座(CLYBL)中。在一些实施方案中,所述受体位点包含异源核酸序列,所述异源核酸序列用于将编码所述位点特异性重组酶核酸序列的重组核酸靶向至所述受体细胞基因组中的特定靶基因座。在一些实施方案中,所述受体细胞包含用于靶向至AAVS1基因座、CCR5基因座、小鼠ROSA26基因座或小鼠ROSA26基因座的人直向同源物、H11基因座或CLYBL基因座的核酸。

本公开文本提供了用于从干细胞中产生受体细胞系的方法。所述方法包括工程化干细胞,使得所述细胞可以具有报告核酸。任何干细胞均可以是受体细胞。在一些实施方案中,所使用的细胞是哺乳动物干细胞。在一些实施方案中,所使用的细胞是人干细胞。在一些实施方案中,通过工程化原代干细胞产生所述受体细胞系。所述原代细胞可以从植物或动物中收获。在一些实施方案中,所述原代干细胞是从哺乳动物中收获的。在一些实施方案中,所述原代干细胞是从人中收获的。在一些实施方案中,所述原代干细胞是从啮齿类动物中收获的。在一些实施方案中,所使用的干细胞是患者特异性细胞。

在一些实施方案中,所述受体细胞是干细胞。所述干细胞可以是全能干细胞、多能干细胞或多潜能干细胞。任何全能干细胞、多能干细胞、多潜能干细胞或祖干细胞都可以用于产生受体细胞系。所述干细胞可以是动物细胞。在一些实施方案中,所述干细胞来自哺乳动物。在一些实施方案中,所述干细胞来自人。在一些实施方案中,所述干细胞是患者特异性干细胞。在一些实施方案中,所述干细胞是自体干细胞。在一些实施方案中,所述干细胞是同种异体干细胞。在一些情况下,所述干细胞来自非人类灵长类动物、狗或啮齿类动物。所述干细胞可以衍生自滋养外胚层、囊胚的内细胞团或特定组织。所述干细胞可以是胚胎干细胞、诱导多能干细胞或祖干细胞。任何祖细胞都可以用于产生受体细胞系。例如,所使用的祖细胞可以是造血细胞、内皮祖细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞、肝祖细胞或胰腺祖细胞。

在一些实施方案中,所述受体细胞是植物细胞或动物细胞。在一些实施方案中,所述动物是无脊椎动物。在一些实施方案中,所述受体细胞是来自拟南芥属(Arabidopsis)的成员的细胞。在一些实施方案中,所述受体细胞是来自黑腹果蝇(Drosophilamelanogaster)物种的成员的细胞。在一些实施方案中,所述受体细胞是来自秀丽隐杆线虫(Caenorhabditis elegans)物种的成员的细胞。在一些实施方案中,所述受体细胞是脊椎动物细胞。在一些实施方案中,所述受体细胞是哺乳动物细胞。在一些实施方案中,所述受体细胞是人细胞、灵长类动物细胞、啮齿类动物细胞、猫细胞、犬细胞、牛细胞、猪细胞或羊细胞。

在一些实施方案中,本发明提供了用于产生用以接受多顺反子报告载体的受体细胞的方法,所述方法包括将重组核酸引入细胞,其中所述重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第一核酸、第一启动子、位点特异性重组酶核酸、编码第一报告多肽和选择性标记的核酸以及用于将同源重组靶向至所述细胞中的特定位点的第二核酸。在一些实施方案中,所述重组核酸包含上文所述的任何受体位点以产生上文所述的任何受体细胞。

在一些实施方案中,本发明提供了用于产生用以接受多顺反子报告载体的受体细胞的方法,所述方法包括将重组核酸引入细胞,其中所述重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第一核酸、第一启动子、一种或两种位点特异性重组核酸、编码第一报告多肽和选择性标记的核酸、用于将同源重组靶向至所述细胞中的特定位点的第二核酸、第二启动子和编码第二报告多肽或细胞毒性多肽的核酸,其中表达所述第一报告多肽而不表达所述第二报告多肽或细胞毒性多肽指示将所述重组核酸靶向整合至细胞基因组中的所述特定位点,并且表达所述第一报告多肽和所述第二报告多肽或表达所述第一报告多肽和所述细胞毒性多肽指示随机整合在细胞基因组中。在一些实施方案中,所述重组核酸包含上文所述的任何受体位点以产生上文所述的任何受体细胞。

在一些实施方案中,所述受体位点还包含编码基因表达阻遏多肽的核酸。在一些实施方案中,所述受体位点包含与启动子可操作地连接的编码四环素阻遏多肽的核酸。在一些实施方案中,所述组成型启动子是CMV启动子、TK启动子、eF1-α、UbC启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子。在一些实施方案中,所述启动子是人β-肌动蛋白启动子或CAG启动子。

通过工程化细胞的基因组以包括受体构建体来产生所述受体细胞。有几种本领域已知的技术,其可以用于将细胞工程化为具有外源核酸序列。例如,可以通过经由病毒转染系统将所述受体构建体插入细胞中来产生所述受体细胞。在一些实施方案中,所使用的逆转录病毒是慢病毒或腺病毒。在一些实施方案中,所述受体构建体可以是载体。所述载体可以是病毒载体。在一些实施方案中,所述载体是病毒载体,如慢病毒载体、杆状病毒载体、腺病毒载体或腺相关病毒(AAV)载体。在一些实施方案中,使用AAV转染系统将所述受体构建体递送至所述受体细胞中。可以根据所使用的细胞类型或基因座来修饰和优化所使用的AAV。例如,可以使用AAV1、AAV2、AAV5或其任何组合。

所述受体构建体可以通过本领域已知的其他方法来递送。已知许多递送手段(如酵母系统、微泡、基因枪/将载体附着于金纳米颗粒的手段)。在一些实施方案中,所述受体构建体可以经由脂质体、纳米颗粒、外泌体、微泡或基因枪来递送。

在一些实施方案中,通过使用RNA指导的核酸内切酶系统将所述受体构建体插入细胞的基因组中。在一些实施方案中,使用CRISPR系统。在一些实施方案中,使用经由Cas9的RNA指导的基因组工程化将所述受体构建体插入所述细胞的基因组中。然而,任何在RNA指导的基因组工程化系统中起作用的核酸酶都起作用。可使用的核酸酶包括Cas3、Cas8a、Cas5、Cas8b、Cas8C、Cas10d、Cse、Cse2、Csy1、Csy2、Csy3、GSU0054、Cas10、Csm2、Cmr5、Cas10、Csx11、Csx10、Csf1、Cas9、Cas4、Csn2、Cpf1、C2c1、C2c3和C2c2。所使用的核酸内切酶的类型可能取决于待工程化的细胞和供插入的靶基因座。

在一些实施方案中,通过使用TALEN或锌指核酸内切酶(ZFN)将所述受体构建体插入细胞的基因组中。

经由Cas9的RNA指导的基因组工程化为细胞系工程化提供了相对于TALEN和ZFN方法的改善。使用ZFN例如有一些限制。首先,ZFN技术需要针对每个待修饰的新的基因组整合基因座中的特定DNA结合位点合成新的载体和RNA。这些通常需要昂贵的优化,因此成本和复杂性限制了将这些技术应用于多于一个或两个基因座的灵活性。相比之下,RNA指导的系统使用单一蛋白质(Cas9),其仅需要短的RNA分子对它进行编程,以用于位点特异性DNA识别。因此Cas9-RNA复合物比类似的ZFN靶向蛋白更容易制备,并且所述系统因此更灵活。Cas9-RNA复合物在哺乳动物细胞中与TALEN和ZFN相比也具有较低的毒性。除了Cas9,可以使用与RNA指导的基因组编辑相关的其他核酸酶。RNA指导的基因组工程化是本领域已知的。

可以将编码所述受体位点的核酸插入细胞基因组的任何部分中,在所述部分中可以插入外源DNA序列而不破坏内源基因的转录。在一些实施方案中,所述受体位点靶向至AAVS1基因座、H11基因座、CCR5基因座、小鼠ROSA26基因座或小鼠ROSA26基因座的人直向同源物或CLYBL基因座。在一些实施方案中,将所述构建体插入基因组内未被表观遗传沉默的位置中。在一些实施方案中,将所述受体构建体插入所述宿主细胞的AAVS1基因组基因座中。AAVS1基因组基因座位于人19号染色体上蛋白磷酸酶1调控亚基12C(PPP1R12C)基因的第1个内含子中。此基因座允许在包括胚胎干细胞在内的许多细胞类型中稳定长期的转基因表达(Smith,JR等人,Stem Cells,26(2)(2008))。在一些实施方案中,将所述受体构建体插入所述宿主细胞的H11基因组基因座中。Hipp11(H11)基因座首先由Hippenmeyer等人(Neuron,68(4):695-709(2010))描述,并且在人类中位于22q12.2染色体上,在DRG1与EIF4ENIF1基因之间,为在人EIF4ENIF1的3'UTR的3'的大约700 bp。在一些实施方案中,将所述受体构建体插入所述宿主细胞的CCR5基因组基因座中。趋化因子(C-C基序)受体5(CCR5)基因位于3号染色体(位置3p21.31)上,并且编码HIV-1的主要共受体。在一些实施方案中,将所述受体构建体插入所述宿主细胞的Rosa26基因组基因座中。人Rosa26位于3号染色体(位置3p25.3)中。在一些实施方案中,将所述受体构建体插入所述宿主细胞的CLYBL基因组基因座中。CLBYL基因组基因座位于柠檬酸裂解酶β样(CLYBL)基因的内含子2中,在13号染色体的长臂上。在一些实施方案中,将编码所述受体位点的核酸的单拷贝掺入所述受体细胞基因组中(例如,在所述受体细胞基因组的单一等位基因上)。

编码所述受体位点的核酸可以包含允许同源重组到细胞基因组中的两个核酸序列。在一些实施方案中,在将所述受体构建体整合到细胞的AAVS1基因组基因座中的情况下,所述受体构建体包含允许将所述受体构建体直接整合到所述细胞中的两个AAVS1序列。所述报告构建体可以包含允许将所述构建体整合在细胞的不同基因组基因座中的一个或多个序列。可以经由同源重组或本领域已知的基因组工程化的任何其他方式将所述受体构建体插入细胞基因组内的基因座中。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到细胞的AAVS1基因座中的两个AAVS1序列。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到细胞的CCR5基因座中的两个CCR5序列。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到小鼠细胞的ROSA26基因座中的两个ROSA26序列。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到人细胞的小鼠ROSA26基因座的人直向同源物中的小鼠ROSA26序列的两个人直向同源物。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到细胞的H11基因座中的两个H11序列。在一些实施方案中,所述受体构建体包含允许将所述受体构建体直接整合到细胞的CLYBL基因座中的两个CLYBL序列。

在本发明的一些实施方案中,所述受体细胞包含用于接受第一多顺反子报告载体的第一重组核酸和用于接受第二表达构建体的第二重组核酸,其中将所述第一重组核酸整合到宿主细胞基因组中的第一特定位点中,并且将所述第二重组核酸整合到宿主细胞基因组中的第二特定位点中。在一些实施方案中,所述第二重组核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas表达载体、诱导型Cas表达载体、组成型Cas9表达载体或诱导型Cas9表达载体。在一些实施方案中,由所述受体细胞制备报告细胞,其中将多顺反子报告载体整合到所述第一特定位点中,并且将组成型或诱导型Cas表达载体(例如,Cas9表达载体)整合到第二特定位点中。在一些实施方案中,本发明提供了方法,其中将如本文所述的报告细胞排列在多孔板中,并且用作使用单一或寡核苷酸合并sgRNA的筛选的基础。

多顺反子报告载体

在一些方面,本发明提供了多顺反子报告载体,其包含:与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为1:1化学计量,并且其中所述载体包括至少一种报告多肽,所述至少一种报告多肽与谱系特异性启动子可操作地连接以充当条形码用于鉴定在其中引入所述多顺反子报告载体的细胞的谱系。所述载体被设计用于“即插即用”模式,其中根据所述多顺反子报告载体的特定用途,可以换入不同的谱系特异性启动子以驱动所述开放阅读框的表达,可以换入不同的目的多肽,可以换入不同的报告多肽,并且可以换入进不同的选择多肽。同样,通过以下方式来设计所述多顺反子报告载体:使用各种MCS序列插入编码任何目的多肽的核酸,使得标记到报告多肽的转基因产物由所述多顺反子报告载体表达。在一些实施方案中,所述多顺反子载体包含这样的“骨架”载体,其中目的转基因尚未插入MCS序列中。在其他实施方案中,所述多顺反子载体包括这样的载体,其中目的转基因已经插入MCS序列中,使得所述开放阅读的表达产生不同的报告物标记的多肽。多顺反子报告载体的非限制性例子提供于图2B中。

在一些方面,本发明提供了多顺反子报告载体,其包含:与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

在一些方面,本发明提供了多顺反子报告载体,其包含:与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

在一些方面,本发明提供了多顺反子报告载体,其包含:与编码核多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述管家多肽是H2B。

在一些实施方案中,所述多顺反子报告载体的顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。在一些实施方案中,所述一种或多种自切割肽是病毒自切割肽。在一些实施方案中,所述一种或多种病毒自切割肽是一种或多种2A肽。在一些实施方案中,所述一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。在一些实施方案中,所述开放阅读框的所述顺反子中的一个或多个通过IRES序列与所述开放阅读框中的其他顺反子分开。在一些实施方案中,所述IRES是脑心肌炎病毒(EMCV)IRES、丙型肝炎病毒(HCV)IRES或肠道病毒71(EV71)IRES。

在一些实施方案中,所述多顺反子报告载体包含两个顺反子,其中这两个顺反子通过编码病毒自切割肽或IRES的核酸分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中这三个顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中这三个顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,并且第二顺反子和第三顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包括三个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,并且第二顺反子和第三顺反子通过编码自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中所述顺反子通过编码病毒自切割肽的核酸彼此分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中所述顺反子通过IRES序列彼此分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含五个或更多个顺反子,其中所述顺反子通过编码病毒自切割肽的核酸和IRES序列的任何组合彼此分开。

在一些实施方案中,本发明的多顺反子报告载体包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。在一些实施方案中,所述肽接头包含序列Gly-Ser-Gly。

在一些实施方案中,本发明提供了多顺反子报告载体,其包含与启动子可操作地连接的开放阅读框,并且其中所述开放阅读框包括与编码报告多肽的核酸连接的两个或更多个MCS序列,使得当将编码目的转基因的核酸插入MCS中时,由所述多顺反子报告载体编码的所得多肽包括用所述报告多肽标记的目的转基因的产物。所述开放阅读框的每个顺反子编码不同报吿多肽,使得可以在活细胞中谱分析每种标记的转基因产物。在一些实施方案中,所述报告多肽是荧光报告多肽。在一些实施方案中,所述报告多肽可以是绿色荧光蛋白(GFP)或其任何衍生物。在一些实施方案中,所述报告多肽是非GFP衍生荧光肽。在一些实施方案中,所述报告多肽是GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP或smURFP。在一些实施方案中,所述报告多肽是萤光素酶。在一些实施方案中,所述报告多肽是酶,其在表达时允许通过化学反应的产物可视化表达。在一些实施方案中,所述报告结构域是萤火虫萤光素酶或海肾萤光素酶。在一些实施方案中,所述报告结构域是β-葡糖醛酸糖苷酶或β-半乳糖苷酶。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

在一些实施方案中,所述多顺反子报告载体还包含位于所述启动子与所述开放阅读框之间的一个或多个诱导型元件。在一些实施方案中,所述多顺反子报告载体包含两个诱导型元件。在一些实施方案中,所述诱导型元件是Tet操纵子2(TetO2)诱导型元件。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与诱导型启动子可操作地连接。在一些实施方案中,所述诱导型启动子是四环素响应型启动子。在一些实施方案中,所述诱导型启动子是雷帕霉素调控型启动子或固醇诱导型启动子。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与谱系特异性启动子或亚谱系特异性启动子可操作地连接。在一些实施方案中,所述谱系特异性启动子是内胚层特异性启动子、中胚层特异性启动子或外胚层特异性启动子。心肌细胞特异性启动子的例子是:肌球蛋白轻链2v(MLC2v)启动子、肌脂蛋白(SLN)启动子、矮小同源盒2(SHOX2)启动子;神经特异性启动子的例子是囊泡GABA转运体(vGAT)启动子、酪氨酸羟化酶(TH)启动子、胶质纤维酸性蛋白(GFAP)启动子、囊泡谷氨酸转运体1(vGLUT)启动子。

在一些实施方案中,所述多顺反子报告物由仅在多能细胞中具有活性的启动子驱动。例如,与包含两个或更多个顺反子的开放阅读框可操作地连接的启动子可以是Oct-4、Sox2、Nanog、KLF4、TRA-1-60、TRA-2-54、TRA-1-81、SSEA1、SSEA4或任何多能性相关基因的启动子。

在一些实施方案中,所述多顺反子报告物由对分化阶段具有特异性的启动子驱动。例如,使用OCT-4启动子将允许由所述多顺反子构建体编码的融合蛋白仅在多能细胞中表达。使用MSP1+启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心脏祖细胞前体中表达。使用α-MHC启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心肌细胞中表达。

在一些实施方案中,所述多顺反子报告载体包含编码与报告多肽融合的多肽(例如,“管家”多肽)并与组织特异性、谱系特异性或亚谱系特异性启动子可操作地连接的核酸。在一些实施方案中,编码所述多肽的核酸被编码为所述载体的多顺反子开放阅读框的一部分。在此,所述组织特异性、谱系特异性或亚谱系特异性启动子驱动所述多顺反子开放阅读框的表达。在其他实施方案中,所述组织特异性、谱系特异性或亚谱系特异性启动子和所述报告多肽作为与所述多顺反子开放阅读框分开的转录单元存在于所述多顺反子载体上。在一些实施方案中,隔离子区域存在于所述分开的转录单元与所述多顺反子开放阅读框之间。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的5'。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的3'。

在一些实施方案中,所述载体包含编码与报告多肽融合的H2B并与MLC2v启动子、SLN启动子或SHOX2启动子可操作地连接的核酸,从而使得报告物能够在心脏亚型细胞中表达。在一些实施方案中,本发明提供了包含如上所述的多顺反子报告载体的多报告细胞,其中所述载体包含编码与报告多肽融合的H2B并与vGAT启动子、TH启动子、GFAP启动子或vGLUT启动子可操作地连接的核酸,从而使得报告物能够在神经亚型细胞中表达。

在一些实施方案中,所述多顺反子报告物由谱系特异性启动子驱动。在一些实施方案中,所述谱系特异性启动子是在早期内胚层、早期中胚层、早期外胚层、绒毛膜或滋养外胚层谱系中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在祖细胞中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在造血细胞、内皮祖细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中具有活性的启动子。在一些实施方案中,所述多报告细胞是脐带内皮细胞、脐带血干细胞、脂肪衍生干细胞、肝细胞、角质形成细胞、神经干细胞、胰腺β细胞、淋巴细胞祖细胞或羊膜细胞。

在一些实施方案中,所述谱系特异性启动子是衍生自胚胎外组织、外胚层、内胚层或中胚层的细胞的启动子。在一些实施方案中,所述谱系特异性启动子是在心肌细胞、内皮细胞、神经元细胞、GABA能神经元、星形胶质细胞、多巴胺能神经元、谷氨酸能神经元、肝细胞、肝母细胞、骨骼成肌细胞、巨噬细胞、皮质神经元、心房心肌细胞、心室心肌细胞、结心肌细胞、浦肯野纤维、基底细胞、鳞状细胞、肾细胞、胰腺β细胞、上皮细胞、间充质细胞、肾上腺皮质细胞、成骨细胞、骨细胞、成软骨细胞、软骨细胞、胃肠细胞、结直肠细胞、导管细胞、小叶细胞、淋巴细胞、视网膜细胞、感光细胞或耳蜗细胞中表达的启动子。

在一些实施方案中,所述多顺反子报告物由仅在多能细胞中具有活性的启动子驱动。例如,与包含两个或更多个顺反子的开放阅读框可操作地连接的启动子可以是Oct-4、Sox2、Nanog、KLF4、TRA-1-60、TRA-2-54、TRA-1-81、SSEA1、SSEA4或任何多能性相关基因的启动子。

在一些实施方案中,所述多顺反子报告物由对分化阶段具有特异性的启动子驱动。例如,使用OCT-4启动子将允许由所述多顺反子构建体编码的融合蛋白仅在多能细胞中表达。使用MSP1+启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心脏祖细胞前体中表达。使用α-MHC启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心肌细胞中表达。

在一些实施方案中,所述多顺反子报告载体包含编码与报告多肽融合的多肽(例如,“管家”多肽)并与组织特异性、谱系特异性或亚谱系特异性启动子可操作地连接的核酸。在一些实施方案中,编码所述多肽的核酸被编码为所述载体的多顺反子开放阅读框的一部分。在此,所述组织特异性、谱系特异性或亚谱系特异性启动子驱动所述多顺反子开放阅读框的表达。在其他实施方案中,所述组织特异性、谱系特异性或亚谱系特异性启动子和所述报告多肽作为与所述多顺反子开放阅读框分开的转录单元存在于所述多顺反子载体上。在一些实施方案中,隔离子区域存在于所述分开的转录单元与所述多顺反子开放阅读框之间。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的5'。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的3'。

在一些实施方案中,所述载体包含编码与报告多肽融合的H2B并与MLC2v启动子、SLN启动子或SHOX2启动子可操作地连接的核酸,从而使得报告物能够在心脏亚型细胞中表达。在一些实施方案中,本发明提供了包含如上所述的多顺反子报告载体的多报告细胞,其中所述载体包含编码与报告多肽融合的H2B并与vGAT启动子、TH启动子、GFAP启动子或vGLUT启动子可操作地连接的核酸,从而使得报告物能够在神经亚型细胞中表达。

在一些实施方案中,所述多顺反子报告物由谱系特异性启动子驱动。在一些实施方案中,所述谱系特异性启动子是在早期内胚层、早期中胚层、早期外胚层、绒毛膜或滋养外胚层谱系中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在祖细胞中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在造血细胞、内皮祖细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中具有活性的启动子。在一些实施方案中,所述多报告细胞是脐带内皮细胞、脐带血干细胞、脂肪衍生干细胞、肝细胞、角质形成细胞、神经干细胞、胰腺β细胞、淋巴细胞祖细胞或羊膜细胞。

在一些实施方案中,所述谱系特异性启动子是衍生自胚胎外组织、外胚层、内胚层或中胚层的细胞的启动子。在一些实施方案中,所述谱系特异性启动子是在心肌细胞、内皮细胞、神经元细胞、GABA能神经元、星形胶质细胞、多巴胺能神经元、谷氨酸能神经元、肝细胞、肝母细胞、骨骼成肌细胞、巨噬细胞、皮质神经元、心房心肌细胞、心室心肌细胞、结心肌细胞、浦肯野纤维、基底细胞、鳞状细胞、肾细胞、胰腺β细胞、上皮细胞、间充质细胞、肾上腺皮质细胞、成骨细胞、骨细胞、成软骨细胞、软骨细胞、胃肠细胞、结直肠细胞、导管细胞、小叶细胞、淋巴细胞、视网膜细胞、感光细胞或耳蜗细胞中表达的启动子。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与组织特异性启动子可操作地连接。在一些实施方案中,所述组织特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑、皮肤或其他组织特异性谱系的细胞具有特异性。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述载体还包含位于所述开放阅读框的3'的位点特异性重组酶序列。位点特异性重组酶序列的例子包括但不限于FRT核酸序列、attP核酸序列和loxP核酸序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸。在一些实施方案中,所述位点特异性重组酶序列是attP核酸。在一些实施方案中,所述位点特异性重组酶序列是attB核酸。在一些实施方案中,所述位点特异性重组酶序列是loxP核酸。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attP序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attB序列。

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述载体还包含编码选择性标记的核酸,其中当所述位点特异性重组酶序列尚未重组时,编码所述选择性标记的核酸不与所述启动子可操作地连接,并且当所述位点特异性重组酶序列与其靶位点特异性重组酶序列重组时,编码所述选择性标记的核酸与所述启动子可操作地连接。在一些实施方案中,所述选择性标记赋予对潮霉素、Zeocin

在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中将编码一种或多种多肽的核酸框内插入一个或多个MCS中。在一些实施方案中,所述一种或多种多肽包含可用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型的多肽。在一些实施方案中,所述一种或多种多肽包含可用于谱分析细胞的表型特征的多肽。在一些实施方案中,所述一种或多种多肽包括ATF4、ATF6、XBP1ΔDBBD和H2B;α-微管蛋白、线粒体靶向序列(MTS)、LC3和H2B;或53BP1、Nrf2、p53RE和H2B;Mek、Erk、Raf和Ras;H2B、棕榈酰化信号和MTS;或H2B、MTS和α-辅肌动蛋白2。在一些实施方案中,本发明提供了多种多顺反子报告载体,其中所述多种多顺反子报告载体用于谱分析选自单一生物途径、两种或更多种生物途径之间的串扰、细胞稳态、细胞器稳态和毒性反应的特定靶标;其中每种载体编码至少一种共同多肽(例如,H2B),所述至少一种共同多肽可以用于鉴定接受了编码靶向至特定靶标的多肽的多顺反子载体中的一种或多种的细胞。在一些方面,所述共同多肽可以被视为所述特定靶标的条形码。

在一些实施方案中,本发明的多顺反子报告载体包括包含编码细胞器标记的核酸的至少一个顺反子。在一些实施方案中,所述细胞器标记包含与所述报告多肽融合的H2B、α-辅肌动蛋白2或线粒体靶向信号。

在一些实施方案中,本发明提供了如上所述的多顺反子报告载体,其中所述载体包含位于包含两个或更多个顺反子的开放阅读框的5'的一个、两个或三个转录单元,所述一个、两个或三个转录单元包含启动子和编码转基因的核酸,其中所述报告载体还包含位于所述转录单元的3'且位于包含两个或更多个顺反子的开放阅读框的5'的核心隔离子序列和polyA序列。在一些实施方案中,所述一个、两个或三个转录单元编码转录因子或可能有助于本文所述的测定的其他因子。

多报告细胞

在一些实施方案中,本发明提供了包含如上所述的任何受体细胞的多报告干细胞,其中已经将上文所述的多顺反子报告载体整合到所述受体细胞的基因组中,其中所述细胞包括至少一种报告多肽,所述至少一种报告多肽与谱系特异性启动子可操作地连接以充当条形码用于鉴定所述细胞的谱系。在一些实施方案中,已经将所述多顺反子报告载体整合到受体细胞基因组中的特定位点中。在一些实施方案中,所述受体细胞基因组中的特定位点是腺相关病毒S1(AAVS1)基因座、趋化因子(CC基序)受体5(CCR5)基因座、小鼠ROSA26基因座的人直向同源物或柠檬酸裂解酶β样基因座(CLYBL)。在一些实施方案中,将所述多顺反子报告载体的单拷贝整合到所述受体细胞基因组中。

在一些实施方案中,将如上所述的任何多顺反子报告载体插入受体细胞中以产生本发明的多报告细胞。

在一些方面,本发明提供了包含多顺反子报告载体的多报告干细胞,所述多顺反子报告载体包含:与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

在一些方面,本发明提供了包含多顺反子报告载体的多报告干细胞,所述多顺反子报告载体包含:与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)诱导型元件。在一些实施方案中,所述四环素响应型元件是Tet操纵子2(TetO2)阻遏元件。

在一些方面,本发明提供了包含多顺反子报告载体的多报告干细胞,所述多顺反子报告载体包含:与编码核多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。在一些实施方案中,所述管家多肽是H2B。

在一些实施方案中,本发明提供了多报告干细胞,其中所述报告细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含与开放阅读框可操作地连接的谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子;其中每个顺反子包含编码与不同报告多肽融合的不同转基因产物的核酸,其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;并且其中所述转基因产物的表达基本上为1:1化学计量。在一些实施方案中,所述顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。

在一些实施方案中,插入所述多报告干细胞中的多顺反子报告载体的顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。在一些实施方案中,所述一种或多种自切割肽是病毒自切割肽。在一些实施方案中,所述一种或多种病毒自切割肽是一种或多种2A肽。在一些实施方案中,所述一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。在一些实施方案中,所述开放阅读框的所述顺反子中的一个或多个通过IRES序列与所述开放阅读框中的其他顺反子分开。在一些实施方案中,所述IRES是脑心肌炎病毒(EMCV)IRES、丙型肝炎病毒(HCV)IRES或肠道病毒71(EV71)IRES。

在一些实施方案中,所述多报告干细胞包含多顺反子报告载体,其中所述多顺反子报告载体包含两个顺反子,其中这两个顺反子通过编码病毒自切割肽或IRES的核酸分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中这三个顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中这三个顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含三个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,并且第二顺反子和第三顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包括三个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,并且第二顺反子和第三顺反子通过编码自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中所述顺反子通过编码病毒自切割肽的核酸彼此分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中所述顺反子通过IRES序列彼此分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过编码病毒自切割肽的核酸分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过编码病毒自切割肽的核酸分开,第二顺反子和第三顺反子通过IRES序列分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含四个顺反子,其中第一顺反子和第二顺反子通过IRES序列分开,第二顺反子和第三顺反子通过编码病毒自切割肽的核酸分开,并且第三顺反子和第四顺反子通过IRES序列分开。在一些实施方案中,所述多顺反子报告载体包含五个或更多个顺反子,其中所述顺反子通过编码病毒自切割肽的核酸和IRES序列的任何组合彼此分开。

在一些实施方案中,所述多报告干细胞包含多顺反子报告载体,所述多顺反子报告载体包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。在一些实施方案中,所述肽接头包含序列Gly-Ser-Gly。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,所述多顺反子报告载体包含与启动子可操作地连接的开放阅读框,并且其中所述开放阅读框包括与编码报告多肽的核酸连接的两个或更多个MCS序列,使得当将编码目的转基因的核酸插入MCS中时,由所述多顺反子报告载体编码的所得多肽包括用所述报告多肽标记的目的转基因的产物。所述开放阅读框的每个顺反子编码不同报吿多肽,使得可以在活细胞中谱分析每种标记的转基因产物。在一些实施方案中,所述报告多肽是荧光报告多肽。在一些实施方案中,所述报告多肽可以是绿色荧光蛋白(GFP)或其任何衍生物。在一些实施方案中,所述报告多肽是非GFP衍生荧光肽。在一些实施方案中,所述报告多肽是GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP或smURFP。在一些实施方案中,所述报告多肽是萤光素酶。在一些实施方案中,所述报告多肽是酶,其在表达时允许通过化学反应的产物可视化表达。在一些实施方案中,所述报告结构域是萤火虫萤光素酶或海肾萤光素酶。在一些实施方案中,所述报告结构域是β-葡糖醛酸糖苷酶或β-半乳糖苷酶。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的谱系特异性启动子,其中所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。在一些实施方案中,本发明提供了多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

在一些实施方案中,所述多报告干细胞的多顺反子报告载体还包含位于所述启动子与所述开放阅读框之间的一个或多个诱导型元件。在一些实施方案中,所述多顺反子报告载体包含两个诱导型元件。在一些实施方案中,所述诱导型元件是Tet操纵子2(TetO2)诱导型元件。在一些实施方案中,所述响应型元件是Tet操纵子2(TetO2)阻遏元件。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与启动子可操作地连接。在一些实施方案中,所述启动子是组成型启动子。在一些实施方案中,所述组成型启动子是巨细胞病毒a(CMV)、胸苷激酶(TK)、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与诱导型启动子可操作地连接。在一些实施方案中,所述诱导型启动子是四环素响应型启动子。在一些实施方案中,所述诱导型启动子是雷帕霉素调控型启动子或固醇诱导型启动子。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与谱系特异性启动子或亚谱系特异性启动子可操作地连接。在一些实施方案中,所述谱系特异性启动子是内胚层特异性启动子、中胚层特异性启动子或外胚层特异性启动子。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告干细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述开放阅读框与组织特异性启动子可操作地连接。在一些实施方案中,所述组织特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑、皮肤或其他组织特异性谱系的细胞具有特异性。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述载体还包含位于所述开放阅读框的3'的位点特异性重组酶序列,所述位点特异性重组酶序列用于将所述多顺反子报告载体靶向至所述细胞中的特定位点。位点特异性重组酶序列的例子包括但不限于FRT核酸序列、attP核酸序列和loxP核酸序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸。在一些实施方案中,所述位点特异性重组酶序列是attP核酸。在一些实施方案中,所述位点特异性重组酶序列是attB核酸。在一些实施方案中,所述位点特异性重组酶序列是loxP核酸。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attP序列。在一些实施方案中,所述位点特异性重组酶序列是FRT核酸和attB序列。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中所述载体还包含编码选择性标记的核酸,其中当所述位点特异性重组酶序列尚未重组时,编码所述选择性标记的核酸不与所述启动子可操作地连接,并且当所述位点特异性重组酶序列与其靶位点特异性重组酶序列重组时,编码所述选择性标记的核酸与所述启动子可操作地连接。在一些实施方案中,所述选择性标记赋予对潮霉素、Zeocin

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告细胞,其中所述载体包含含有两个或更多个顺反子的开放阅读框,其中每个顺反子编码与报告多肽融合的转基因。在一些实施方案中,所述转基因编码可用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型的多肽。在一些实施方案中,所述转基因编码可用于谱分析细胞的表型特征的多肽。在一些实施方案中,所述多肽包括ATF4、ATF6、XBP1ΔDBBD和H2B;α-微管蛋白、线粒体靶向序列(MTS)、LC3和H2B;或53BP1、Nrf2、p53RE和H2B;Mek、Erk、Raf和Ras;H2B、棕榈酰化信号和MTS;或H2B、MTS和α-辅肌动蛋白2。

在一些实施方案中,本发明提供了包含如上所述的多顺反子报告载体的多报告细胞,其中所述载体包含位于包含两个或更多个顺反子的开放阅读框的5'的一个、两个或三个另外的转录单元,所述一个、两个或三个另外的转录单元包含启动子和编码转基因的核酸,其中所述报告载体还包含位于所述转录单元的3'且位于包含两个或更多个顺反子的开放阅读框的5'的核心隔离子序列和polyA序列。在一些实施方案中,所述一个、两个或三个转录单元编码转录因子或可能有助于本文所述的测定的其他因子。在一些实施方案中,至少所述另外的转录单元包含编码与启动子可操作地连接的报告分子的核酸。在一些实施方案中,所述报告分子与谱系特异性启动子可操作地连接。在一些实施方案中,包含编码与谱系特异性启动子可操作地连接的报告分子的另外的转录单元的多报告细胞是多能干细胞(例如,iPSC)。

在一些实施方案中,所述多报告细胞可以是可分化为不同谱系的干细胞。例如,所述多报告细胞可以是全能干细胞、多能干细胞、多潜能干细胞或祖干细胞。在一些实施方案中,所述多报告细胞是全能干细胞,其具有至少分化为所有胚胎和胚胎外谱系的能力。在一些实施方案中,所述多报告细胞是多能干细胞。在一些实施方案中,所述报告多能干细胞是从动物中分离的胚胎多能干细胞。在特定实施方案中,所述报告多能干细胞是哺乳动物胚胎干细胞。在一些实施方案中,所述报告多能干细胞是人胚胎干细胞。在一些实施方案中,所述报告多能干细胞是诱导多能干细胞。用于开发报告iPS细胞的iPS细胞可能已经通过经由转染、piggy-Bac、附加型或蛋白质重编程方法进行重编程而产生。用于开发报告iPS细胞的iPS可能已经通过对外胚层、内胚层、中胚层、胎盘、绒毛膜或滋养外胚层谱系的体细胞、终末分化或部分分化的细胞进行重编程而产生。例如,所述报告iPS细胞可能已经衍生自成纤维细胞、外周血细胞、脐带血内皮细胞、脐带血干细胞、脂肪衍生干细胞、肝细胞、角质形成细胞、神经干细胞、胰腺β细胞或羊膜细胞。所述报告iPS细胞可能已经衍生自已建立的iPS细胞系,或衍生自患者特异性iPS细胞。在一些实施方案中,所述报告iPS细胞衍生自通过对免疫赦免细胞进行重编程而产生的iPS细胞。

在一些实施方案中,所述多报告细胞是多潜能细胞或祖细胞。所述多报告细胞可以是造血细胞、内皮祖细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞。在一些实施方案中,所述多报告细胞是脐带内皮细胞、脐带血干细胞、脂肪衍生干细胞、肝细胞、角质形成细胞、神经干细胞、胰腺β细胞或羊膜细胞。

可以使所述干细胞分化为任何祖细胞或终末细胞谱系。一般或谱系特异性分化的方法是本领域已知的。可以使用本领域已知的任何方法使所述干细胞分化。例如,可以使用一种或多种驱动分化的因子或分子、一种或多种细胞基质、胚状体形成或上述的组合来使所述干细胞分化。在一些实施方案中,所分化的细胞是多报告细胞。

可以使所述细胞分化为心肌细胞、内皮细胞、神经元细胞、GABA能神经元、星形胶质细胞、多巴胺能神经元、谷氨酸能神经元、肝细胞、肝母细胞、骨骼成肌细胞、巨噬细胞、皮质神经元、心房心肌细胞、心室心肌细胞、浦肯野纤维、基底细胞、鳞状细胞、肾细胞、胰腺β细胞、上皮细胞、间充质细胞、肾上腺皮质细胞、成骨细胞、骨细胞、成软骨细胞、软骨细胞、胃肠细胞、结直肠细胞、导管细胞、小叶细胞、淋巴细胞、视网膜细胞、感光细胞或耳蜗细胞。

在一些实施方案中,所述报告iPS细胞包含如以上任何实施方案中所述的多顺反子报告物,其中所述多顺反子报告物由仅在多能细胞中具有活性的启动子驱动。例如,与包含两个或更多个顺反子的开放阅读框可操作地连接的启动子可以是Oct-4、Sox2、Nanog、KLF4、TRA-1-60、TRA-2-54、TRA-1-81、SSEA1、SSEA4或任何多能性相关基因的启动子。

在一些实施方案中,所述报告iPS细胞包含多顺反子报告物,其中所述多顺反子报告物由对分化阶段具有特异性的启动子驱动。例如,可以定制所述报告iPS细胞,使得驱动所述多顺反子启动子的启动子对分化阶段具有特异性。例如,使用OCT-4启动子将允许由所述多顺反子构建体编码的融合蛋白仅在多能细胞中表达。使用MSP1+启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心脏祖细胞前体中表达。使用α-MHC启动子将允许由所述多顺反子构建体编码的融合蛋白仅在心肌细胞中表达。类似地,使用谱系特异性启动子来驱动由上述任何实施方案的多顺反子构建体编码的融合蛋白的表达允许用户监测所述融合蛋白在目的细胞内的表达和移动,甚至在异源细胞群体中。

在一些实施方案中,本发明提供了包含多顺反子报告载体的多报告细胞,所述多顺反子报告载体编码报告多肽,所述报告多肽可以用于鉴定在其中表达特定多顺反子报告载体的谱系或细胞类型。在一些实施方案中,所述多顺反子报告载体包含编码与报告多肽融合的多肽(例如,“管家”多肽)并与组织特异性、谱系特异性或亚谱系特异性启动子可操作地连接的核酸。在一些实施方案中,编码所述多肽的核酸被编码为所述载体的多顺反子开放阅读框的一部分。在此,所述组织特异性、谱系特异性或亚谱系特异性启动子驱动所述多顺反子开放阅读框的表达。在其他实施方案中,所述组织特异性、谱系特异性或亚谱系特异性启动子和所述报告多肽作为与所述多顺反子开放阅读框分开的转录单元存在于所述多顺反子载体上。在一些实施方案中,隔离子区域存在于所述分开的转录单元与所述多顺反子开放阅读框之间。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的5'。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的3'。

在一些实施方案中,本发明提供了包含如上所述的多顺反子报告载体的多报告细胞,其中所述载体包含编码与报告多肽融合的H2B并与MLC2v启动子、SLN启动子或SHOX2启动子可操作地连接的核酸,从而使得报告物能够在心脏亚型细胞中表达。在一些实施方案中,本发明提供了包含如上所述的多顺反子报告载体的多报告细胞,其中所述载体包含编码与报告多肽融合的H2B并与vGAT启动子、TH启动子、GFAP启动子或vGLUT启动子可操作地连接的核酸,从而使得报告物能够在神经亚型细胞中表达。

在一些实施方案中,所述报告iPS细胞包含多顺反子报告物,其中所述多顺反子报告物由谱系特异性启动子驱动。在一些实施方案中,所述谱系特异性启动子是在早期内胚层、早期中胚层、早期外胚层、绒毛膜或滋养外胚层谱系中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在祖细胞中具有活性的启动子。在一些实施方案中,所述谱系特异性启动子是仅在造血细胞、内皮祖细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中具有活性的启动子。在一些实施方案中,所述多报告细胞是脐带内皮细胞、脐带血干细胞、脂肪衍生干细胞、肝细胞、角质形成细胞、神经干细胞、胰腺β细胞、淋巴细胞祖细胞或羊膜细胞。

在一些实施方案中,所述谱系特异性启动子是衍生自胚胎外组织、外胚层、内胚层或中胚层的细胞的启动子。在一些实施方案中,所述谱系特异性启动子是在心肌细胞、内皮细胞、神经元细胞、GABA能神经元、星形胶质细胞、多巴胺能神经元、谷氨酸能神经元、肝细胞、肝母细胞、骨骼成肌细胞、巨噬细胞、皮质神经元、心房心肌细胞、心室心肌细胞、结心肌细胞、浦肯野纤维、基底细胞、鳞状细胞、肾细胞、胰腺β细胞、上皮细胞、间充质细胞、肾上腺皮质细胞、成骨细胞、骨细胞、成软骨细胞、软骨细胞、胃肠细胞、结直肠细胞、导管细胞、小叶细胞、淋巴细胞、视网膜细胞、感光细胞或耳蜗细胞中表达的启动子。

使用谱系特异性启动子驱动所述多顺反子构建体内顺反子的表达可以用于鉴定不同谱系的细胞、对不同谱系的细胞进行分选、测试不同谱系的细胞中的毒性、测试和监测不同谱系的细胞中各种分子的作用、测试不同谱系的细胞中不同疗法的作用或监测不同谱系的细胞中蛋白质响应于刺激物的移动。分子和疗法的例子包括化学品、化学组合物、小生物制品、纳米颗粒、肽、抗体、疫苗及其组合。

在一些实施方案中,细胞可以包含多种多顺反子构建体,各自由不同的启动子驱动。例如,细胞可以包含其中顺反子的表达由第一启动子(其可以是谱系特异性启动子)驱动的多顺反子构建体和由第二启动子驱动的第二多顺反子构建体。在一些实施方案中,多报告细胞可以包含驱动所述多顺反子构建体中顺反子的表达的一个或多个、两个或更多个、三个或更多个谱系特异性启动子。

毒性可以通过监测与毒性相关的各种肽在细胞内或细胞之间的表达和或移动来测试。例如,蛋白质的表达和移动参与未折叠蛋白反应、自噬、DNA损伤、氧化应激和p53依赖性应激反应。

多报告细胞可以用于测试毒性、测试和监测细胞中各种分子的作用、测试细胞中不同疗法的作用或监测细胞中蛋白质响应于刺激物的移动。分子和疗法的例子包括化学品、化学组合物、小生物制品、纳米颗粒、肽、抗体、疫苗及其组合。

在一些实施方案中,本发明提供了两种或更多种多报告细胞。在一些实施方案中,共培养所述两种或更多种多报告细胞。例如,将所述两种或更多种多报告细胞作为细胞模型共培养。在一些实施方案中,将所述两种或更多种报告细胞作为三维(3-D)细胞模型共培养。3-D模型的例子包括但不限于肿瘤模型、血管网络、生物打印细胞和组织模型。在一些实施方案中,所述两种或更多种多报告细胞包含至少一种多能细胞。在一些实施方案中,所述两种或更多种多报告细胞包含至少一种iPSC。在一些实施方案中,所述细胞模型包含衍生自一种或多种iPSC的多报告细胞。在一些实施方案中,两种或更多种多报告细胞的共培养物中的至少一种多报告细胞包含与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽。在一些实施方案中,与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽用于鉴定所述细胞模型中的细胞或细胞谱系。

在一些实施方案中,本发明提供了经共培养的两种或更多种细胞,其中所述细胞中的至少一种是多报告细胞。例如,将所述两种或更多种细胞作为细胞模型共培养。在一些实施方案中,将所述两种或更多种细胞作为三维(3-D)细胞模型共培养。3-D模型的例子包括但不限于肿瘤模型、血管网络、生物打印细胞和组织模型。在一些实施方案中,所述两种或更多种细胞包含至少一种多报告多能细胞。在一些实施方案中,所述至少一种多报告细胞是iPSC。在一些实施方案中,所述细胞模型包含衍生自一种或多种iPSC的多报告细胞。在一些实施方案中,两种或更多种细胞的共培养物中的至少一种多报告细胞包含与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽。在一些实施方案中,与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽用于鉴定所述细胞模型中的细胞或细胞谱系。在一些实施方案中,本发明提供了包含至少一种、两种、三种、四种、五种或多于五种多报告细胞的细胞模型。

在一些实施方案中,本发明提供了用于产生多报告细胞的方法,所述方法包括将本文所述的多顺反子报告载体引入如本文所述的任何受体细胞中。在一些实施方案中,将所述多特异性报告载体插入所述受体细胞重组酶系统的受体位点中。在一些实施方案中,所述多顺反子报告载体包含重组酶相关核酸,所述重组酶相关核酸可以通过所述受体细胞中的重组酶蛋白插入所述受体细胞的重组酶相关核酸中。在一些实施方案中,将编码所述重组酶蛋白的核酸稳定地引入所述受体细胞中。在一些实施方案中,将编码所述重组酶的核酸瞬时引入所述受体细胞中。在一些实施方案中,在引入所述多顺反子报告载体之前、同时或之后,将编码所述重组酶的核酸瞬时引入所述受体细胞中。在一些实施方案中,将所述重组酶蛋白引入所述受体细胞中。在一些实施方案中,所述重组酶相关核酸序列是FRT核酸序列,并且所述受体细胞包含FLT重组酶。在一些实施方案中,所述重组酶相关核酸是attP,并且所述受体细胞包含Bxb1重组酶、PhiC31重组酶或R4重组酶。在一些实施方案中,所述重组酶相关核酸序列是loxP核酸序列,并且所述受体细胞包含CRE重组酶。

在一些实施方案中,将所述多顺反子报告构建体整合在所述多报告干细胞基因组中的第一特定位点处。在一些实施方案中,本发明的多报告干细胞还包含整合在所述多报告干细胞基因组中的第二特定位点处的核酸。在一些实施方案中,整合在所述多报告干细胞基因组中的第二特定位点处的核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas表达载体或诱导型Cas表达载体、组成型Cas9表达载体或诱导型Cas9表达载体。在一些实施方案中,整合在所述多报告细胞的第二位点中的Cas(例如,Cas9)表达载体可以单独地或合并地用于sgRNA文库筛选和验证。在一些实施方案中,整合在所述多报告干细胞基因组中的第二特定位点处的核酸包含第二多顺反子报告构建体。

文库

在一些方面,本发明提供了一种或多种多顺反子报告载体文库,其中所述文库包含多顺反子报告分子,所述多顺反子报告分子包含与报告多肽融合的不同转基因,其中每种载体上的所述不同转基因中的两个或更多个与谱系特异性启动子可操作地连接,并且当引入细胞时基本上1:1化学计量地表达。所述文库中的每种载体包含与谱系特异性启动子可操作地连接的报告多肽,以充当条形码用于鉴定所述文库的特定载体的受体细胞的谱系。在一些实施方案中,所述文库包含针对每种细胞谱系不同排列的谱系特异性条形码的组合。这使得能够开发利用不同细胞谱系的合并群体的测定,所述不同细胞谱系可以通过其独特的荧光条形码来鉴定和监测,并且使得能够开发利用混合细胞谱系的共培养物的更多生理学相关测定。

在一些实施方案中,所述文库包含编码一个或多个转基因的报告载体,所述一个或多个转基因编码可用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型的多肽。在一些实施方案中,所述文库包含编码一个或多个转基因的报告载体,所述一个或多个转基因编码可用于谱分析细胞的表型特征的多肽。在一些实施方案中,所述文库包含两种或更多种不同的多顺反子报告载体。在一些实施方案中,所述文库包含约两种与约10种、约10种与约20种、约20种与约30种、约30种与约40种、约40种与约50种、约50种与约100种、约100种与约500种、约500种与约100种、约1000种与约10,000种中的任一个之间的不同的多顺反子报告载体。在一些实施方案中,所述文库包含大于约10,000种不同的多顺反子报告载体。

在一些实施方案中,所述文库包含多顺反子报告载体以谱分析与疾病相关的生物途径或表型。在一些实施方案中,所述疾病是癌症、心血管疾病、神经退行性或自身免疫性疾病。在一些实施方案中,所述生物途径或表型是与所述细胞内的毒性反应机制相关的途径或表型。在一些实施方案中,所述生物途径或表型是与衰老相关的途径或表型。在一些实施方案中,所述文库包含多顺反子报告载体以谱分析与细胞增殖、细胞分化、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、或氧化应激、染色质/表观遗传学(例如染色质乙酰化)、MAPK信号传导(例如MAPK/Erk)、PI3K/Akt信号传导(例如mTor信号传导)、翻译控制(例如eIF2调控)、细胞周期和检查点控制(G1/S检查点)、细胞代谢(例如胰岛素受体信号传导)、发育和分化信号传导(例如Wnt信号传导)、免疫学和炎症信号传导(例如JAK/STAT信号传导)、酪氨酸激酶信号传导(例如ErbB/HER信号传导)、膜泡运输、细胞骨架调控或蛋白质降解(例如泛素途径)相关的生物途径以及这些途径的任何合成致死组合。在一些实施方案中,所述文库的包含用于谱分析特定单一生物途径、两种或更多种生物途径之间的特定串扰、特定细胞稳态、特定细胞器稳态或特定毒性反应的转基因的每种多顺反子载体包含与报告多肽融合的共同转基因。

在一些实施方案中,本发明提供了用于接受多顺反子报告载体的受体细胞文库。在一些实施方案中,所述文库包含两种或更多种不同的如本文所述的受体细胞。在一些实施方案中,所述文库包含约两种与约10种、约10种与约20种、约20种与约30种、约30种与约40种、约40种与约50种、约50种与约100种、约100种与约500种中的任一个之间的不同的受体细胞。在一些实施方案中,所述文库包含多于约500种不同的受体细胞。在一些实施方案中,可以将共同多顺反子报告载体引入两种或更多种受体细胞中,以比较不同细胞背景下的谱。

在一些实施方案中,本发明提供了多报告细胞文库,其中所述文库中的每种细胞包含多顺反子报告载体,所述多顺反子报告载体包含与报告多肽融合的不同转基因,其中每种载体上的所述不同转基因在引入细胞时基本上1:1化学计量地表达。文库中的每种载体包含与谱系特异性启动子可操作地连接的报告多肽,以充当条形码用于鉴定所述细胞文库中特定载体的受体细胞的谱系。在一些实施方案中,所述多报告细胞文库包含不同谱系的细胞的混合群体。在一些实施方案中,所述文库包含针对每种细胞谱系不同排列的谱系特异性条形码的组合,以允许鉴定所述文库中不同细胞的谱系。在一些实施方案中,所述文库包含约两种与约10种、约10种与约20种、约20种与约30种、约30种与约40种、约40种与约50种、约50种与约100种、约100种与约500种中的任一个之间的不同的多报告细胞。在一些实施方案中,靶向共同途径的不同多顺反子报告载体具有共同报告多肽,作为用于鉴定接受了相关多顺反子报告载体的细胞的手段。

在一些实施方案中,所述受体细胞文库和/或所述多报告细胞文库包含不同的多能细胞、多潜能细胞和/或祖细胞。在一些实施方案中,所述不同的多能细胞或所述不同的多潜能细胞包括诱导多能干细胞、多潜能细胞、造血细胞、内皮祖受体细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中的一种或多种。在一些实施方案中,在引入所述多顺反子报告载体之后,使所述多能细胞多报告细胞文库或所述多潜能细胞多报告细胞文库分化。在一些实施方案中,所述文库包括WTC-11iPSC或NCRM5 iPSC中的一种或多种。

在一些实施方案中,本发明提供了两种或更多种多报告细胞的文库,其中共培养所述两种或更多种多报告细胞。例如,将所述文库的两种或更多种多报告细胞作为细胞模型共培养。在一些实施方案中,将所述文库的两种或更多种报告细胞作为三维(3-D)细胞模型共培养。3-D模型的例子包括但不限于肿瘤模型、血管网络、生物打印细胞和组织模型。在一些实施方案中,所述两种或更多种多报告细胞包含至少一种多能细胞。在一些实施方案中,所述两种或更多种多报告细胞包含至少一种iPSC。在一些实施方案中,所述细胞模型包含衍生自一种或多种iPSC的多报告细胞。在一些实施方案中,两种或更多种多报告细胞的共培养物中的至少一种多报告细胞包含与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽。在一些实施方案中,与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽用于鉴定所述细胞模型中的细胞或细胞谱系。在一些实施方案中,本发明提供了经共培养的两种或更多种细胞的文库,其中所述细胞中的至少一种是多报告细胞。在一些实施方案中,本发明提供了细胞模型文库,其中所述细胞模型包含至少一种、两种、三种、四种、五种或多于五种多报告细胞。

在一些实施方案中,所述多报告细胞文库中的每种细胞包含相同的多顺反子报告载体。在其他实施方案中,所述多报告细胞文库中的细胞包含不同的多顺反子报告载体。在一些实施方案中,将所述不同的多顺反子报告载体引入等基因受体细胞。

在一些实施方案中,本发明提供了多报告细胞文库,其中所述报告细胞包含编码与报告多肽融合的一种或多种多肽并与谱系特异性启动子可操作地连接的多顺反子报告载体,所述一种或多种多肽可以用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型。在一些实施方案中,所述生物途径是与疾病相关的途径。在一些实施方案中,所述疾病是癌症、心血管疾病、神经退行性或自身免疫性疾病。在一些实施方案中,所述生物途径是与所述细胞内的毒性反应机制相关的途径。在一些实施方案中,所述生物途径或表型是与衰老相关的途径或表型。在一些实施方案中,所述生物途径是与细胞增殖、细胞分化、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、或氧化应激、染色质/表观遗传学(例如染色质乙酰化)、MAPK信号传导(例如MAPK/Erk)、PI3K/Akt信号传导(例如mTor信号传导)、翻译控制(例如eIF2调控)、细胞周期和检查点控制(G1/S检查点)、细胞代谢(例如胰岛素受体信号传导)、发育和分化信号传导(例如Wnt信号传导)、免疫学和炎症信号传导(例如JAK/STAT信号传导)、酪氨酸激酶信号传导(例如ErbB/HER信号传导)、膜泡运输、细胞骨架调控或蛋白质降解(例如泛素途径)相关的途径以及这些途径的合成致死组合。在一些实施方案中,所述多报告细胞文库包含不同的多顺反子载体,所述不同的多顺反子载体包含用于谱分析特定单一生物途径、两种或更多种生物途径之间的特定串扰、特定细胞稳态、特定细胞器稳态或特定毒性反应的转基因,其中每种不同的多顺反子报告载体包含与编码报告多肽的核酸融合的共同转基因。在一些实施方案中,将与报告多肽融合的共同转基因产物用作用于鉴定接受了相关多顺反子报告载体的细胞的手段。在一些实施方案中,将与报告多肽融合的共同转基因产物用作用于鉴定表达所述多顺反子报告载体的细胞的类型、谱系或亚谱系的手段。

测定

本发明提供了使用本文所述的细胞和载体的活细胞测定。在一些实施方案中,所述测定是在单一活细胞上进行的。在一些实施方案中,本发明提供了谱分析活细胞中的两种或更多种多肽的方法,所述方法包括确定如本文所述的多报告谱系条形码化细胞的转基因中的两个或更多个的表达和/或位置。在一些实施方案中,所述方法用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、细胞-细胞相互作用、毒性反应或其他细胞或亚细胞表型。在一些实施方案中,所述方法用于谱分析细胞的表型特征。在一些实施方案中,在一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。在一些实施方案中,在开始分析之后1分钟、5分钟、10分钟、15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、12小时、24小时、2天、4天、7天、14天、21天、30天、1个月、3个月、6个月、9个月、1年或之间的任何时间或超过1年中的一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。

在一些实施方案中,本发明提供了测量药剂对活细胞中两种或更多种多肽的谱的影响的方法,所述方法包括使如本文所述的多报告谱系条形码化细胞经受所述药剂,以及确定所述两个或更多个转基因响应于所述药剂在所述细胞中的表达和/或位置。在一些实施方案中,所述药剂是药物或药物候选物。在一些实施方案中,所述药剂是癌症药物或癌症药物剂。在一些实施方案中,所述方法是毒理学筛选。

在以上测定和方法的一些实施方案中,从单一活细胞中获得所述谱。在一些实施方案中,确定多个活细胞的所述谱。在一些实施方案中,将所述细胞在组织培养板上培养,所述组织培养板包括但不限于多孔组织培养板,如96孔或384孔组织培养板。在一些实施方案中,将所述细胞悬浮培养。

在以上测定和方法的一些实施方案中,确定所述两个或更多个转基因的表达和/或位置是在多报告谱系条形码化细胞文库中进行的。

在一些实施方案中,通过显微术、高通量显微术、荧光激活细胞分选(FACS)、发光、使用读板仪、质谱或深度测序来测量所述两种或更多种多肽的表达和/或位置。

在一些实施方案中,本发明提供了合并测定,其中将不同谱系的细胞合并并用于所述测定中。在一些实施方案中,将具有条形码化谱系的干细胞用于利用不同谱系的合并细胞的测定中。在一些实施方案中,将谱系特异性报告多肽针对每种细胞谱系不同地排列,从而使得能够开发利用不同谱系细胞的合并群体的测定,所述不同谱系细胞可以通过其独特的荧光条形码来鉴定和监测。这使得能够开发利用混合细胞谱系的共培养的更多生理学相关测定,与基于单一细胞谱系的纯化群体的测定形成对比。

在一些实施方案中,本发明提供了使得能够进行谱系特异性标记的多顺反子报告载体。在一些实施方案中,所述多顺反子报告载体编码报告多肽,所述报告多肽可以用于鉴定在其中表达特定多顺反子报告载体的谱系或细胞类型。在一些实施方案中,所述多顺反子报告载体包含编码与报告多肽融合的多肽(例如,“管家”多肽)并与组织特异性、谱系特异性或亚谱系特异性启动子可操作地连接的核酸。在一些实施方案中,编码所述多肽的核酸被编码为所述载体的多顺反子开放阅读框的一部分。在此,所述组织特异性、谱系特异性或亚谱系特异性启动子驱动所述多顺反子开放阅读框的表达。在其他实施方案中,所述组织特异性、谱系特异性或亚谱系特异性启动子和所述报告多肽作为与所述多顺反子开放阅读框分开的转录单元存在于所述多顺反子载体上。在一些实施方案中,隔离子区域存在于所述分开的转录单元与所述多顺反子开放阅读框之间。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的5'。在一些实施方案中,所述分开的转录单元在所述多顺反子开放阅读框的3'。

在一些实施方案中,所述载体包含编码与报告多肽融合的H2B并与MLC2v启动子、SLN启动子或SHOX2启动子可操作地连接的核酸,从而使得报告物能够在心肌细胞亚型细胞中表达。在一些实施方案中,所述载体包含编码与报告多肽融合的H2B并与vGAT启动子、TH启动子、GFAP启动子或vGLUT启动子可操作地连接的核酸,从而使得报告物能够在神经亚型细胞中表达。

试剂盒和制品

在一些实施方案中,本发明提供了试剂盒,其包含一种或多种如本文所述的多顺反子报告载体。在一些实施方案中,本发明提供了试剂盒,其包含一种或多种如本文所述的受体细胞。在一些实施方案中,本发明提供了试剂盒,其包含本文所述的多报告细胞中的一种或多种。在一些实施方案中,本发明提供了试剂盒,其包含一种或多种本文所述的多顺反子报告载体和一种或多种如本文所述的受体细胞。在一些实施方案中,所述试剂盒还包含使用本文所述的多顺反子报告载体、受体细胞和/或多报告细胞的说明书。在一些实施方案中,所述试剂盒包含等基因但差异标记的多报告细胞的混合物。此类细胞使得能够直接铺板合并测定。

在一些实施方案中,所述试剂盒包含两种或更多种多报告细胞的文库,其中共培养所述两种或更多种多报告细胞。例如,可以将所述试剂盒的两种或更多种多报告细胞作为细胞模型共培养。在一些实施方案中,将所述试剂盒的两种或更多种报告细胞作为三维(3-D)细胞模型共培养。3-D模型的例子包括但不限于肿瘤模型、血管网络、生物打印细胞和组织模型。在一些实施方案中,所述试剂盒包含已经形成细胞模型的培养细胞。在其他实施方案中,所述试剂盒包含可组合且共培养以形成细胞模型的单独细胞。在一些实施方案中,所述试剂盒的两种或更多种多报告细胞包含至少一种多能细胞。在一些实施方案中,所述试剂盒的两种或更多种多报告细胞包含至少一种iPSC。在一些实施方案中,所述试剂盒的细胞模型包含衍生自一种或多种iPSC的多报告细胞。在一些实施方案中,所述试剂盒中的至少一种多报告细胞包含与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽。在一些实施方案中,与谱系特异性启动子、亚谱系特异性启动子或组织特异性启动子可操作地连接的报告多肽用于鉴定所述细胞模型中的细胞或细胞谱系。在一些实施方案中,本发明提供了试剂盒,其包含经共培养的两种或更多种细胞,其中所述细胞中的至少一种是多报告细胞。在一些实施方案中,本发明提供了试剂盒,其包含细胞模型或用于产生细胞模型的细胞,其中所述细胞模型包含至少一种、两种、三种、四种、五种或多于五种多报告细胞。

在一些实施方案中,本发明提供了排列在多孔板(例如,96孔板或384孔板)中的受体细胞和/或报告细胞的文库。在一些实施方案中,本发明提供了排列在多孔板中的如上所述的细胞模型的文库。在一些实施方案中,将所述多孔板中的细胞低温保存。

本文所述的多顺反子报告载体、受体细胞和/或多报告细胞可以包含在制品内。所述制品可以包含含有本文所述的多顺反子报告载体、受体细胞和/或多报告细胞的容器。在一些实施方案中,所述制品包含:(a)容器,在所述容器内包含本文所述的多顺反子报告载体、受体细胞和/或多报告细胞;以及(b)具有用于使用本文所述多顺反子报告载体、受体细胞和/或多报告细胞的说明书的包装插页。

在一些实施方案中,所述制品包含容器以及在所述容器上或与所述容器相连的标签或包装插页。合适的容器包括例如瓶子、小瓶、注射器等。所述容器可以由多种材料如玻璃或塑料形成。所述制品还可以包括从商业和用户角度所需的其他材料,包括其他缓冲液、稀释剂、试剂、组织培养基、过滤器、针和注射器。

在一些实施方案中,本发明提供了试剂盒,其包含排列在多孔板中的受体细胞或报告细胞的文库。在一些实施方案中,将所述细胞铺板、低温保存。

示例性实施方案

实施方案1.一种多顺反子报告载体,其包含:

与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

实施方案2.一种多顺反子报告载体,其包含:

与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;

与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

实施方案3.根据实施方案2所述的多顺反子报告载体,其中所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。

实施方案4.根据实施方案3所述的多顺反子报告载体,其中所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

实施方案5.一种多顺反子报告载体,其包含:

与编码细胞器特异性多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;

与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;并且

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量。

实施方案6.根据实施方案5所述的多顺反子报告载体,其中所述细胞器特异性多肽是H2B。

实施方案7.根据实施方案5或6所述的多顺反子报告载体,其中所述组成型启动子是巨细胞病毒a(CMV)、胸苷激酶(TK)、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。

实施方案8.根据实施方案5-7中任一项所述的多顺反子报告载体,其中所述启动子包含四环素响应型元件。

实施方案9.根据实施方案8所述的多顺反子报告载体,其中所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

实施方案10.根据实施方案2-9中任一项所述的多顺反子报告载体,其中所述第一启动子和所述第二启动子处于不同的取向。

实施方案11.根据实施方案2-10中任一项所述的多顺反子报告载体,其中所述第一启动子和所述第二启动子通过隔离子核酸分开。

实施方案12.根据实施方案1-11中任一项所述的多顺反子报告载体,其中所述顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。

实施方案13.根据实施方案12所述的多顺反子报告载体,其中所述一种或多种自切割肽是病毒自切割肽。

实施方案14.根据实施方案13所述的多顺反子报告载体,其中所述一种或多种病毒自切割肽是一种或多种2A肽。

实施方案15.根据实施方案14所述的多顺反子报告载体,其中一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。

实施方案16.根据实施方案12-15中任一项所述的多顺反子报告载体,其中所述报告多肽还包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。

实施方案17.根据实施方案16所述的多顺反子报告载体,其中所述肽接头包含序列Gly-Ser-Gly。

实施方案18.根据实施方案1-17中任一项所述的多顺反子报告载体,其中所述报告多肽是荧光报告多肽。

实施方案19.根据实施方案1-18中任一项所述的多顺反子报告载体,其中每个顺反子的所述报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

实施方案20.根据实施方案1-19中任一项所述的多顺反子报告载体,其中所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。

实施方案21.根据实施方案1-19中任一项所述的多顺反子报告载体,其中所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。

实施方案22.根据实施方案1-19中任一项所述的多顺反子报告载体,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。

实施方案23.根据实施方案1-19中任一项所述的多顺反子报告载体,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

实施方案24.根据实施方案1-23中任一项所述的多顺反子报告载体,其中所述谱系特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑或皮肤谱系的细胞具有特异性。

实施方案25.根据实施方案1-24中任一项所述的多顺反子报告载体,其中所述谱系特异性启动子是亚谱系特异性启动子。

实施方案26.根据实施方案1-25中任一项所述的多顺反子报告载体,其中所述谱系特异性启动子是心脏特异性启动子。

实施方案27.根据实施方案26所述的多顺反子报告载体,其中所述心脏特异性启动子是MCLV2v、SLN、SHOX2、MYBPC3、TNNI3或α-MHC启动子。

实施方案28.根据实施方案1-25中任一项所述的多顺反子报告载体,其中所述谱系特异性启动子是神经特异性启动子。

实施方案29.根据实施方案28所述的多顺反子报告载体,其中所述神经特异性启动子是vGAT、TH、GFAP或vGLUT1启动子。

实施方案30.根据实施方案1-29中任一项所述的多顺反子报告载体,其还包含位于所述开放阅读框的3'的位点特异性重组酶序列。

实施方案31.根据实施方案30所述的多顺反子报告载体,其中所述载体还包含编码选择性标记的核酸,其中当所述位点特异性重组酶序列尚未重组时,编码所述选择性标记的核酸不与所述启动子可操作地连接,并且当所述位点特异性重组酶序列与其靶位点特异性重组酶序列重组时,编码所述选择性标记的核酸与所述启动子可操作地连接。

实施方案32.根据实施方案31所述的多顺反子报告载体,其中所述位点特异性重组酶序列是FRT核酸序列和/或attP核酸和/或loxP核酸序列。

实施方案33.根据实施方案31或32所述的多顺反子报告载体,其中所述选择性标记赋予对潮霉素、Zeocin

实施方案34.根据实施方案1-33中任一项所述的多顺反子报告载体,其中将编码一种或多种多肽的核酸框内插入所述一个或多个MCS中。

实施方案35.根据实施方案1-34中任一项所述的多顺反子报告载体,其中至少一个顺反子包含编码管家基因的核酸。

实施方案36.根据实施方案35所述的多顺反子报告载体,其中所述管家基因是H2B。

实施方案37.根据实施方案1-36中任一项所述的多顺反子报告载体,其中至少一个顺反子包含编码细胞器标记的核酸。

实施方案38.根据实施方案37所述的多顺反子报告载体,其中所述细胞器标记包含与所述报告多肽融合的H2B、α-辅肌动蛋白2或线粒体靶向信号。

实施方案39.根据实施方案34-38中任一项所述的多顺反子报告载体,其中所述一种或多种多肽包含可用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用或毒性反应的多肽。

实施方案40.一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含

与开放阅读框可操作地连接的启动子,其中所述启动子是谱系特异性启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且

其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。

实施方案41.一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含

与反式激活因子多肽连接的第一启动子,其中所述第一启动子是谱系特异性启动子;

与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是可由所述反式激活因子多肽诱导的,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且

其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。

实施方案42.根据实施方案41所述的多报告干细胞,其中所述反式激活因子多肽是四环素反式激活因子多肽,并且所述第二启动子包含四环素响应型元件。

实施方案43.根据实施方案42所述的多报告干细胞,其中所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

实施方案44.一种多报告干细胞,其中所述多报告干细胞包含多顺反子报告构建体,其中所述多顺反子报告构建体包含

与编码管家多肽的核酸连接的第一启动子,其中所述第一启动子是谱系特异性启动子;

与开放阅读框可操作地连接的第二启动子,其中所述第二启动子是组成型启动子,其中所述开放阅读框包含两个或更多个顺反子,并且其中所述开放阅读框在细胞中的表达产生来自每个顺反子的分开的组分多肽产物;

其中每个顺反子包含多克隆位点(MCS)和编码报告载体的核酸,其中每个顺反子编码不同的报告多肽;

其中插入所述两个或更多个多克隆位点中并与所述报告多肽融合的编码多肽的两种或更多种核酸的表达基本上为约1:1化学计量;并且

其中所述干细胞是多能干细胞、多潜能干细胞或诱导多能干(iPS)细胞。

实施方案45.根据实施方案44所述的多报告干细胞,其中所述管家多肽是H2B。

实施方案46.根据实施方案44或45所述的多报告干细胞,其中所述组成型启动子是巨细胞病毒a(CMV)、胸苷激酶(TK)、eF1-α、泛素C(UbC)、磷酸甘油酸激酶(PGK)、CAG启动子、SV40启动子或人β-肌动蛋白启动子。

实施方案47.根据实施方案44-46中任一项所述的多报告干细胞,其中所述启动子包含四环素响应型元件。

实施方案48.根据实施方案47所述的多报告干细胞,其中所述四环素响应型元件是Tet操纵子2(TetO2)诱导型或阻遏元件。

实施方案49.根据实施方案40-448中任一项所述的多报告干细胞,其中所述第一启动子和所述第二启动子处于不同的取向。

实施方案50.根据实施方案40-49中任一项所述的多报告干细胞,其中所述第一启动子和所述第二启动子通过隔离子核酸分开。

实施方案51.根据实施方案40-50中任一项所述的多报告干细胞,其中所述顺反子通过编码一种或多种自切割肽和/或一个或多个内部核糖体进入位点(IRES)的核酸彼此分开。

实施方案52.根据实施方案51所述的多报告干细胞,其中所述一种或多种自切割肽是病毒自切割肽。

实施方案53.根据实施方案52所述的多报告干细胞,其中所述一种或多种病毒自切割肽是一种或多种2A肽。

实施方案54.根据实施方案53所述的多报告干细胞,其中一种或多种2A肽是T2A肽、P2A肽、E2A肽或F2A肽。

实施方案55.根据实施方案51-54中任一项所述的多报告干细胞,其中所述报告多肽还包含一种或多种核酸,所述一种或多种核酸编码在所述报告多肽中的一种或多种与所述自切割肽中的一种或多种之间的肽接头。

实施方案56.根据实施方案55所述的多报告干细胞,其中所述肽接头包含序列Gly-Ser-Gly。

实施方案57.根据实施方案40-56中任一项所述的多报告干细胞,其中所述报告多肽是荧光报告多肽。

实施方案58.根据实施方案40-57中任一项所述的多报告干细胞,其中每个顺反子的所述报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

实施方案59.根据实施方案40-58中任一项所述的多报告干细胞,其中所述开放阅读框包含第一顺反子和第二顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码病毒切割肽的核酸分开。

实施方案60.根据实施方案40-58中任一项所述的多报告干细胞,其中所述开放阅读框包含第一顺反子、第二顺反子和第三顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸和编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,并且所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开。

实施方案61.根据实施方案40-60中任一项所述的多报告干细胞,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码第三病毒切割肽的核酸分开。

实施方案62.根据实施方案40-60中任一项所述的多报告干细胞,其中所述载体包含与开放阅读框可操作地连接的启动子,其中所述开放阅读框包含第一顺反子、第二顺反子、第三顺反子和第四顺反子,其中每个顺反子从5'至3'包含含有MCS的核酸、编码报告多肽的核酸、编码接头肽的核酸;其中所述第一顺反子和所述第二顺反子通过编码第一病毒切割肽的核酸分开,所述第二顺反子和所述第三顺反子通过编码第二病毒切割肽的核酸分开,所述第三顺反子和所述第四顺反子通过编码IRES的核酸分开。

实施方案63.根据实施方案40-62中任一项所述的多报告干细胞,其中所述谱系特异性启动子对心脏、血液、肌肉、肺、肝、肾、胰腺、脑或皮肤谱系的细胞具有特异性。

实施方案64.根据实施方案40-63中任一项所述的多报告干细胞,其中所述谱系特异性启动子是亚谱系特异性启动子。

实施方案65.根据实施方案40-64中任一项所述的多报告干细胞,其中所述谱系特异性启动子是心脏特异性启动子。

实施方案66.根据实施方案65所述的多报告干细胞,其中所述心脏特异性启动子是MCLV2v、SLN、SHOX2、MYBPC3、TNNI3或α-MHC启动子。

实施方案67.根据实施方案40-64中任一项所述的多报告干细胞,其中所述谱系特异性启动子是神经特异性启动子。

实施方案68.根据实施方案67所述的多报告干细胞,其中所述神经特异性启动子是vGAT、TH、GFAP或vGLUT1启动子。

实施方案69.根据实施方案40-68中任一项所述的多报告干细胞,其中将编码一种或多种多肽的核酸框内插入所述一个或多个MCS中。

实施方案70.根据实施方案40-69中任一项所述的多报告干细胞,其中至少一个顺反子包含编码细胞器特异性多肽的核酸。

实施方案71.根据实施方案70所述的多报告干细胞,其中所述细胞器特异性多肽是H2B。

实施方案72.根据实施方案40-71中任一项所述的多报告干细胞,其中至少一个顺反子包含编码细胞器标记的核酸。

实施方案73.根据实施方案72所述的多报告干细胞,其中所述细胞器标记包含与所述报告多肽融合的H2B、α-辅肌动蛋白2或线粒体靶向信号。

实施方案74.根据实施方案69-73中任一项所述的多报告干细胞,其中所述一种或多种多肽包含可用于在所述干细胞分化之后谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用或毒性反应的多肽。

实施方案75.根据实施方案74所述的多报告干细胞,其中所述谱分析是在单一细胞上进行的。

实施方案76.根据实施方案40-75中任一项所述的多报告干细胞,其中所述报告多肽可以通过显微术、高通量显微术、荧光激活细胞分选(FACS)、发光或使用读板仪来可视化。

实施方案77.根据实施方案40-76中任一项所述的多报告干细胞,其中在所述干细胞分化之前、期间或之后分析所述报告多肽。

实施方案78.根据实施方案40-77中任一项所述的多报告干细胞,其中将所述多顺反子报告构建体整合在所述多报告干细胞基因组中的第一特定位点处。

实施方案79.根据实施方案78所述的多报告干细胞,其还包含整合在所述多报告干细胞基因组中的第二特定位点处的核酸。

实施方案80.根据实施方案79所述的多报告干细胞,其中整合在所述多报告干细胞基因组中的第二特定位点处的核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas9表达载体或诱导型Cas9表达载体。

实施方案81.一种多报告载体文库,其中所述文库包含两种或更多种根据实施方案1-39中任一项所述的多顺反子报告载体,其中所述两种或更多种多顺反子报告载体包含与报告多肽融合的不同转基因,其中当引入细胞时,每种载体上的所述不同转基因中的两个或更多个以基本上1:1化学计量表达。

实施方案82.一种多报告载体文库,其中所述文库包含两种或更多种根据实施方案1-39中任一项所述的多顺反子报告载体,其中所述两种或更多种多顺反子报告载体包含与融合至不同报告多肽的转基因可操作地连接的不同谱系特异性启动子,使得所述报告多肽的表达可以基于所述谱系特异性启动子来区分细胞类型。

实施方案83.根据实施方案82所述的多报告载体文库,其中将相同的转基因与所述不同的谱系特异性启动子和所述不同的报告多肽可操作地连接。

实施方案84.根据实施方案83所述的多报告载体文库,其中所述转基因编码管家多肽或细胞器特异性多肽。

实施方案85.根据实施方案84所述的多报告载体文库,其中所述转基因编码H2B、α-辅肌动蛋白2或线粒体靶向信号。

实施方案86.根据实施方案81-85中任一项所述的多报告载体文库,其中所述报告载体编码一个或多个转基因,所述一个或多个转基因能够用于在所述细胞分化之后谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用或毒性反应或其他表型。

实施方案87.根据实施方案81-86中任一项所述的多报告载体文库,其中所述生物途径或表型是与疾病相关的途径或表型。

实施方案88.根据实施方案87所述的多报告载体文库,其中所述疾病是癌症、心血管疾病、神经退行性或神经系统疾病或自身免疫性疾病。

实施方案89.根据实施方案87或88所述的多报告载体文库,其中所述生物途径或表型是与所述细胞内的毒性反应机制相关的途径或表型。

实施方案90.根据实施方案87或88所述的多报告载体文库,其中所述生物途径或表型是与衰老相关的途径或表型。

实施方案91.根据实施方案87或88所述的多报告载体文库,其中所述生物途径是与细胞增殖、细胞分化、细胞存活、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、氧化应激、染色质/表观遗传学、MAPK信号传导、PI3K/Akt信号传导、蛋白质合成、翻译控制、蛋白质降解、细胞周期和检查点控制、细胞代谢、发育和分化信号传导、免疫学和炎症信号传导、酪氨酸激酶信号传导、膜泡运输、细胞骨架调控、泛素途径相关的途径。

实施方案92.一种多报告细胞文库,其中所述文库中的每种细胞包含根据实施方案1-39中任一项所述的多顺反子报告载体,其中所述文库中的细胞包含不同的多顺反子报告载体。

实施方案93.一种多报告细胞文库,其包含两种或更多种根据实施方案40-80中任一项所述的多报告细胞,其中所述文库中的两种或更多种多报告细胞包含不同的多顺反子报告载体。

实施方案94.根据实施方案92或93所述的多报告细胞文库,其中每种多顺反子报告载体包含与共同报告多肽融合、与共同谱系特异性启动子可操作地连接的共同转基因。

实施方案95.根据实施方案92或93所述的多报告细胞文库,其中每种多顺反子报告载体包含与不同报告多肽融合并与不同谱系特异性启动子可操作地连接的共同转基因。

实施方案96.根据实施方案92-95中任一项所述的多报告细胞文库,其中所述文库包含多能细胞、多潜能细胞和/或祖细胞。

实施方案97.根据实施方案92-95中任一项所述的多报告细胞文库,其中所述文库包含不同的多能细胞、多潜能细胞和/或祖细胞。

实施方案98.根据实施方案96或97所述的多报告细胞文库,其中所述多能细胞或所述多潜能细胞包括诱导多能干细胞、多潜能细胞、造血细胞、内皮祖受体细胞、间充质祖细胞、神经祖细胞、骨软骨祖细胞、淋巴样祖细胞或胰腺祖细胞中的一种或多种。

实施方案99.根据实施方案95-98中任一项所述的多报告细胞文库,其中在引入所述多顺反子报告载体之后,使所述多能细胞或所述多潜能细胞分化。

实施方案100.根据实施方案95-99中任一项所述的多报告细胞文库,其中将不同的多顺反子报告载体引入等基因多能或多潜能受体细胞。

实施方案101.根据实施方案95-100中任一项所述的多报告细胞文库,其中所述多顺反子报告载体编码一个或多个转基因,所述一个或多个转基因能够用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用、毒性反应或其他表型,并且其中与所述谱系特异性启动子可操作地连接的转基因的表达用于鉴定细胞类型或分化阶段。

实施方案102.根据实施方案101所述的文库,其中所述生物途径或表型是与疾病相关的途径或表型。

实施方案103.根据实施方案102所述的文库,其中所述疾病是癌症、心血管疾病、神经退行性或神经系统疾病或自身免疫性疾病。

实施方案104.根据实施方案101所述的文库,其中所述生物途径或表型是与所述细胞内的毒性反应机制相关的途径或表型。

实施方案105.根据实施方案101所述的文库,其中所述生物途径或表型是与衰老相关的途径或表型。

实施方案106.根据实施方案101-105中任一项所述的文库,其中所述生物途径是与细胞增殖、细胞分化、细胞存活、细胞死亡、细胞凋亡、自噬、DNA损伤和修复、氧化应激、染色质/表观遗传学、MAPK信号传导、PI3K/Akt信号传导、蛋白质合成、翻译控制、蛋白质降解、细胞周期和检查点控制、细胞代谢、发育和分化信号传导、免疫学和炎症信号传导、酪氨酸激酶信号传导、膜泡运输、细胞骨架调控或泛素途径相关的途径。

实施方案107.根据实施方案101-106中任一项所述的文库,其中所述文库包含两种或更多种不同谱系的细胞。

实施方案108.根据实施方案107所述的文库,其中所述不同谱系的细胞包含谱系特异性报告多肽。

实施方案109.一种试剂盒,其包含一种或多种根据实施方案1-39中任一项所述的多顺反子报告载体。

实施方案110.一种试剂盒,其包含一种或多种根据实施方案40-80中任一项所述的多报告干细胞。

实施方案111.根据实施方案109或110所述的试剂盒,其中所述试剂盒包含排列在多孔板中的多顺反子报告干细胞的文库。

实施方案112.根据实施方案111所述的试剂盒,其中将所述多孔板中的干细胞低温保存。

实施方案113.一种谱分析活细胞中的两种或更多种多肽的方法,所述方法包括确定根据实施方案40-80中任一项所述的多报告干细胞的转基因中的两个或更多个的表达和/或位置。

实施方案114.根据实施方案113所述的方法,其中在所述干细胞分化之前、期间或之后进行谱分析。

实施方案115.根据实施方案113或114所述的方法,其中所述方法用于谱分析或区分单一或多种生物途径、两种或更多种生物途径之间的串扰、合成致死性、细胞稳态、细胞器稳态、其他细胞或亚细胞表型、细胞-细胞相互作用或毒性反应。

实施方案116.根据实施方案113-115中任一项所述的方法,其中在一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。

实施方案117.根据实施方案116所述的方法,其中在1分钟、5分钟、10分钟、15分钟、30分钟、45分钟、1小时、2小时、3小时、4小时、5小时、6小时、12小时、24小时、2天、4天、7天、14天、21天、30天、1个月、3个月、6个月、9个月、1年或超过1年中的一个或多个时间点确定所述转基因中的两个或更多个的表达和/或位置。

实施方案118.一种测量药剂对活细胞中两种或更多种多肽的谱的影响的方法,所述方法包括使根据实施方案40-77中任一项所述的多报告干细胞经受所述药剂,以及确定所述两个或更多个转基因响应于所述药剂在所述细胞中的表达和/或位置。

实施方案119.根据实施方案118所述的方法,其中在所述干细胞分化之前、期间或之后进行谱分析。

实施方案120.根据实施方案118或119所述的方法,其中所述药剂是药物或药物候选物。

实施方案121.根据实施方案118-120中任一项所述的方法,其中所述药剂是癌症药物或癌症药物剂。

实施方案122.根据实施方案118-121中任一项所述的方法,其中所述方法是毒理学筛选。

实施方案123.根据实施方案118-122中任一项所述的方法,其中确定所述两个或更多个转基因的表达和/或位置是在多报告细胞文库中进行的。

实施方案124.根据实施方案123所述的方法,其中通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定所述文库中细胞的谱系。

实施方案125.根据实施方案118-124中任一项所述的方法,其中使用单一细胞获得所述谱。

实施方案126.根据实施方案125所述的方法,其中通过在所述谱系特异性报告物的控制下所述报告多肽的表达来确定所述单一细胞的谱系。

实施方案127.根据实施方案118-126中任一项所述的方法,其中通过显微术、高通量显微术、荧光激活细胞分选(FACS)、发光、使用读板仪、质谱或深度测序来测量所述两个或更多个转基因的表达和/或位置。

实施方案128.根据实施方案118-127中任一项所述的方法,其中将两种或更多种不同谱系的细胞合并以谱分析两种或更多种不同谱系的细胞中的所述两种或更多种多肽。

实施方案129.根据实施方案128所述的方法,其中所述不同谱系的细胞包含谱系特异性报告多肽。

实施方案130.一种用于接受多顺反子报告载体的受体细胞,其中所述受体细胞包含整合到宿主细胞基因组中的特定位点的重组核酸,其中所述重组核酸包含与编码融合多肽的核酸可操作地连接的第一启动子,其中所述融合多肽包含报告结构域和选择性标记结构域,并且其中所述核酸包含位于编码所述融合多肽的核酸的5'端处的两个位点特异性重组酶核酸序列。

实施方案131.根据实施方案130所述的受体细胞,其中所述核酸包含位于所述两个特异性重组酶核酸序列的5'的两个ATG序列。

实施方案132.根据实施方案131所述的受体细胞,其中所述启动子是组成型启动子。

实施方案133.根据实施方案132所述的受体细胞,其中所述组成型启动子是CMV启动子、TK启动子、eF1-α启动子、Buck启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子。

实施方案134.根据实施方案130-133中任一项所述的受体细胞,其中所述位点特异性重组酶序列是FRT核酸序列和/或attP核酸序列和/或loxP核酸序列。

实施方案135.根据实施方案134所述的受体细胞,其中所述位点特异性重组酶序列包含PhiC31 attP核酸序列和Bxb1 attP核酸序列。

实施方案136.根据实施方案130-135中任一项所述的受体细胞,其中所述融合多肽的报告结构域是荧光报告结构域。

实施方案137.根据实施方案130-136中任一项所述的受体细胞,其中所述荧光报告结构域选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

实施方案138.根据实施方案130-137中任一项所述的受体细胞,其中所述融合多肽的报告结构域是mCherry报告结构域。

实施方案139.根据实施方案130-138中任一项所述的受体细胞,其中所述融合多肽的选择性标记结构域赋予对潮霉素、Zeocin

实施方案140.根据实施方案139所述的受体细胞,其中所述启动子是人β-肌动蛋白启动子或CAG启动子。

实施方案141.根据实施方案130-140中任一项所述的受体细胞,其中将所述重组核酸整合在腺相关病毒S1(AAVS1)基因座、趋化因子(CC基序)受体5(CCR5)基因座、小鼠ROSA26基因座的人直向同源物、hip11(H11)基因座或柠檬酸裂解酶β样基因座(CLYBL)中。

实施方案142.根据实施方案130-141中任一项所述的受体细胞,其中所述细胞是多能细胞、诱导多能干细胞或多潜能细胞。

实施方案143.根据实施方案142所述的受体细胞,其中所述诱导多能干细胞是WTC-11细胞或NCRM5细胞。

实施方案144.根据实施方案130-142中任一项所述的受体细胞,其中所述细胞是原代细胞。

实施方案145.根据实施方案130-142中任一项所述的受体细胞,其中所述细胞是永生化细胞。

实施方案146.根据实施方案145所述的受体细胞,其中所述永生化细胞是HEK293T细胞、A549细胞、U2OS细胞、RPE细胞、NPC1细胞、MCF7细胞、HepG2细胞、HaCat细胞、TK6细胞、A375细胞或HeLa细胞。

实施方案147.根据实施方案130-146中任一项所述的受体细胞,其中所述受体细胞包含用于接受第一多顺反子报告载体的第一重组核酸和用于接受第二表达构建体的第二重组核酸,其中将所述第一重组核酸整合到宿主细胞基因组中的第一特定位点中,并且将所述第二重组核酸整合到宿主细胞基因组中的第二特定位点中。

实施方案148.根据实施方案147所述的受体细胞,其中所述第二重组核酸编码多肽、报告多肽、细胞毒性多肽、选择性多肽、组成型Cas9表达载体或诱导型Cas9表达载体。

实施方案149.一种报告细胞,其由根据实施方案137或148所述的受体细胞制备,其中将多顺反子报告载体整合到所述第一特定位点中,并且将组成型或诱导型Cas9表达载体整合到第二特定位点中。

实施方案150.一种方法,其中将根据实施方案149所述的报告细胞排列在多孔板中,并且用作使用单一或寡核苷酸合并sgRNA的筛选的基础。

实施方案151.一种用于产生用以接受多顺反子报告载体的受体细胞的方法,所述方法包括将重组核酸引入细胞,其中所述重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第一核酸、第一启动子、两个ATG序列、两种位点特异性重组酶核酸、编码第一报告多肽和选择性标记的核酸、用于将同源重组靶向至所述细胞中的特定位点的第二核酸、第二启动子和编码第二报告多肽或细胞毒性多肽的核酸,

其中表达所述第一报告多肽而不表达所述第二报告多肽或细胞毒性多肽指示将所述重组核酸靶向整合至细胞基因组中的所述特定位点,并且表达所述第一报告多肽和所述第二报告多肽或细胞毒性多肽指示随机整合在细胞基因组中。

实施方案152.根据实施方案151所述的方法,其中使用以下将所述重组核酸整合到所述细胞的基因组中:

包含核酸酶和指导RNA的RNA指导的重组系统

TALEN核酸内切酶,或

ZFN核酸内切酶。

实施方案153.根据实施方案151或152所述的方法,其中选择表达所述第一报告多肽但不表达所述第二报告多肽的细胞。

实施方案154.根据实施方案151-153中任一项所述的方法,其中所述位点特异性重组酶核酸包含FRT核酸序列和/或attP核酸序列和/或loxP核酸序列。

实施方案155.根据实施方案151-154中任一项所述的方法,其中所述第一报告多肽是荧光多肽,并且所述第二报告多肽是不同的荧光多肽。

实施方案156.根据实施方案151-155中任一项所述的方法,其中所述第一报告多肽和所述第二报告多肽选自GFP、EGFP、Emerald、Citrine、Venus、mOrange、mCherry、TagBFP、mTurquoise、Cerulean、UnaG、dsRed、eqFP611、Dronpa、RFP、TagRFP、TdTomato、KFP、EosFP、Dendra、IrisFP、iRFP和smURFP。

实施方案157.根据实施方案156所述的方法,其中所述第一报告多肽是mCherry报告物,并且所述第二报告多肽是GFP。

实施方案158.根据实施方案151-155中任一项所述的方法,其中所述细胞毒性多肽是胸苷激酶肽或白喉毒素A(DTA)。

实施方案159.根据实施方案151-158中任一项所述的方法,其中所述选择性标记赋予对潮霉素、Zeocin

实施方案160.根据实施方案151-159中任一项所述的方法,其中所述第一启动子是CMV启动子、TK启动子、eF1-α启动子、UbC启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子,并且所述第二启动子是CMV启动子、TK启动子、eF1-α启动子、UbC启动子、PGK启动子、CAG启动子、SV40启动子或人β-肌动蛋白启动子。

实施方案161.根据实施方案151-160中任一项所述的方法,其中用于靶向同源重组的所述第一核酸和用于靶向同源重组的所述第二核酸将重组靶向至AAVS1基因座、CCR5基因座、小鼠ROSA26基因座的人直向同源物、H11基因座或CLYBL基因座。

实施方案162.根据实施方案151-161中任一项所述的方法,其中所述细胞是永生化细胞。

实施方案163.根据实施方案162所述的方法,其中所述永生化细胞是HEK293T细胞、A549细胞、U2OS细胞、RPE细胞、NPC1细胞、MCF7细胞、HepG2细胞、HaCat细胞、TK6细胞、A375细胞或HeLa细胞。

实施方案164.根据实施方案151-163中任一项所述的方法,其中所述细胞是多能细胞、诱导多能干细胞或多潜能细胞。

实施方案165.根据实施方案164所述的方法,其中所述诱导多能干细胞是WTC-11细胞或NCRM5细胞。

实施方案166.根据实施方案151-161中任一项所述的方法,其中所述细胞是原代细胞。

实施方案167.根据实施方案151-166中任一项所述的方法,其还包括将第二重组核酸引入用于接受第二多顺反子报告载体的细胞,其中所述第二重组核酸从5'至3'包含用于将同源重组靶向至所述细胞中的特定位点的第三核酸、第三启动子、两个ATG序列、两种位点特异性重组酶核酸、编码第三报告多肽和选择性标记的核酸、用于将同源重组靶向至所述细胞中的特定位点的第四核酸、第四启动子和编码第四报告多肽或细胞毒性多肽的核酸,

其中表达所述第三报告多肽而不表达所述第四报告多肽或细胞毒性多肽指示将所述重组核酸靶向整合至细胞基因组中的所述特定位点,并且表达所述第三报告多肽和所述第四报告或细胞毒性多肽指示随机整合在细胞基因组中。

本说明书中公开的所有特征可以以任何组合进行组合。本说明书中公开的每个特征可以被替换为用于相同、等同或相似目的的替代特征。因此,除非另外明确规定,否则所公开的每个特征仅是一系列通用等同或相似特征的一个例子。

通过以下非限制性实施例说明本发明的进一步细节。本说明书中所有参考文献的公开内容通过引用明确地并入本文。

实施例

实施例1-单受体位点谱系条形码模型的产生

如先前所述(PCT/US2018//032834)产生使用由Cas9介导的RNA指导的基因组工程化工具将“受体位点”引入iPSC系的内源AAVS1基因座中的稳健靶向策略。受体位点包括(1)确认受体位点整合的mCherry荧光标记;(2)由巨细胞病毒/鸡β-肌动蛋白启动子(CAG)启动子驱动的抗生素抗性基因,从而使得能够进行细胞选择;(3)用于基因的任选诱导型表达的由组成型CAG启动子驱动的TetR元件;以及(4)位于同源重组区下游的由CMV启动子驱动的GFP基因,从而使得能够在随机整合与靶向整合之间迅速区分(具有随机整合的细胞由于GFP表达而发出绿色荧光,而具有靶向整合的细胞由于CMV-GFP的丢失而不会发出绿色荧光)。

产生改善的四顺反子报告物以在受体位点中整合多达4个基因。四顺反子报告物含有驱动单一开放阅读框(ORF)表达的组成型启动子,所述单一开放阅读框(ORF)含有由2个独特的病毒2A自切割肽分开的三个多克隆位点(MCS)和由允许在mRNA序列的中间的起始翻译的内部核糖体进入位点(IRES)元件分开的第四MCS(图1A)。2A自切割肽允许将多种蛋白质编码为多蛋白,所述多蛋白在翻译时解离为组分蛋白。2A肽序列通过核糖体跳跃机制损害正常的肽键形成。从肽2A切割序列家族中,P2A和T2A版本被鉴定为最佳候选物,因为已经显示这些展现出最高效的切割(Kim JH等人,PLoS ONE 6(4):e18556(2011))。为了增加病毒肽的切割效率,在蛋白质N末端与2A肽序列之间添加Gly-Ser-Gly接头。此外,将对Bxb1重组酶具有特异性的attB序列与无启动子抗性基因融合,所述无启动子抗性基因只有在正确的基因靶向在受体位点中发生时才能表达。启动子和抗性两者均是即插即用的,并且可以针对多顺反子载体的所需配置进行交换。

通过用含有与TagBFP融合的H2B和与Venus融合的线粒体靶向序列(MTS)的多顺反子载体瞬时转染具有即插即用AASV1受体位点的iPSC来测试WTC iPSC细胞中的报告物定位(图1A)。通过显微术来评估定位(图1B),从而证明从多顺反子载体表达的蛋白质是功能性的。

使用携带TagBFP的另一种多顺反子载体来测试在iPSC中的重组。将此测试载体与表达Bxb1重组酶的载体共转染到受体细胞系中,并且优化转染条件以便产生可用作测定开发和疾病建模的基础的稳定报告细胞系。在HEK293细胞中,所采用的Bxb1重组酶的重组率为1/10

将受体位点进一步优化为更小且适应性更强。如图1D中所说明,更新的受体位点包括1)一个额外的

使用已建立的Cas9介导的基因组编辑方案将经优化的受体位点稳定地整合到WTC和NCRM5 hiPSC基因组内的整合位点中(图1E)。关于受体位点设计,根据受体位点的设计,将安全港AAVS1基因座用作整合位点。合成受体位点并且将其克隆到AAVS1-供体载体(GeneCopoeia)中,并且用Cas9:sgRNA(AAVS1)(一种指导RNA(gRNA),与目的AAVS1序列互补)共转染,从而在单一整合位点(即位于19号染色体的PPP1R12C基因座的外显子1与2之间的AAVS1基因座)处得到稳定的整合。转染和稳定整合是使用RNA指导的Cas9-CRISPR介导的基因组编辑,然后用嘌呤霉素进行抗生素选择来完成的。在克隆细胞生长之后,使用2次连接PCR来鉴定受体位点的单等位基因整合。第二对引物从发生整合的等位基因中扩增PCR产物。具有单等位基因整合的克隆细胞对于两次PCR均应当呈现出扩增。接下来,为了确定在正确位点处的拷贝数整合,利用针对mCherry和嘌呤霉素基因的2种特异性探针进行微滴式数字PCR(ddPCR),仅针对两个基因均0.8

表1

实施例2-具有谱系特异性荧光报告物的多色iPSC衍生心肌细胞

为了扩大iPSC系特异性,用包括针对不同的心血管细胞谱系的组织特异性启动子的载体工程化iPSC受体系。

为了扩大iPSC心脏系特异性和应用,将一组3种谱系特异性报告物工程化以区分心房、心室和结心肌细胞(CM)谱系(图2A)。为了实现CM-谱系条形编码,选择对每种CM谱系具有高度特异性的启动子(表2)。肌球蛋白轻链2v(MCL2v)仅在心室中表达(Chen等人,JBiol Chem.273(2):1252-6(1998)),在心室中其有助于肌节的形成并增加次最大Ca

表2

对于CM谱系的功能性评价,每种载体由谱系特异性启动子驱动并携带H2B独特荧光团作为谱系条形码(图2B)。对于CM谱系的结构性评价,每种载体携带谱系条形码(H2B-荧光团)以及辅肌动蛋白和线粒体报告物。

开发了三种载体设计版本:(1)CM-1-载体,其中功能性或结构性报告物由CM谱系特异性启动子驱动,这是结构性载体的最小变型;(2)CM-2-载体,其中CM谱系特异性启动子驱动Tet

将由组成型启动子CAG(图3A)或由每一种谱系特异性启动子(图3B)驱动的CM-结构性-1载体在hiPSC衍生CM中转染,并且观察以下标记中每一种的表达和定位:细胞核(H2B)、线粒体(MTS)和a-辅肌动蛋白。

由Tet

在tTA-TRE的转录控制下,由CM-谱系特异性启动子(MLC2v、SHOX2、SLN2)驱动的CM-结构性-2报告物导致以下3种标记的表达:细胞核(H2B)、线粒体(MTS)和a-辅肌动蛋白(图5)。使用此系统,与没有tTA-TRE的相同报吿物相比,表达水平和表达细胞数量均有提高。

使用基于经典Wnt信号传导的时间调节的标准方案的改编版本来指导iPSC CM分化(Lian X,Proc.Natl.Acad.Sci.U S A.7月3日;109(27)(2012))。所分化的细胞自发搏动和聚集,并且免疫荧光的成像显示了心肌细胞相关蛋白α-辅肌动蛋白和心肌肌钙蛋白T的表达以及搏动表型。(图6A)。使用流式细胞术进一步定量培养物中iPSC衍生心肌细胞的百分比显示,WTC和NCRM-5iPSC系制备物分别含有42.7%和53.6%的针对心脏标记(肌钙蛋白T)标记为阳性的细胞(图6B)。进一步地,使用基于心肌细胞与非心肌细胞之间葡萄糖和乳酸代谢的生化差异的心肌细胞纯化方法,实现了回收心肌细胞的百分比的增加。此方法导致回收>75%心肌细胞。所分化的培养物包含不同比率的3种CM谱系。

为了确认条形码谱系身份,使用内源谱系特异性标记的免疫荧光染色和流式细胞术来针对以下进行在启动子驱动的条形码表达与内源标记的表达之间的相关性分析:1)相应谱系(例如比较心室条形码表达和内源心室MCL2同种型的免疫标记;以及2)其他谱系(例如比较心室荧光条形码表达与内源MCL2a和HCN4通道蛋白的免疫标记,所述通道蛋白分别对心房样和结样细胞具有特异性)。通过定量以下来评估每个荧光条形码的性能:条形码效率-针对相应谱系的内源标记正确免疫标记的谱系条形码化细胞的比例;条形码特异性-不表达其他谱系的内源标记的谱系条形码化细胞的比例;以及条形码准确度-通过相应内源免疫标记正确鉴定并且不表达其他细胞谱系的内源标记的谱系条形码化细胞的比例。

心脏毒性测定在药物开发过程中早期探测化合物的心脏易感性。心脏毒性测定并入了功能性毒性(心肌细胞机械功能的改变)和结构性毒性(对心肌细胞的形态学损伤、对细胞内细胞器的改变和心肌细胞活力的丧失)两者,从而提供了对新的和现有的化学实体的心脏易感性的全面且有效的评估。心脏毒性测定既具有检测通过工业标准临床前测定检测出的心脏毒性易感性(真阳性)的能力,又具有检测在临床中鉴定出但通过现有临床前测定未检测出的心脏毒性易感性(假阴性)的能力。更重要的是,确定谱系特异性心脏毒性的能力将通过允许谱系指纹分析来大大改善所述测定的能力。

展示这些能力将为临床前心脏安全性评估团体提供一种高效、有成本效益的体外筛选工具,所述体外筛选工具将与目前在本领域中使用的广泛接受的电生理学和多电极阵列方法互补。心脏毒性测定大大改善了临床前安全性测试预测临床心脏毒性的能力,从而允许在制药工业中广泛采用此测定。

使用所述测定来使用具有已知心脏毒性的化合物检测通过工业标准临床前测定检测到的心脏毒性,包括离子通道堵塞、线粒体毒性、心律失常、纤维化等。例如,可以将来自Enzo的

可以将iPSC衍生的条形码化CM谱系细胞进一步用于预测通过工业标准临床前测定未预测到的临床心脏毒性。使用已经显示出在临床前测试中未鉴定出的临床心脏安全性信号的化合物,例如用于治疗炎性病症的COX-2抑制剂罗非昔布(Vioxx)(在2004年)和用于肠易激综合征中的5-羟色胺4受体激动剂替加色罗(Zelnorm/Zelmac)(在2007年)。此化合物子组展示出所述测定的敏感性和预测能力。

可以将所述测定类似地用于检测组合疗法(即用于治疗癌症的细胞毒性剂和靶向疗法)的心脏毒性。单独测试开发中的靶向肿瘤疗法的毒性(Hasinoff等人,Toxicol.Appl.Pharmacol.249,132-139(2010);Force等人,Nat.Rev.Drug Discov.10,111-126(2011)),因此需要新的和预测性的临床前方法来筛选组合疗法。在所述测定中分别和组合测试一组化学治疗性化合物(例如蒽环霉素类化学治疗剂如多柔比星、柔红霉素和表柔比星)和靶向化合物(例如针对HER2的单克隆抗体曲妥珠单抗),以揭示与组合疗法相关的增加的毒性。

为了进行所述测定,将3种CM谱系合并在一起,并且铺板在384孔板中。用于结构性测定的图像采集包括在24h内采集4个通道(3个荧光通道和相衬)。将所述测定在未分化的报告hiPSC中平行运行,所述报告hiPSC表达与其对应CM-谱系特异性报告细胞相同的细胞器标记。这允许将一般细胞毒性与心脏毒性区分开来,并且进一步允许检测由荧光标记蛋白的外源表达引起的任何可能的光毒性。将所收集的数据分为标记的-当已知毒性机制影响相关表型标记时;以及未标记的-当毒性机制尚未与任何表型标记改变相关时。

在心脏毒性测定期间和/或之后,对许多结构性和功能性读出进行评价。示例性读出汇总于表3中。

表3

对CM细胞的所得结构特性进行评价。示例性特性包括对心肌细胞的形态学损伤、对细胞内细胞器的改变或心肌细胞活力的丧失。将已知扰动心肌细胞结构的化合物,例如多柔比星(心肌细胞的细胞凋亡诱导(Minotti等人,Pharmacol.Rev.56,185-229(2004)))、舒尼替尼(线粒体毒性(Chu等人,Lancet 370,2011-2019(2007)))和胺碘酮(线粒体毒性(Deres等人,J.Cardiovasc.Pharmacol.45,36-43(2005)))用作阳性对照。

还对CM细胞的所得功能特性进行评价。示例性特性包括同步节律性搏动的改变以作为评价心脏特异性功能的表型。将已知扰动心肌细胞功能的化合物,如心律失常,例如西沙必利(hERG抑制剂)、硝苯地平(Ca

利用使用视频显微术对心肌细胞收缩力的快速图像数据采集来评价细胞的功能特性。使用对图像序列的运动分析来通过鉴定由于心肌细胞收缩和舒张而引起的图像强度的变化来捕获和定量心肌细胞的生物力学搏动。算法设计是通过以下事实来指导的:它可以在不需要任何参数调整的情况下对不同的组织类型起作用,并且数据驱动的方法避免了使用特定的细胞分割算法。示例性搏动分析流水线由一系列步骤组成,所述步骤如:(1)图像序列的逐块分割,(2)基于信号相关性对搏动信号的提取,(3)搏动信号的定量,(4)异常值去除,以及(5)基于荧光谱系条形编码对搏动信号的聚类(Maddah等人,Stem cellreports 4,621-31(2015))。在具有示例性特征的显微镜上进行细胞搏动检测,所述示例性特征如:保持温度和CO

将视频分析软件用于在将hiPSC-CM谱系报告细胞暴露于在搏动频率和周期性方面具有影响的已知化合物((例如西沙必利(hERG抑制剂)、硝苯地平(Ca

实施例3-利用神经-Tox构建体的单一受体位点

用包括针对不同的神经元细胞谱系的组织特异性启动子的载体工程化iPSC受体系。将一组4种谱系特异性报告物工程化以将神经元细胞区分为以下谱系:GABA能、多巴胺能、谷氨酸能和星形胶质细胞(图7A)。为了实现神经谱系特异性,基于具有证明的谱系特异性的较小截短物或嵌合体的可用性选择4种启动子,以允许减轻与大载体构建体组装相关的潜在困难(图7B)。

神经谱系特异性载体由谱系特异性启动子驱动并携带作为谱系条形码起作用的H2B独特荧光团(图7B)。载体设计还包括与报告物融合的光谱不同的荧光蛋白,从而使得能够可视化hiPSC衍生神经细胞中的线粒体和质膜。用于产生功能性神经谱系特异性载体的三种示例性策略是:(1)NP-Tox1,其通过Tet

使用标准方案来使iPSC分化为神经谱系。例如,分化方案基于产生神经元和星形胶质细胞两者的共同祖细胞(Shi Y等人,Nat Protoc.,7(10):1836-46(2012))。多巴胺能、Gaba能和谷氨酸能神经元细胞使用已建立的方案产生(参见例如,Hong等人,J Neurochem,104(2):316-324(2008);Maroof等人,Cell Stem Cell,12(5):55-72(2013);和Yap等人,Stem Cells Int.2015)。使用免疫荧光和流式细胞术来针对以下进行在启动子驱动的条形码表达与内源标记的表达之间的相关性分析来确认条形码谱系身份:(1)相应谱系(例如比较多巴胺能条形码表达和内源TH蛋白的免疫标记);以及(2)其他谱系(例如比较多巴胺能荧光条形码表达与内源vGAT、vGluT和CD44蛋白的免疫标记,所述蛋白分别对GABA能神经元、谷氨酸能神经元和星形胶质细胞具有特异性)。使用这些分析,定量以下参数:条形码准确度—表达相应内源谱系特异性标记的谱系条形码化细胞的百分比,条形码效率—表达谱系特异性内源标记且也表达相应谱系条形码的细胞的百分比,以及条形码特异性—不表达其他细胞谱系的内源标记的谱系条形码化细胞的百分比。

神经毒性测定是具有表征可能对神经系统产生不利影响的化合物的活性的潜力的筛选测定。使用基于iPSC衍生神经细胞的表型谱分析的体外高通量神经毒性定量测定来确定化合物的有效毒性浓度,并且比较不同化合物的影响。神经毒性测定不限于测试候选药物,它还允许测试任何具有未知神经毒性的化合物,包括环境剂、杀虫剂、化妆品、食品添加剂和膳食补充剂。这些类型的化合物中有许多很少被测试,并且所述测定既提供了用于评估其安全性的稳健体外测定,又使得能够测试在单独检查时可能不会引起反应的化合物和药物的组合。由于神经系统障碍的患病率渐增和大量未测试的化合物,迫切需要开发用于鉴定神经毒剂的一种高效且可靠的工具。

使用一批化合物来验证神经毒性测定(表4):a)读出特异性评估组-此组化合物用于评价读出测量的技术性能、表征读出反应并建立动态反应范围,并且含有对目标读出具有稳健影响的化合物;b)训练组-此组化合物用于(1)检测先前已经通过使用神经突生长作为读出的测定鉴定出的神经毒性;(2)通过比较神经细胞与非神经细胞(未分化报告hiPSC)对同一组化学品的读出反应来鉴别一般毒性反应和特异性神经毒性效应,并且建立神经细胞与非神经细胞之间的剂量-反应曲线;(3)确定谱系特异性测定敏感性;(4)确定测定敏感性(正确鉴定为具有神经毒性的化合物的比例)和特异性(正确鉴定为没有神经毒性的化合物的比例);以及c)测试组-此组化合物用于鉴定通过目前测定未预测到的神经毒性的其他方面和具有未知神经毒性潜力的化合物(如阻燃剂和多环芳族烃)。

表4

通过在单一孔中混合所分化的细胞以通过显微术来监测不同报告物的表达来成像条形码化神经细胞的异质群体。为了比较hiPSC衍生神经报告细胞谱系对非神经细胞的敏感性,将未分化的报告hiPSC用同一组化合物平行处理。在读出特异性对照组的化合物的存在下采集图像,并且将这些数据用于:(1)建立包括基于条形码的神经谱系鉴定的图像处理流水线,(2)表征反应读出,(3)比较hiPSC与神经谱系特异性反应阈值,以及(4)区分一般细胞毒性与神经毒性。

图像处理实施了定位细胞核的分割算法。将此算法应用于每种神经细胞谱系(如通过其独特条形码所鉴定的)使得能够从神经细胞的混合群体中鉴定和表征目的谱系。诸如NeuriteQuant和NeuriteIQ等程序适用于分割另外的特征,如神经突和神经元细胞形状。使用单一自动细胞分割和特征提取流水线来使用各种读出表征细胞参数。示例性细胞参数和读出(特征)示出于表5中。

表5

实施例4

将基因组编辑工具优化以产生含有两个“受体位点”的单克隆细胞系。

一种具有即插即用元件的受体位点平台含有:1)用于将受体位点的整合指导至目的基因组基因座的两个序列,2)CAG组成型启动子(其在hiPSC中稳定表达),3)在不同框中的2个替代性ATG,4)用于通过PhiC31进入重组的attP位点、用于通过BxB1进入重组的attP位点,5)与抗性基因融合的无ATG荧光标记,以及6)选择的启动子和荧光标记(例如,GFP)或与选择的启动子和荧光标记(GFP)缔合的杀伤基因或细胞毒性基因(例如,HSV-TK或DTA)或与位于基因组基因座右同源臂之后的启动子缔合的杀伤基因(HSV-TK或DTA),如图8中所示。

在双系统中,每个受体位点具有不同的基因组靶向基因座、不同的荧光团和选择标记(以允许选择)以及不同的attP位点以用于报告平台的特异性整合。总之,它允许选择1)整合基因座;2)用于报告构建体的重组的整合酶;以及3)荧光团和选择标记和荧光团。

用于靶向的示例性基因组基因座是AAVS1和H11基因座。hiPSC上用于受体位点基因组整合的AAVS1基因座描述于实施例1中。已经显示H11基因座是用于多种多样的基因组编辑目的的优异基因座。鼠类Hipp11基因座首先由Hippenmeyer等人描述,并且进一步针对整合酶介导的转基因(Tasic等人,Proc.Natl.Acad.Sci.U.S.A.108,7902-7(2011))和人干细胞(Zhu等人,Nucleic Acids Res.42,e34-e34(2014))在小鼠中进行验证。直系同源人H11基因座位于染色体22q12.2上的基因间区。H11基因座不含有任何启动子,从而允许目的基因在其自身的启动子(例如组织特异性启动子)下表达以在该组织中特异性地表达转基因。证明在人胚胎干细胞(hES)和hiPSC中人H11(hH11)基因座处的转基因表达是稳健且普遍存在的。H11处的靶向效率比通常报道的频率高,并且提示有开放染色质(Zhu等人,Nucleic Acids Res.42,e34-e34(2014))。另外,放置在H11基因座处的转基因在30多次传代中活跃且如实地表达而没有表观沉默。

使用具有互相排斥的att识别位点和高度特异性的两种不同的整合酶(Grindley等人,Annu.Rev.Biochem.75,567-605(2006))来产生双受体位点细胞系,从而导致以确定的取向和拷贝数插入到独特基因组位点中。平台中引入的两个替代性attP位点对Bxb1和PhiC31丝氨酸重组酶具有特异性。已经显示Bxb1具有高效率,并且也已经显示PhiC31具有高重组率(Xu等人,BMC Biotechnol.13,87(2013);Thyagarajan等人,Mol.Cell Biol.21,3926-3934(2001))。在attP位点的上游有在不同框中的2个ATG,其允许一旦它们中的一个被去除就转录与抗性标记融合的荧光标记。它进一步允许一旦与报告物发生整合就关闭荧光团和抗性标记的表达。

为了证实受体位点的成功整合,它还含有定位在同源重组区下游的由CMV、PGK或CAG启动子驱动的GFP基因,从而使得能够在随机整合与靶向整合之间迅速区分。具有随机整合的重新设计的受体位点的细胞会发出绿色荧光。具有整合的重新设计的受体位点(靶向或随机整合)的细胞由于mCherry或TagBFP的表达而发出红色或蓝色荧光。因此,具有靶向整合的细胞将仅是红色或蓝色的,而具有任意随机整合的细胞也将表达GFP并且是红色和绿色或红色和蓝色的。此方法允许使用荧光显微术来鉴定没有随机整合的细胞,或使用FACS来分选没有重组的细胞,并且不必进行DNA印迹筛选。

可替代地,将阴性选择标记如单纯疱疹病毒-胸苷激酶(HSV-TK)基因(Czako M,Marton L,Plant Physiol.1994年3月;104(3):1076-71)或白喉毒素A(DT-A)(Yagi T等人,Anal Biochem,1993年10月;214(1):77-86)定位在同源重组区之外,并且由组成型启动子(CMV、PGK或CAG)表达。将不把阴性选择标记(在本实施例中为HSV-TK)掺入已经适当经历同源重组的细胞中的靶DNA中,从而允许丙氧鸟苷抗性(在HSV-TK的情况下)或由DT-A表达的白喉毒素被用于针对通过HR以外的机制发生的重组事件进行选择。

具有双受体位点的细胞系通过表达2种不同的荧光团(mCherry和TagBFP)来区分,并且使用不同的抗生素(嘌呤霉素和吉欧霉素)来选择。

将双受体细胞系工程化为重组了两种不同的报告物,如两种神经谱系特异性报告物或两种CM-谱系特异性报告物。每种报告载体具有多达三个荧光标记的转基因,这导致产生具有多达六种荧光标记的报告物的双报告细胞系。由于报告物是谱系依赖性的,因此它们表达由针对每种所分化的细胞系的相应谱系启动子指导的三种报告物。

将双受体细胞系工程化为在一个基因座中重组了一种多色报告物,并且在另一个基因座中重组了Tet-开诱导型Cas9蛋白。所产生的细胞系可以单独地或合并地用于sgRNA文库筛选和验证。

产生具有针对CM-条形码谱系的双受体位点的hiPSC允许在同一细胞系中表达两种不同的谱系特异性报告物,从而使经标记的细胞/谱系的数量最大化。用于hiPSC的心脏分化的许多方案产生CM的异质合并物,其中心室:心房:结样细胞的比率不同,总是主要由心室样细胞(34%-93%)组成,具有较小百分比的心房样细胞(2%-60%)和结样细胞(<1%-20%)(Blazeski等人,Prog.Biophys.Mol.Biol.110,166-77(2012))。这是由于在分化方案和在将CM谱系在实验室之间分类的方式两个方面的差异。这意味着对于每种单一谱系祖细胞,表达条形码并因此可用于分析的细胞数量潜在地相当低。利用双受体位点hiPSC系,心室与结和心房与结报告物可以在同一细胞系中表达,从而导致在合并测定中表达每种谱系条形码的细胞的比率更均匀。例如,同一亲代细胞可以表达具有TagBFP标记细胞核的心室心肌细胞和具有mCherry标记细胞核的结样细胞。另一种细胞系可以表达具有Venus标记细胞核的心房样细胞和具有mCherry标记细胞核的结样细胞。因此,来自两种细胞系的所有结样细胞将被mCherry标记,而心肌细胞和心房样细胞将只在衍生自一种细胞系的细胞中被标记。使用此策略,经标记的结细胞的数量相对于其他细胞类型有所增加,并且每次测定需要复用较少的细胞系。

产生具有针对神经-条形码谱系的双受体位点的hiPSC类似地允许在同一细胞系中表达两种不同的谱系特异性报告物,从而实现用于将神经细胞类型区分为不同谱系的富集方案的改善。

通过产生双受体位点细胞系引入的改善也增加了报告物设计的灵活性,从而允许插入更大的报告载体。

相关技术
  • 干细胞衍生谱系条形编码
  • 衍生自多能干细胞的肝细胞谱系细胞
技术分类

06120113171377