掌桥专利:专业的专利平台
掌桥专利
首页

使用糖类结合试剂和膜透过性试剂进行样品多重化

文献发布时间:2023-06-19 11:14:36


使用糖类结合试剂和膜透过性试剂进行样品多重化

相关申请

本申请根据35U.S.C.§119(e)要求2018年8月28日提交的美国临时专利申请序号62/723,958的权益,为了所有目的将该相关申请的内容通过引用以其整体并入本文。

对序列表的引用

本申请与电子格式的序列表一起提交。序列表被提供为题为SequenceListing.txt的文件,创建于2019年8月21日,大小是4千字节。将电子格式的序列表的信息通过引用以其整体并入本文。

背景

本公开内容总体上涉及分子生物学领域,例如使用分子条形码化来鉴定不同样品的细胞并确定细胞中的蛋白表达谱。

当前的技术允许通过随着每个细胞与皮升微孔中的条形码化试剂珠共定位,将细胞特异性寡核苷酸条形码与来自个体细胞的聚(A)mRNA分子附接,以大规模并行方式(例如,>10000个细胞)确定单细胞的基因表达谱。每个样品用于分析的单细胞的数目(例如,多于1000个细胞)可能低于当前技术中用于测量单细胞的基因表达的大规模并行容量。对能够实现将来自不同样品的细胞汇集以提高对当前单细胞技术的容量的利用的方法和系统存在需求。

概述

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,每一个细胞包含一种或更多种细胞表面糖类靶,其中样品索引组合物包含与样品索引寡核苷酸缔合的糖类结合试剂,其中糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,每一个细胞包含一种或更多种细胞表面糖类靶,其中样品索引组合物包含与样品索引寡核苷酸缔合的糖类结合试剂,其中糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;并且基于多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一个条形码将多于一种样品索引组合物中的样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于测序数据中多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,鉴定至少一个细胞的样品来源包括鉴定多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸;获得多于一个复制的样品索引寡核苷酸的测序数据;并且基于测序数据中对应于至少一个条形码化样品索引寡核苷酸的多于一个样品索引寡核苷酸的复制的样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,将复制衔接子与至少一个条形码化样品索引寡核苷酸连接,并且其中复制至少一个条形码化样品索引寡核苷酸包括使用与至少一个条形码化样品索引寡核苷酸连接的复制衔接子复制至少一个条形码化样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,使捕获探针与至少一个样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;并且将与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针缔合的样品索引寡核苷酸,并且其中复制至少一个样品索引寡核苷酸包括复制与捕获探针缔合的样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

在一些实施方案中,样品索引序列的长度是6-60个核苷酸。样品索引寡核苷酸的长度是50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与糖类结合试剂附接。样品索引寡核苷酸可以与糖类结合试剂共价地附接。样品索引寡核苷酸可以与糖类结合试剂缀合。样品索引寡核苷酸可以与糖类结合试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与糖类结合试剂非共价地附接。样品索引寡核苷酸可以与糖类结合试剂通过接头缔合。

在一些实施方案中,一种或更多种细胞表面糖类靶中的至少一种在细胞表面上。在一些实施方案中,该方法包括裂解来自多于一个样品的每一个中的一个或更多个细胞。

在一些实施方案中,该方法包括去除多于一种样品索引组合物中未结合的样品索引组合物。去除未结合的样品索引组合物可以包括用洗涤缓冲液洗涤来自多于一个样品的每一个中的一个或更多个细胞。去除未结合的样品索引组合物可以包括使用流式细胞术选择与至少一种糖类结合试剂结合的细胞。

在一些实施方案中,多于一个样品中的样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。多于一个样品可以包括哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。

在一些实施方案中,样品索引寡核苷酸可以被配置为不可从糖类结合试剂解离。样品索引寡核苷酸可以被配置为可从糖类结合试剂解离。该方法可以包括使样品索引寡核苷酸从糖类结合试剂解离。使样品索引寡核苷酸解离可以包括通过可UV光裂解、化学处理、加热、酶处理或其任何组合使样品索引寡核苷酸从糖类结合试剂解离。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源,与物种的基因组序列同源,或其组合。该物种可以是非哺乳动物物种。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列(alignment sequence)。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。样品索引寡核苷酸可以包含分子标记序列、通用引物的结合位点或两者。分子标记序列的长度可以是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,糖类结合试剂包括糖类结合蛋白。糖类结合蛋白可以包括凝集素。凝集素包括甘露糖结合凝集素、半乳糖结合凝集素、N-乙酰半乳糖胺结合凝集素、N-乙酰葡萄糖胺结合凝集素、N-乙酰神经氨酸结合凝集素、岩藻糖结合凝集素或其组合。凝集素可以包括伴刀豆球蛋白A(ConA)、扁豆凝集素(LCH)、雪花莲(Snowdrop)凝集素(GNA)、蓖麻凝蛋白(RCA)、花生凝集蛋白(PNA)、波罗蜜凝集素(Jacalin,AIL)、毛叶苕子凝集素(VVL)、麦胚凝集蛋白(WGA)、接骨木凝集素(SNA)、朝鲜槐白细胞凝集素(MAL)、朝鲜槐血凝素(MAH)、荆豆凝集蛋白(UEA)、橙黄网孢盘菌凝集素(AAL)或其组合。凝集素(lectin)可以是凝集蛋白(agglutinin)。凝集蛋白可以是麦胚凝集蛋白(WGA)。糖类结合蛋白可以来自或来源于动物、细菌、病毒或真菌。糖类结合蛋白可以来自或来源于植物。植物可以是直生刀豆(Canavalia ensiformis)、兵豆(Lens culinaris)、雪花莲(Galanthus nivalis)、蓖麻(Ricinus communis)、落花生(Arachis hypogaea)、波罗蜜(Artocarpus integrifolia)、毛叶苕子(Vicia villosa)、普通小麦(Triticum vulgaris)、西洋接骨木(Sambucusnigra)、朝鲜槐(Maackia amurensis)、荆豆(Ulex europaeus)、橙黄网孢盘菌(Aleuriaaurantia)或其组合。

在一些实施方案中,细胞表面糖类靶包括糖、寡糖、多糖、其衍生物或其组合。细胞表面糖类靶可以包括单糖、二糖、多元醇、麦芽寡糖、非麦芽寡糖、淀粉、非淀粉多糖、其衍生物或其组合。细胞表面糖类靶可以包括葡萄糖、半乳糖、果糖、木糖、蔗糖、乳糖、麦芽糖、海藻糖、山梨醇、甘露醇、麦芽糖糊精、棉子糖、水苏糖、果寡糖、直链淀粉、支链淀粉、改性淀粉、糖原、纤维素、半纤维素、果胶、水胶体、其衍生物或其组合。细胞表面糖类靶可以包括α-D-甘露糖基残基、α-D-葡糖基残基、高α-甘露糖型支链α-甘露糖苷结构、混合型和二分支复合型N-聚糖的支链α-甘露糖苷结构、二分支和三分支复合型N-聚糖的岩藻糖基化核心区、α1-3和α1-6连接的高甘露糖结构、Galβ1-4GalNAcβ1-R、Galβ1-3GalNAcα1-Ser/Thr、(Sia)Galβ1-3GalNAcα1-Ser/Thr、GalNAcα-Ser/Thr、GlcNAcβ1-4GlcNAcβ1-4GlcNAc、Neu5Ac(唾液酸)、Neu5Acα2-6Gal(NAc)-R、Neu5Ac/Gcα2,3Galβ1,4Glc(NAc)、Neu5Ac/Gcα2,3Galβ1,3(Neu5Acα2,6)GalNac、Fucα1-2Gal-R、Fucα1-2Galβ1-4(Fucα1-3/4)Galβ1-4GlcNAc、R2-GlcNAcβ1-4(Fucα1-6)GlcNAc-R1、其衍生物或其组合。细胞表面糖类靶可以包括糖蛋白、糖脂或其组合。细胞表面糖类靶可以包括糖类、脂质、蛋白、胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、胞内蛋白或其任何组合。

在一些实施方案中,细胞表面糖类靶选自包括10-100种不同细胞表面糖类靶的组。

在一些实施方案中,糖类结合试剂可以与具有相同序列的两个或更多个样品索引寡核苷酸缔合。糖类结合试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。

在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含未与样品索引寡核苷酸缔合的第二糖类结合试剂。糖类结合试剂和第二糖类结合试剂可以是相同的(例如,在结构和/或序列上)。

在一些实施方案中,多于一种样品索引组合物中的每一种包含糖类结合试剂。

在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合的第二糖类结合剂。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的同一种细胞表面糖类靶结合,并且其中第二糖类结合试剂未与样品索引寡核苷酸缔合。第二糖类结合试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且其中样品索引序列和第二样品索引序列是不相同的。糖类结合试剂和第二糖类结合试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。糖类结合试剂和第二糖类结合试剂可以是相同的(例如,在结构和/或序列上)。糖类结合试剂和第二糖类结合试剂可以是不同的(例如,在序列和/或结构上)。糖类结合试剂和第二糖类结合试剂可以能够与同一种细胞表面糖类靶的不同区域结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的不同细胞表面糖类靶结合。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

在一些实施方案中,该方法可以包括:在将样品索引寡核苷酸条形码化之前,将与多于一种样品索引组合物接触的多于一个样品汇集。

在一些实施方案中,多于一个条形码中的条形码包含靶结合区和分子标记序列,并且多于一个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可以包含聚(dT)区。

在一些实施方案中,多于一个条形码与颗粒缔合。多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被封闭在颗粒中、被部分封闭在颗粒中或其组合。颗粒是可破坏的。颗粒可以包括珠。颗粒可以包括Sepharose珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、水凝胶珠、抗生物素微珠、抗荧光染料微珠或其任何组合,或者其中颗粒包括选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、sepharose、纤维素、尼龙、硅酮及其任何组合。颗粒可以包括可破坏的水凝胶珠。

在一些实施方案中,颗粒的条形码可以包括选自至少1000种、10000种不同的分子标记序列或其组合的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包括至少10000种条形码。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括,在将与样品索引寡核苷酸杂交的条形码延伸之前,将与样品索引寡核苷酸杂交的条形码汇集,并且其中将与样品索引寡核苷酸杂交的条形码延伸包括将所汇集的与样品索引寡核苷酸杂交的条形码延伸以产生多于一个汇集的条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化样品索引寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多于一个条形码化样品索引寡核苷酸的测序数据可以包括获得多于一个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶,其中多于一个条形码中的每一个包含细胞标记序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得条形码化靶的测序数据。使用多于一个条形码将多于一个靶条形码化以产生多于一个条形码化靶可以包括:使靶的拷贝与条形码的靶结合区接触;并且使用多于一个条形码逆转录多于一个靶以产生多于一个逆转录的靶。该方法可以包括:在获得多于一个条形码化靶的测序数据之前,扩增条形码化靶以产生多于一个扩增的条形码化靶。扩增条形码化靶以产生多于一个扩增的条形码化靶可以包括:通过聚合酶链式反应(PCR)扩增条形码化靶。使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶可以包括:使用多于一个随机条形码将细胞的多于一个靶随机条形码化以产生多于一个随机条形码化靶。

本文公开了包括多于一种样品索引组合物的实施方案。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的糖类结合试剂,糖类结合试剂能够与至少一种细胞表面糖类靶特异性结合,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

在一些实施方案中,样品索引序列的长度是6-60个核苷酸。样品索引寡核苷酸的长度可以是50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与糖类结合试剂附接。样品索引寡核苷酸可以与糖类结合试剂共价地附接。样品索引寡核苷酸可以与糖类结合试剂缀合。样品索引寡核苷酸可以与糖类结合试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与糖类结合试剂非共价地附接。样品索引寡核苷酸可以与糖类结合试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源。多于一个样品中的至少一个样品可以包括一个或更多个单细胞、多于一个细胞、组织、肿瘤样品或其任何组合。样品可以包括哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。

在一些实施方案中,样品索引寡核苷酸包含分子标记序列、聚(dA)区或其组合。分子标记序列的长度是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,糖类结合试剂包括糖类结合蛋白。糖类结合蛋白可以包括凝集素。凝集素可以包括甘露糖结合凝集素、半乳糖结合凝集素、N-乙酰半乳糖胺结合凝集素、N-乙酰葡萄糖胺结合凝集素、N-乙酰神经氨酸结合凝集素、岩藻糖结合凝集素或其组合。凝集素可以包括伴刀豆球蛋白A(ConA)、扁豆凝集素(LCH)、雪花莲凝集素(GNA)、蓖麻凝蛋白(RCA)、花生凝集蛋白(PNA)、波罗蜜凝集素(AIL)、毛叶苕子凝集素(VVL)、麦胚凝集蛋白(WGA)、接骨木凝集素(SNA)、朝鲜槐白细胞凝集素(MAL)、朝鲜槐血凝素(MAH)、荆豆凝集蛋白(UEA)、橙黄网孢盘菌凝集素(AAL)或其组合。凝集素可以是凝集蛋白。凝集蛋白可以是麦胚凝集蛋白(WGA)。糖类结合蛋白可以来自或来源于动物、细菌、病毒或真菌。糖类结合蛋白可以来自或来源于植物。植物可以是直生刀豆、兵豆、雪花莲、蓖麻、落花生、波罗蜜、毛叶苕子、普通小麦、西洋接骨木、朝鲜槐、荆豆、橙黄网孢盘菌或其组合。

在一些实施方案中,细胞表面糖类靶包括糖、寡糖、多糖、其衍生物或其组合。细胞表面糖类靶可以包括单糖、二糖、多元醇、麦芽寡糖、非麦芽寡糖、淀粉、非淀粉多糖、其衍生物或其组合。细胞表面糖类靶可以包括葡萄糖、半乳糖、果糖、木糖、蔗糖、乳糖、麦芽糖、海藻糖、山梨醇、甘露醇、麦芽糖糊精、棉子糖、水苏糖、果寡糖、直链淀粉、支链淀粉、改性淀粉、糖原、纤维素、半纤维素、果胶、水胶体、其衍生物或其组合。细胞表面糖类靶可以包括α-D-甘露糖基残基、α-D-葡糖基残基、高α-甘露糖型支链α-甘露糖苷结构、混合型和二分支复合型N-聚糖的支链α-甘露糖苷结构、二分支和三分支复合型N-聚糖的岩藻糖基化核心区、α1-3和α1-6连接的高甘露糖结构、Galβ1-4GalNAcβ1-R、Galβ1-3GalNAcα1-Ser/Thr、(Sia)Galβ1-3GalNAcα1-Ser/Thr、GalNAcα-Ser/Thr、GlcNAcβ1-4GlcNAcβ1-4GlcNAc、Neu5Ac(唾液酸)、Neu5Acα2-6Gal(NAc)-R、Neu5Ac/Gcα2,3Galβ1,4Glc(NAc)、Neu5Ac/Gcα2,3Galβ1,3(Neu5Acα2,6)GalNac、Fucα1-2Gal-R、Fucα1-2Galβ1-4(Fucα1-3/4)Galβ1-4GlcNAc、R2-GlcNAcβ1-4(Fucα1-6)GlcNAc-R1、其衍生物或其组合。细胞表面糖类靶可以包括糖蛋白、糖脂或其组合。细胞表面糖类靶可以包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。

在一些实施方案中,细胞表面糖类靶选自包括10-100种不同细胞表面糖类靶的组。

在一些实施方案中,糖类结合试剂与具有相同序列的两个或更多个样品索引寡核苷酸缔合。糖类结合试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。

在一些实施方案中,样品索引组合物包含第二糖类结合试剂,并且其中第二糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的同一种细胞表面糖类靶结合,并且第二糖类结合试剂可以未与样品索引寡核苷酸缔合。第二糖类结合试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且样品索引序列和第二样品索引序列可以是不相同的。糖类结合试剂和第二糖类结合试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。糖类结合试剂和第二糖类结合试剂可以是相同的,例如,在序列和/或结构上。糖类结合试剂和第二糖类结合试剂可以能够与同一种细胞表面糖类靶的不同区域结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的不同细胞表面糖类靶结合。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;并且基于多于一种样品索引组合物的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一个条形码将多于一种样品索引组合物中的样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于测序数据中多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。鉴定至少一个细胞的样品来源可以包括鉴定多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸;获得多于一个复制的样品索引寡核苷酸的测序数据;并且基于测序数据中对应于至少一个条形码化样品索引寡核苷酸的多于一个样品索引寡核苷酸的复制的样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,将复制衔接子与至少一个条形码化样品索引寡核苷酸连接,并且复制至少一个条形码化样品索引寡核苷酸可以包括使用与至少一个条形码化样品索引寡核苷酸连接的复制衔接子复制至少一个条形码化样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,使捕获探针与至少一个样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;并且将与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针缔合的样品索引寡核苷酸,并且复制至少一个样品索引寡核苷酸可以包括复制与捕获探针缔合的样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

在一些实施方案中,样品索引序列的长度是例如6-60个核苷酸。样品索引寡核苷酸的长度可以是例如50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与细胞膜透过性试剂附接。样品索引寡核苷酸可以与细胞膜透过性试剂共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂缀合。样品索引寡核苷酸可以与细胞膜透过性试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与细胞膜透过性试剂非共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂通过接头缔合。

在一些实施方案中,该方法包括:去除多于一种样品索引组合物中未结合的样品索引组合物。去除未结合的样品索引组合物可以包括用洗涤缓冲液洗涤来自多于一个样品的每一个中的一个或更多个细胞。去除未结合的样品索引组合物可以包括使用流式细胞术选择未与至少一种细胞膜透过性试剂接触的细胞。在一些实施方案中,该方法包括裂解来自多于一个样品的每一个中的一个或更多个细胞。

在一些实施方案中,样品索引寡核苷酸被配制为不可从细胞膜透过性试剂解离。样品索引寡核苷酸可以被配置为可从细胞膜透过性试剂解离。该方法可以包括使样品索引寡核苷酸从细胞膜透过性试剂解离。使样品索引寡核苷酸解离可以包括通过可UV光裂解、化学处理、加热、酶处理或其任何组合使样品索引寡核苷酸从细胞膜透过性试剂解离。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源,与物种的基因组序列同源,或其组合。该物种可以是非哺乳动物物种。

在一些实施方案中,多于一个样品中的样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。多于一个样品可以包括哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。样品索引寡核苷酸可以包含分子标记序列、通用引物的结合位点或两者。分子标记序列的长度可以是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,其中细胞膜透过性试剂被内化到一个或更多个细胞中。细胞膜透过性试剂可以通过扩散通过一个或更多个细胞的细胞膜被内化到一个或更多个细胞中。该方法可以包括使一个或更多个细胞的细胞膜透化。使一个或更多个细胞的细胞膜透化包括使用去污剂使一个或更多个细胞的细胞膜透化。细胞膜透过性试剂可以经由一个或更多个细胞的一种或更多种膜转运蛋白被内化到一个或更多个细胞中。

在一些实施方案中,细胞膜透过性试剂包括有机分子、肽、脂质或其组合。有机分子可以包括细胞膜透过性有机分子。有机分子可以包括染料。有机分子可以包括荧光染料。有机分子可以包括环结构。环结构可以包含5-50个碳原子。有机分子可以包括碳链。碳链可以包含5-50个碳原子。有机分子在被内化到一个或更多个细胞中之后可以被转化为第二有机分子。有机分子可以是乙酰氧基甲基钙黄绿素(钙黄绿素AM),并且其中第二有机分子是钙黄绿素。

在一些实施方案中,肽可以包括细胞膜透过性肽。肽的长度可以是5-30个氨基酸。细胞膜透过性试剂可以插入一个或更多个细胞的细胞膜中。细胞膜透过性试剂可以包括脂质。

在一些实施方案中,细胞膜透过性试剂与具有相同序列的两个或更多个样品索引寡核苷酸缔合。细胞膜透过性试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。多于一种样品索引组合物中的每一种可以包含细胞膜透过性试剂。

在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含第二细胞膜透过性试剂。第二细胞膜透过性试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且其中样品索引序列和第二样品索引序列是不相同的。细胞膜透过性试剂和第二细胞膜透过性试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以是相同的(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以是不同的(例如,在序列和/或结构上)。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。在一些实施方案中,该方法包括:在将样品索引寡核苷酸条形码化之前,将与多于一种样品索引组合物接触的多于一个样品汇集。

在一些实施方案中,多于一个条形码中的条形码包含靶结合区和分子标记序列,并且多于一个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可以包含聚(dT)区。

在一些实施方案中,多于一个条形码与颗粒缔合。多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被封闭在颗粒中、被部分封闭在颗粒中或其组合。颗粒可以是可破坏的。颗粒可以包括珠。颗粒可以包括sepharose珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、水凝胶珠、抗生物素微珠、抗荧光染料微珠或其任何组合,或者其中颗粒包括选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、sepharose、纤维素、尼龙、硅酮及其任何组合。颗粒可以包括可破坏的水凝胶珠。

在一些实施方案中,颗粒的条形码可以包括选自至少1000种、10000种不同的分子标记序列或其组合的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包括至少10000种条形码。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:在将与样品索引寡核苷酸杂交的条形码延伸之前,将与样品索引寡核苷酸杂交的条形码汇集,并且其中将与样品索引寡核苷酸杂交的条形码延伸包括将所汇集的与样品索引寡核苷酸杂交的条形码延伸以产生多于一个汇集的条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化样品索引寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多于一个条形码化样品索引寡核苷酸的测序数据可以包括获得多于一个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶,其中多于一个条形码中的每一个包含细胞标记序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得条形码化靶的测序数据。使用多于一个条形码将多于一个靶条形码化以产生多于一个条形码化靶可以包括:使靶的拷贝与条形码的靶结合区接触;并且使用多于一个条形码逆转录多于一个靶以产生多于一个逆转录的靶。该方法可以包括:在获得多于一个条形码化靶的测序数据之前,扩增条形码化靶以产生多于一个扩增的条形码化靶。扩增条形码化靶以产生多于一个扩增的条形码化靶可以包括通过聚合酶链式反应(PCR)扩增条形码化靶。使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶可以包括:使用多于一个随机条形码将细胞的多于一个靶随机条形码化以产生多于一个随机条形码化靶。

本文公开了包括多于一种样品索引组合物。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

在一些实施方案中,样品索引序列的长度是6-60个核苷酸。样品索引寡核苷酸的长度可以是50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与细胞膜透过性试剂附接。样品索引寡核苷酸可以与细胞膜透过性试剂共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂缀合。样品索引寡核苷酸可以与细胞膜透过性试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与细胞膜透过性试剂非共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源。多于一个样品中的至少一个样品可以包括一个或更多个单细胞、多于一个细胞、组织、肿瘤样品或其任何组合。样品可以包括哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。

在一些实施方案中,其中样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸可以包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。样品索引寡核苷酸可以包含分子标记序列、聚(dA)区或其组合。分子标记序列的长度可以是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,其中细胞膜透过性试剂被配置为被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的透化的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的去污剂透化的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为经由一个或更多个细胞的一种或更多种膜转运蛋白被内化到一个或更多个细胞中。

在一些实施方案中,细胞膜透过性试剂包括有机分子、肽、脂质或其组合。有机分子可以包括细胞膜透过性有机分子。有机分子可以包括染料。有机分子可以包括荧光染料。有机分子可以包括环结构。环结构可以包含5-50个碳原子。有机分子可以包括碳链。碳链包含5-50个碳原子。有机分子在被内化到一个或更多个细胞中之后可以被转化为第二有机分子。有机分子可以是乙酰氧基甲基钙黄绿素(钙黄绿素AM),并且其中第二有机分子是钙黄绿素。肽可以包括细胞膜透过性肽。肽的长度可以是5-30个氨基酸。细胞膜透过性试剂可以被配置为插入一个或更多个细胞的细胞膜中。细胞膜透过性试剂可以包括脂质。

在一些实施方案中,细胞膜透过性试剂与具有相同序列的两个或更多个样品索引寡核苷酸缔合。细胞膜透过性试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。

在一些实施方案中,样品索引组合物包括第二细胞膜透过性试剂。第二细胞膜透过性试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且其中样品索引序列和第二样品索引序列是不相同的。细胞膜透过性试剂和第二细胞膜透过性试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以是相同的(例如,在序列和/或结构上)。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

本说明书中描述的主题的一种或更多种实施方式的细节在附图和以下描述中阐述。根据说明书、附图和权利要求书,其他特征、方面和优点将变得明显。本发明概述或以下详细描述均不旨在限定或限制本发明主题的范围。

附图简述

图1示出了非限制性示例性随机条形码。

图2示出了随机条形码化和数字计数的非限制性示例性工作流程。

图3是示出了用于从多于一个靶产生随机条形码化靶的索引文库的非限制性示例性过程的示意图。

图4示出了与包含蛋白结合试剂的独特标识符的寡核苷酸缔合的示例性蛋白结合试剂(此处示出的抗体)的示意图。

图5示出了与包含用于确定细胞来自同一样品或不同样品的样品索引的独特标识符的寡核苷酸缔合的示例性结合试剂(此处示出的抗体)的示意图。

图6示出了使用寡核苷酸缔合的抗体以高通量方式同时确定细胞组分表达(例如,蛋白表达)和基因表达的示例性工作流程的示意图。

图7示出了使用寡核苷酸缔合的抗体进行样品索引化的示例性工作流程的示意图。

图8A-图8B示出了使用寡核苷酸缔合的糖类结合试剂或细胞膜透过性试剂进行样品索引化的示例性工作流程的示意图。

图9示出了非限制性示例性样品索引寡核苷酸。

图10A-图10D示出了用于同时确定蛋白表达和基因表达以及用于样品索引化的寡核苷酸的非限制性示例性设计。

图11示出了用于同时确定蛋白表达和基因表达以及用于样品索引化的非限制性示例性寡核苷酸序列的示意图。

详述

在以下详述中参考了形成本文的一部分的附图。在附图中,除非上下文另外指示,否则相似的符号通常标识相似的组成部分。在详述、附图和权利要求书中描述的说明性实施方案不意味着是限制性的。在不脱离本文提供的主题的精神或范围的情况下,可以利用其他实施方案,并且可以做出其他改变。容易理解的是,如本文一般描述的以及图中说明的本公开内容的方面可以以各种各样不同的配置来布置、替换、组合、分开和设计,所有这些都在本文中明确设想并且构成本文公开内容的一部分。

本文引用的涉及的相关技术的所有专利、公开的专利申请、其他出版物和来自GenBank以及其他数据库的序列通过引用以其整体并入。

对小数目的核酸(例如信使核糖核酸(mRNA)分子)进行定量对于确定例如在不同发育阶段或在不同环境条件下在细胞中表达的基因是临床上重要的。然而,确定核酸分子(例如,mRNA分子)的绝对数目也可以是非常具有挑战性的,特别是当分子数目非常小时。确定样品中分子的绝对数目的一种方法是数字聚合酶链式反应(PCR)。理想地,PCR在每个循环中产生分子的相同拷贝。然而,PCR可具有缺点使得每个分子复制具有随机概率,且此概率根据PCR循环和基因序列而变化,这导致扩增偏差和不准确的基因表达测量。具有独特的分子标记(molecular labels,也称为分子索引(molecular indexes,MI))的随机条形码可以用于计数分子数目和校正扩增偏倚。随机条形码化诸如Precise

Precise

用于确定单细胞的mRNA表达谱的方法可以以大规模并行方式进行。例如,Precise

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,每一个细胞包含一种或更多种细胞表面糖类靶,其中样品索引组合物包含与样品索引寡核苷酸缔合的糖类结合试剂,其中糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,每一个细胞包含一种或更多种细胞表面糖类靶,其中样品索引组合物包含与样品索引寡核苷酸缔合的糖类结合试剂,其中糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;并且基于多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

本文公开了包括多于一种样品索引组合物的实施方案。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的糖类结合试剂,糖类结合试剂能够与至少一种细胞表面糖类靶特异性结合,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;并且基于多于一种样品索引组合物的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触,其中多于一个样品中的每一个包含一个或更多个细胞,其中样品索引组合物包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;并且基于多于一种样品索引组合物的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。

本文公开了包括多于一种样品索引组合物。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

除非另外定义,否则本文使用的技术术语和科学术语具有与本公开内容所属领域的普通技术人员通常所理解的相同意义。参见,例如,Singleton等人,Dictionary ofMicrobiology and Molecular Biology,第2版,J.Wiley&Sons(New York,NY 1994);Sambrook等人,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press(Cold Spring Harbor,NY 1989)。为了本公开内容的目的,下文定义了以下术语。

如本文使用的,术语“衔接子”可以意指促进缔合的核酸的扩增或测序的序列。缔合的核酸可以包括靶核酸。缔合的核酸可以包括一种或更多种空间标记、靶标记、样品标记、索引标记或条形码序列(例如,分子标记)。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一种或更多种衔接子可以位于核酸的5’端或3’端。当衔接子在5’端和3’端包含已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’端和/或3’端的衔接子可以能够与固定在表面上的一种或更多种寡核苷酸杂交。在一些实施方案中,衔接子可以包含通用序列。通用序列可以是两个或更多个核酸分子共有的核苷酸序列的区域。两个或更多个核酸分子也可以具有不同序列的区域。因此,例如,5’衔接子可以包含相同和/或通用的核酸序列,并且3’衔接子可以包含相同和/或通用的序列。可以存在于多于一个核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单个通用引物复制或扩增多于一个不同序列。类似地,可以存在于核酸分子的集合中的不同成员中的至少一个、两个(例如,一对)或更多个通用序列可以允许使用与通用序列互补的至少一个、两个(例如,一对)或更多个单个通用引物复制或扩增多于一个不同序列。因此,通用引物包含可与此类通用序列杂交的序列。可以修饰携带靶核酸序列的分子以将通用衔接子(例如,非靶核酸序列)与不同靶核酸序列的一端或两端附接。与靶核酸附接的一种或更多种通用引物可以提供通用引物杂交的位点。与靶核酸附接的一个或更多个通用引物可以彼此相同或不同。

如本文使用的,抗体可以是全长(例如,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合)部分(像抗体片段)。

在一些实施方案中,抗体是功能性抗体片段。例如,抗体片段可以是抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。抗体片段可以与由全长抗体识别的相同的抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于针对癌细胞的抗体、针对病毒的抗体、与细胞表面受体(例如,CD8、CD34和CD45)结合的抗体和治疗性抗体。

如本文使用的,术语“缔合”或“与...缔合”可以意指两个或更多个物质可以被鉴定为在某个时间点处共定位。缔合可以意指两个或更多个物质在或曾经在相似的容器内。缔合可以是信息学缔合。例如,关于两个或更多个物质的数字信息可以被存储并且可以用于确定一种或更多种物质在某个时间点处共定位。缔合也可以是物理缔合。在一些实施方案中,两个或更多个缔合的物质彼此“拴系”、“附接”或“固定”或与共同的固体或半固体表面“拴系”、“附接”或“固定”。缔合可以指用于将标记与固体或半固体支持物(诸如珠)附接的共价或非共价方式。缔合可以是靶与标记之间的共价键。缔合可以包括两个分子(诸如靶分子和标记)之间的杂交。

如本文使用的,术语“互补性”可以指两个核苷酸之间精确配对的能力。例如,如果在核酸的给定位置处的核苷酸能够与另一个核酸的核苷酸氢键键合,则这两个核酸被认为在该位置处彼此互补。两个单链核酸分子之间的互补性可以是“部分的”,其中核苷酸中仅一些核苷酸结合,或者当单链分子之间存在完全互补性时,这种互补性可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则可以将第一核苷酸序列称为第二序列的“互补体”。如果第一核苷酸序列与第二序列的相反序列(即,核苷酸顺序相反)互补,则可以将第一核苷酸序列称为第二序列的“反向互补体”。如本文使用的,术语“互补体”、“互补”和“反向互补体”可以互换使用。从本公开内容理解,如果一个分子可以与另一个分子杂交,则其可以是杂交的分子的互补体。

如本文使用的,术语“数字计数”可以指用于估计样品中靶分子数目的方法。数字计数可以包括确定已经与样品中的靶缔合的独特标记的数目的步骤。这种方法(其本质上可以是随机的)将计数分子的问题从相同分子的定位和鉴定之一转化为有关检测一组预定义标记的一系列是/否数字问题。

如本文使用的,术语“一个标记(label)”或“多于一个标记(labels)”可以指与样品中的靶缔合的核酸代码。标记可以是例如核酸标记。标记可以是完全或部分可扩增的标记。标记可以是完全或部分可测序的标记。标记可以是可鉴定为有区别的天然核酸的一部分。标记可以是已知的序列。标记可以包括核酸序列的接点,例如天然和非天然序列的接点。如本文使用的,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在各种实施方案中,可以使用标记来确定样品的身份、样品的来源、细胞的身份和/或靶。

如本文使用的,术语“非耗尽性储库(non-depleting reservoir)”可以指由许多不同标记组成的条形码(例如,随机条形码)的池。非耗尽性储库可以包括大量不同的条形码,使得当非耗尽性储库与靶池缔合时,每个靶可能与独特的条形码缔合。每个标记的靶分子的独特性可以通过随机选择的统计来确定,并且取决于与标记的多样性相比在集合中相同的靶分子的拷贝数。所得的标记的靶分子的集合的大小可以通过条形码化处理的随机性质来确定,并且然后对检测到的条形码的数目的分析允许计算原始集合或样品中存在的靶分子的数目。当存在的靶分子的拷贝数目与独特的条形码的数目的比率低时,标记的靶分子是高度独特的(即,多于一个靶分子被给定标记标记的概率非常低)。

如本文使用的,术语“核酸”是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对于细胞可以是外源的或内源的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是DNA。核酸可以是RNA。核酸可以包括一种或更多种类似物(例如,改变的骨架、糖或核酸碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、异种核酸、吗啉代、锁核酸(locked nucleic acid)、乙二醇核酸、苏糖核酸、二脱氧核苷酸、虫草菌素、7-脱氮-GTP、荧光团(例如,与糖连接的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光基类似物、CpG岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫代尿苷、假尿苷、二氢尿苷、辫苷(queuosine)以及怀俄苷(wyosine)。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。

核酸可以包括一种或更多种修饰(例如,碱基修饰、骨架修饰),以为核酸提供新的或增强的特征(例如,改进的稳定性)。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两个最常见的类别是嘌呤和嘧啶。核苷酸可以是进一步包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括呋喃戊糖的那些核苷,磷酸基团可以连接到糖的2’、3’或5’羟基部分。在形成核酸中,磷酸基团可以将相邻的核苷彼此共价连接以形成线性聚合化合物。继而,此线性聚合化合物的各端可以进一步连接而形成环状化合物;然而,线性化合物通常是合适的。此外,线性化合物可以具有内部核苷酸碱基互补性,并且因此可以按产生完全或部分双链化合物的方式折叠。在核酸中,磷酸基团通常可以指形成核酸的核苷间骨架。键(linkage)或骨架可以是3’到5’磷酸二酯键。

核酸可以包括修饰的骨架和/或修饰的核苷间键。修饰的骨架可以包括那些在骨架中保留磷原子的骨架和那些在骨架中没有磷原子的骨架。合适的其中含磷原子的修饰的核酸骨架可以包括,例如,硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基和其他烷基膦酸酯诸如3’-亚烷基膦酸酯、5’-亚烷基膦酸酯、手性膦酸酯、亚膦酸酯、磷酰胺酯(phosphoramidate)包括3’-氨基磷酰胺酯和氨基烷基磷酰胺酯、磷酸二酰胺酯(phosphorodiamidates)、硫代磷酰胺酯(thionophosphoramidates)、硫代烷基磷酸酯、硫代烷基磷酸三酯、硒代磷酸酯和硼磷酸酯,具有正常3’-5’连接、2’-5’连接的类似物以及具有反向极性的类似物(其中一个或更多个核苷酸间连接是3’至3’、5’至5’或2’至2’连接)。

核酸可以包括由短链烷基或环烷基核苷间键,混合杂原子,和烷基或环烷基核苷间键,或者一个或更多个短链杂原子的或杂环的核苷间键形成的多核苷酸骨架。这些可以包括具有吗啉代连接的那些(部分由核苷的糖部分形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲乙酰基(formacetyl)和硫代甲乙酰基骨架;亚甲基甲乙酰基和硫代甲乙酰基骨架;核糖乙酰基骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;和具有混合的N、O、S和CH

核酸可以包括核酸模拟物。术语“模拟物”可以意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间键两者被非呋喃糖基团替代的多核苷酸,仅呋喃糖环的替代也可以称为糖替代物(surrogate)。可以维持杂环碱基部分或修饰的杂环碱基部分,以与适当的靶核酸杂交。一种这样的核酸可以是肽核酸(PNA)。在PNA中,多核苷酸的糖骨架可以被含酰胺的骨架替代,特别是被氨基乙基甘氨酸骨架替代。核苷酸可以被保留,并且直接或间接与骨架的酰胺部分的氮杂氮原子结合。PNA化合物中的骨架可以包含两个或更多个连接的氨基乙基甘氨酸单元,这使得PNA具有含酰胺的骨架。杂环碱基部分可以直接或间接与骨架的酰胺部分的氮杂氮原子结合。

核酸可以包括吗啉代骨架结构。例如,核酸可以包含替代核糖环的6元吗啉代环。在这些实施方案的一些中,磷酸二酰胺酯或其他非磷酸二酯核苷间键可以替代磷酸二酯键。

核酸可以包括具有附接至吗啉代环的杂环碱基的连接的吗啉代单元(例如,吗啉代核酸)。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物与细胞蛋白可以具有较少的不期望的相互作用。基于吗啉代的多核苷酸可以是非离子核酸模拟物。吗啉代类别内的各种化合物可以使用不同的连接基团来连接。另外类别的多核苷酸模拟物可以指环己烯基核酸(CeNA)。核酸分子中通常存在的呋喃糖环可以被环己烯基环替代。使用亚磷酰胺化学可以制备CeNA DMT保护的亚磷酰胺单体并用于寡聚化合物合成。将CeNA单体掺入核酸链可以增加DNA/RNA杂交体的稳定性。CeNA寡腺苷酸酯可以与核酸互补体形成复合体,具有与天然复合体相似的稳定性。另外的修饰可以包括锁核酸(LNA),其中2’-羟基基团与糖环的4’碳原子连接,从而形成2’-C,4’-C-氧亚甲基连接,从而形成双环糖部分。连接可以是亚甲基(-CH

核酸还可以包括核酸碱基(通常简称为“碱基”)修饰或取代。如本文使用的,“未修饰的”或“天然的”核酸碱基可以包括嘌呤碱基(例如,腺嘌呤(A)和鸟嘌呤(G))、以及嘧啶碱基(例如,胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U))。修饰的核酸碱基可以包括其他合成的和天然的核酸碱基,诸如5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫代尿嘧啶,2-硫代胸腺嘧啶和2-硫代胞嘧啶,5-卤素尿嘧啶和胞嘧啶、5-丙炔基(-C≡C-CH3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫代尿嘧啶,8-卤素、8-氨基、8-硫代、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤素特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,2-F-腺嘌呤,2-氨基-腺嘌呤,8-氮杂鸟嘌呤和8-氮杂腺嘌呤,7-脱氮鸟嘌呤和7-脱氮腺嘌呤以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核酸碱基可以包括三环嘧啶,诸如吩噁嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳(G-clamps)诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-钳诸如取代的吩噁嗪胞苷(例如,9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3H)-酮)、咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(H-吡啶并(3’,2’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。

如本文使用的,术语“样品”可以指包括靶的组合物。用于通过所公开的方法、装置和系统进行分析的合适样品包括细胞、组织、器官或生物体。

如本文使用的,术语“采样装置”或“装置”可以指可以取一部分样品和/或将所述部分放置在基底上的装置。采样装置可以指例如荧光激活细胞分选(FACS)机、细胞分选机、活检针、活检装置、组织切片装置、微流体装置、刀片格栅和/或超薄切片机。

如本文使用的,术语“固体支持物”可以指可以附接多于一个条形码(例如,随机条形码)的离散固体或半固体表面。固体支持物可以包括任何类型的实心的、多孔的或空心的球体、球、承座(bearing)、圆柱体或其他类似配置,包含塑料、陶瓷、金属或聚合材料(例如,水凝胶),其上可以固定核酸(例如,共价地或非共价地)。固体支持物可以包括可以是球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。珠的形状可以是非球形的。以阵列间隔开的多于一个固体支持物可以不包括基底。固体支持物可以与术语“珠”互换使用。

如本文使用的,术语“随机条形码”可以指本公开内容的包含标记的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶缔合后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶缔合的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如本文使用的,术语“基因特异性随机条形码”可以指包含标记和基因特异性的靶结合区的多核苷酸序列。随机条形码可以是可用于随机条形码化的多核苷酸序列。随机条形码可以用于对样品中的靶定量。随机条形码可以用于控制标记与靶缔合后可能发生的错误。例如,随机条形码可用于评估扩增或测序错误。与靶缔合的随机条形码可以称为随机条形码-靶或随机条形码-标签-靶。

如本文使用的,术语“随机条形码化”可以指核酸的随机标记(例如,条形码化)。随机条形码化可以利用递归泊松策略来缔合并对与靶缔合的标记进行定量。如本文使用的,术语“随机条形码化”可以与“随机进行标记”互换使用。

如本文使用的,术语“靶”可以指可与条形码(例如,随机条形码)缔合的组合物。用于通过所公开的方法、装置和系统进行分析的示例性合适的靶包括寡核苷酸、DNA、RNA、mRNA、微RNA、tRNA等。靶可以是单链的或双链的。在一些实施方案中,靶可以是蛋白、肽或多肽。在一些实施方案中,靶是脂质。如本文使用的,“靶”可以与“物质(species)”互换使用。

如本文使用的,术语“逆转录酶”可以指具有逆转录酶活性(即,催化从RNA模板合成DNA)的一组酶。通常,这样的酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒(retroplasmid)逆转录酶、逆转录子逆转录酶、细菌逆转录酶、II型内含子衍生的逆转录酶,及它们的突变体、变体或衍生物。非逆转录病毒逆转录酶包括非LTR逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶和II型内含子逆转录酶。II型内含子逆转录酶的实例包括乳酸乳球菌(Lactococcus lactis)LI.LtrB内含子逆转录酶、细长嗜热聚球藻(Thermosynechococcus elongatus)TeI4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(Geobacillus stearothermophilus)GsI-IIC内含子逆转录酶。其他类别的逆转录酶可以包括许多类型的非逆转录病毒逆转录酶(即,尤其是逆转录子、II型内含子、以及多样性产生型逆转录元件)。

术语“通用衔接子引物”、“通用引物衔接子”或“通用衔接子序列”可互换地使用,以指可以用于与条形码(例如,随机条形码)杂交以产生基因特异性条形码的核苷酸序列。通用衔接子序列可以例如是在本公开内容的方法中使用的遍及所有条形码通用的已知序列。例如,当使用本文公开的方法标记多于一个靶时,每个靶特异性序列可以连接到相同的通用衔接子序列。在一些实施方案中,多于一个通用衔接子序列可以用于本文公开的方法中。例如,当使用本文公开的方法标记多于一个靶时,至少两个靶特异性序列连接到不同的通用衔接子序列。通用衔接子引物及其互补序列可以被包括在两个寡核苷酸中,其中的一个寡核苷酸包含靶特异性序列且另一个寡核苷酸包含条形码。例如,通用衔接子序列可以是包含靶特异性序列的寡核苷酸的一部分以产生与靶核酸互补的核苷酸序列。包含条形码和通用衔接子序列的互补序列的第二寡核苷酸可与核苷酸序列杂交并产生靶特异性条形码(例如,靶特异性随机条形码)。在一些实施方案中,通用衔接子引物具有与本公开内容的方法中使用的通用PCR引物不同的序列。

条形码化,诸如随机条形码化,已经在例如US20150299784、WO2015031691和Fu等人,Proc Natl Acad Sci U.S.A.2011May31;108(22):9026-31中描述,这些公开物的内容在此以其整体并入。在一些实施方案中,本文公开的条形码可以是随机条形码,所述随机条形码可以是可以用于对靶随机标记(例如,条形码,标签)的多核苷酸序列。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或在这些值的任何两个之间的数字或范围,则条形码可以称为随机条形码。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。如果随机条形码的不同条形码序列的数目与待标记的任何靶的出现数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1,则条形码可以称为随机条形码。随机条形码的条形码序列可以称为分子标记。

条形码(例如,随机条形码)可以包括一种或更多种标记。示例性标记可以包括通用标记、细胞标记、条形码序列(例如,分子标记)、样品标记、板标记、空间标记和/或前空间标记(pre-spatial label)。图1示出了具有空间标记的示例性条形码104。条形码104可以包含可以将条形码与固体支持物105连接的5’胺。条形码可以包含通用标记、维度标记(dimension label)、空间标记、细胞标记和/或分子标记。条形码中不同标记(包括但不限于通用标记、维度标记、空间标记、细胞标记和分子标记)的顺序可以改变。例如,如图1中所示,通用标记可以是最5’侧的标记(5’-most label),且分子标记可以是最3’侧的标记(3’-most label)。空间标记、维度标记和细胞标记可以处于任何顺序。在一些实施方案中,通用标记、空间标记、维度标记、细胞标记和分子标记是处于任何顺序的。条形码可以包含靶结合区。靶结合区可以与样品中的靶(例如,靶核酸、RNA、mRNA、DNA)相互作用。例如,靶结合区可以包含可以与mRNA的聚(A)尾相互作用的寡(dT)序列。在一些情况下,条形码的标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列)可以由1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸隔开。

标记(例如,细胞标记)可以包含一组独特的定义长度的核酸子序列,例如每个七个核苷酸(相当于一些汉明错误校正代码中使用的比特数目),其可被设计成提供错误校正能力。可以设计包含七个核苷酸序列的错误校正子序列组,使得所述组中的序列的任何成对组合展现出定义的“遗传距离”(或错配碱基数),例如一组错误校正子序列可被设计成展现三个核苷酸的遗传距离。在这种情况下,对于标记的靶核酸分子的序列数据组中的错误校正序列的审查(在下文更详细地描述)可允许人们检测或校正扩增错误或测序错误。在一些实施方案中,用于产生错误校正代码的核酸子序列的长度可以变化,例如,它们的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、15个、20个、30个、31个、40个、50个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。在一些实施方案中,其他长度的核酸子序列可以用来产生错误校正代码。

条形码可以包含靶结合区。靶结合区可以与样品中的靶相互作用。靶可以是以下或包括以下:核糖核酸(RNA)、信使RNA(mRNA)、微RNA、小干扰RNA(siRNA)、RNA降解产物、各自含有聚(A)尾的RNA或其任何组合。在一些实施方案中,多于一个靶可以包括脱氧核糖核酸(DNA)。

在一些实施方案中,靶结合区可以包括可以与mRNA的聚(A)尾相互作用的寡(dT)序列。条形码的一个或更多个标记(例如,通用标记、维度标记、空间标记、细胞标记和条形码序列(例如,分子标记))可以通过间隔区(spacer)与条形码的另一个或两个剩余标记隔开。间隔区可以是例如1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个或20个或更多个核苷酸。在一些实施方案中,条形码的标记中没有标记被间隔物隔开。

条形码可以包含一种或更多种通用标记。在一些实施方案中,一种或更多种通用标记可以是对于附接至给定固体支持物的条形码组中的所有条形码相同的。在一些实施方案中,一种或更多种通用标记可以是对于附接至多于一个珠的所有条形码相同的。在一些实施方案中,通用标记可以包括能够与测序引物杂交的核酸序列。测序引物可以用于对包括通用标记的条形码进行测序。测序引物(例如,通用测序引物)可以包括与高通量测序平台相关的测序引物。在一些实施方案中,通用标记可以包括能够与PCR引物杂交的核酸序列。在一些实施方案中,通用标记可以包括能够与测序引物和PCR引物杂交的核酸序列。能够与测序引物或PCR引物杂交的通用标记的核酸序列可以被称为引物结合位点。通用标记可以包括可以用于引发条形码转录的序列。通用标记可以包括可以用于延伸条形码或条形码内的区域的序列。通用标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。例如,通用标记可以包括至少约10个核苷酸。通用标记的长度可以是至少以下或是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。在一些实施方案中,可裂解接头或修饰的核苷酸可以是通用标记序列的一部分,以使条形码能够从支持物上被裂解下来。

条形码可以包含一种或更多种维度标记。在一些实施方案中,维度标记可以包括提供关于标记(例如,随机标记)发生的维度的信息的核酸序列。例如,维度标记可以提供关于靶被条形码化的时间的信息。维度标记可以与样品中条形码化(例如,随机条形码化)的时间相关联。维度标记可以在标记的时间处被激活。不同的维度标记可以在不同的时间被激活。维度标记提供关于靶、靶的组和/或样品被条形码化的顺序的信息。例如,在细胞周期的G0期可以将细胞的群体条形码化。在细胞周期的G1期,可以用条形码(例如,随机条形码)对细胞再次进行脉冲处理。在细胞周期的S期,可以用条形码对细胞再次进行脉冲处理,等等。每个脉冲(例如,细胞周期的每个时期)的条形码可以包含不同的维度标记。以这种方式,维度标记提供关于哪些靶在细胞周期的哪个时期被标记的信息。维度标记可以探询许多不同的生物阶段。示例性的生物学时间可以包括但不限于细胞周期、转录(例如,转录起始)和转录物降解。在另一种实例中,样品(例如,细胞、细胞的群体)可以在用药物和/或疗法治疗之前和/或之后标记。不同靶的拷贝数的变化可以指示样品对药物和/或疗法的响应。

维度标记可以是可激活的。可激活的维度标记可以在特定时间点被激活。可激活的标记可以被例如组成性地激活(例如,不关闭)。可激活的维度标记可以被例如可逆地激活(例如,可激活的维度标记可以被打开和关闭)。维度标记可以被可逆地激活例如至少1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。维度标记可以被可逆地激活例如至多1次、2次、3次、4次、5次、6次、7次、8次、9次、10次或更多次。在一些实施方案中,可以用荧光、光、化学事件(例如,裂解,连接另一种分子,添加修饰(例如,聚乙二醇化、类泛素化(sumoylate)、乙酰化、甲基化、去乙酰化、去甲基化)、光化学事件(例如,光囚禁(photocaging))以及引入非天然的核苷酸将维度标记激活。

在一些实施方案中,维度标记对于附接至给定固体支持物(例如,珠)的所有条形码(例如,随机条形码)可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的条形码可以包含相同的维度标记。在一些实施方案中,相同固体支持物上的至少60%的条形码可以包含相同的维度标记。在一些实施方案中,相同固体支持物上的至少95%的条形码可以包含相同的维度标记。

多于一个固体支持物(例如,珠)可以呈现多达10

条形码可以包含一种或更多种空间标记。在一些实施方案中,空间标记可以包含提供关于与条形码缔合的靶分子的空间取向的信息的核酸序列。空间标记可以与样品中的坐标相关联。坐标可以是固定的坐标。例如,坐标可以相对于基底固定。空间标记可以参考二维或三维网格。坐标可以相对于界标(landmark)固定。界标可在空间中被鉴定。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标,诸如具有可鉴定标识(诸如色码、条形码、磁特性(magneticproperty)、荧光、放射性或独特尺寸或形状)的结构。空间标记可以与物理分区(例如,孔、容器或液滴)相关联。在一些实施方案中,将多于一个空间标记一起用于编码空间中的一个或更多个位置。

空间标记对于附接至给定固体支持物(例如,珠)的所有条形码可以是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,包含相同空间标记的相同固体支持物上的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,包含相同空间标记的相同固体支持物上的条形码的百分比可以是至少或是至多60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,相同固体支持物上的至少60%的条形码可以包含相同的空间标记。在一些实施方案中,相同固体支持物上的至少95%的条形码可以包含相同的空间标记。

多于一个固体支持物(例如,珠)可以呈现多达10

条形码(例如,随机条形码)可以包含一种或更多种细胞标记。在一些实施方案中,细胞标记可以包含提供用于确定哪个靶核酸来源于哪个细胞的信息的核酸序列。在一些实施方案中,细胞标记对于附接至给定固体支持物(例如,珠)的所有条形码是相同的,但对于不同的固体支持物(例如,珠)是不同的。在一些实施方案中,包含相同细胞标记的相同固体支持物上的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,包含相同细胞标记的相同固体支持物上的条形码的百分比可以是以下或可以是约以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。例如,相同固体支持物上的至少60%的条形码可以包含相同的细胞标记。作为另一种实例,相同固体支持物上的至少95%的条形码可以包含相同的细胞标记。

多于一个固体支持物(例如,珠)可以呈现多达10

条形码可以包含一种或更多种条形码序列。在一些实施方案中,条形码序列可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。条形码序列可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器(例如,提供粗略近似)的核酸序列。

在一些实施方案中,将一组不同的条形码序列附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在以下或存在约以下:10

在不同实施方式中,条形码的长度可以是不同的。例如,条形码的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。作为另一种实例,条形码的长度可以是至少以下或是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。

条形码(例如,随机条形码)可以包含一种或更多种分子标记。分子标记可以包含条形码序列。在一些实施方案中,分子标记可以包含为与条形码杂交的特定类型的靶核酸物质提供鉴定信息的核酸序列。分子标记可以包含为与条形码(例如,靶结合区)杂交的靶核酸物质的特定出现提供计数器的核酸序列。

在一些实施方案中,将一组不同的分子标记附接至给定固体支持物(例如,珠)。在一些实施方案中,可以存在或存在约10

对于使用多于一个随机条形码的随机条形码化,不同分子标记序列的数目与任何靶的出现的数目的比例可以是以下或可以是约以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1或在这些值的任何两个之间的数字或范围。靶可以是包括具有相同或几乎相同序列的mRNA分子的mRNA物质。在一些实施方案中,不同分子标记序列的数目与任何靶的出现的数目的比例是至少以下或是至多以下:1:1、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1或100:1。

分子标记的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。分子标记的长度可以是至少以下或是至多以下:1个、2个、3个、4个、5个、10个、15个、20个、25个、30个、35个、40个、45个、50个、100个、200个或300个核苷酸。

条形码可以包含一个或更多个靶结合区,诸如捕获探针。在一些实施方案中,靶结合区可以与感兴趣的靶杂交。在一些实施方案中,靶结合区可以包含与靶(例如,靶核酸、靶分子,例如待分析的细胞核酸)特异性杂交(例如,与特定基因序列特异性杂交)的核酸序列。在一些实施方案中,靶结合区可以包含可以附接(例如,杂交)至特定靶核酸的特定位置的核酸序列。在一些实施方案中,靶结合区可以包含能够与限制性酶位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。

在一些实施方案中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以指可以独立于靶核酸的特定序列结合多于一个靶核酸的序列。例如,靶结合区可以包含与mRNA分子上的聚(A)尾杂交的随机多聚体序列或寡(dT)序列。随机多聚体序列可以是,例如,随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或任何长度的更高多聚体序列。在一些实施方案中,对于附接至给定珠的所有条形码,靶结合区是相同的。在一些实施方案中,对于附接至给定珠的多于一个条形码,靶结合区可以包括两个或更多个不同的靶结合序列。靶结合区的长度可以是以下或可以是约以下:5个、10个、15个、20个、25个、30个、35个、40个、45个、50个核苷酸、或在这些值的任何两个之间的数字或范围的核苷酸。靶结合区的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。

在一些实施方案中,靶结合区可以包含寡(dT),所述寡(dT)可以与包含聚腺苷酸化末端的mRNA杂交。靶结合区可以是基因特异性的。例如,可以将靶结合区配置为与靶的特定区域杂交。靶结合区的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26 27个、28个、29个、30个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。靶结合区的长度可以是至少以下或是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26 27个、28个、29个或30个核苷酸。靶结合区的长度可以是约5个-30个核苷酸。当条形码包含基因特异性靶结合区时,条形码在本文中可以称为基因特异性条形码。

随机条形码(例如,随机条形码)可以包含一种或更多种可以用于定向(例如,比对)条形码的定向特性。条形码可以包含用于等电聚焦的部分。不同的条形码可以包含不同的等电聚焦点。当将这些条形码引入样品中时,样品可以经历等电聚焦,以便于将条形码定向成已知的方式。以这种方式,定向特性可以用于开发样品中条形码的已知的映射。示例性定向特性可以包括电泳迁移率(例如,基于条形码的尺寸)、等电点、自旋、电导率和/或自组装。例如,具有自组装的定向特性的条形码激活时可以自组装成特定的定向(例如,核酸纳米结构)。

条形码(例如,随机条形码)可以包含一种或更多种亲和特性。例如,空间标记可以包含亲和特性。亲和特性可以包括可以促进条形码与另一种实体(例如,细胞受体)结合的化学部分和/或生物部分。例如,亲和特性可以包括抗体,例如,对于样品上的特定部分(例如,受体)特异性的抗体。在一些实施方案中,抗体可以将条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或特定细胞类型或分子附近的靶可以被标记(例如,被随机标记)。在一些实施方案中,亲和特性可以提供空间标记的核苷酸序列之外的空间信息,因为抗体可以将条形码引导至特定位置。抗体可以是治疗性抗体,例如单克隆抗体或多克隆抗体。抗体可以是人源化的或嵌合的。抗体可以是裸抗体或融合抗体。

抗体可以是全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如,IgG抗体)或免疫球蛋白分子的免疫活性(即,特异性结合性)部分(像抗体片段)。

抗体片段可以是例如抗体的一部分,诸如F(ab’)2、Fab’、Fab、Fv、sFv等。在一些实施方案中,抗体片段可以与由全长抗体识别的相同的抗原结合。抗体片段可以包括由抗体的可变区组成的分离的片段,诸如由重链和轻链的可变区组成的“Fv”片段和其中轻链和重链可变区通过肽接头连接的重组单链多肽分子(“scFv蛋白”)。示例性抗体可以包括但不限于癌细胞抗体、病毒抗体、与细胞表面受体(CD8、CD34、CD45)结合的抗体和治疗性抗体。

条形码可以包含一种或更多种通用衔接子引物。例如,基因特异性条形码(诸如基因特异性随机条形码)可以包含通用衔接子引物。通用衔接子引物可以指遍及所有条形码的通用的核苷酸序列。通用衔接子引物可以用于构建基因特异性条形码。通用衔接子引物的长度可以是以下或可以是约以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26 27个、28个、29个、30个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。通用衔接子引物的长度可以是至少以下或是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26 27个、28个、29个或30个核苷酸。通用衔接子引物的长度可以是5个-30个核苷酸。

当条形码包含多于一种类型的标记(例如,多于一种细胞标记或多于一种条形码序列,诸如一种分子标记)时,标记之间可以散布有接头标记序列。接头标记序列的长度可以是至少约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。接头标记序列的长度可以是至多约5个、10个、15个、20个、25个、30个、35个、40个、45个、50个或更多个核苷酸。在某些情况下,接头标记序列的长度是12个核苷酸。接头标记序列可以用于促进条形码的合成。接头标记可以包括错误校正(例如,汉明)码。

在一些实施方案中,本文公开的条形码(诸如随机条形码)可以与固体支持物缔合。固体支持物可以是例如合成颗粒。在一些实施方案中,固体支持物上的多于一个条形码(例如,第一多于一个条形码)的一些或所有条形码序列(诸如,随机条形码(例如,第一条形码序列)的分子标记)相差至少一个核苷酸。相同固体支持物上的条形码的细胞标记可以是相同的。不同的固体支持物上的条形码的细胞标记可以相差至少一个核苷酸。例如,第一固体支持物上的第一多于一个条形码的第一细胞标记可以具有相同的序列,且第二固体支持物上的第二多于一个条形码的第二细胞标记可以具有相同的序列。第一固体支持物上的第一多于一个条形码的第一细胞标记和第二固体支持物上的第二多于一个条形码的第二细胞标记可以相差至少一个核苷酸。细胞标记可以是例如约5个-20个核苷酸长。条形码序列可以是例如约5个-20个核苷酸长。合成颗粒可以是例如珠。

珠可以是例如硅胶珠、可控孔径玻璃珠、磁珠、dynabead、sephadex/sepharose珠、纤维素珠、聚苯乙烯珠或其任何组合。珠可以包括材料诸如聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、sepharose、纤维素、尼龙、硅酮或其任何组合。

在一些实施方案中,珠可以是用条形码或随机条形码官能化的聚合物珠(例如可变形珠或凝胶珠)(诸如来自10X Genomics(San Francisco,CA)的凝胶珠)。在一些实施方式中,凝胶珠可以包括基于聚合物的凝胶。凝胶珠可以例如通过将一种或更多种聚合物前体包封到液滴中来产生。在将聚合物前体暴露于促进剂(例如,四甲基乙二胺(TEMED))后,可以产生凝胶珠。

在一些实施方案中,颗粒可以是可降解的。例如,聚合物珠可以例如在期望的条件下溶解、熔化或降解。所期望的条件可以包括环境条件。所期望的条件可以导致聚合物珠以受控方式溶解、熔化或降解。凝胶珠可以由于化学刺激、物理刺激、生物刺激、热刺激、磁刺激、电刺激、光刺激或其任何组合而溶解、熔化或降解。

例如,分析物和/或试剂(诸如寡核苷酸条形码)可以偶联/固定至凝胶珠的内表面(例如,经由寡核苷酸条形码和/或用于产生寡核苷酸条形码的材料的扩散而可及的内部)和/或凝胶珠的外表面或本文描述的任何其他微胶囊。偶联/固定可以经由任何形式的化学键合(例如,共价键、离子键)或物理现象(例如,范德华力、偶极-偶极相互作用等)。在一些实施方案中,本文描述的试剂与凝胶珠或任何其他微胶囊的偶联/固定可以是可逆的,诸如,例如经由不稳定型部分(例如,经由化学交联剂,包括本文描述的化学交联剂)。在施加刺激后,不稳定型部分可以被裂解并释放所固定的试剂。在一些实施方案中,不稳定型部分是二硫键。例如,在经由二硫键将寡核苷酸条形码固定至凝胶珠的情况下,使二硫键暴露于还原剂可以裂解二硫键并从珠释放寡核苷酸条形码。不稳定型部分可以作为凝胶珠或微胶囊的一部分、作为将试剂或分析物与凝胶珠或微胶囊连接的化学接头的一部分和/或作为试剂或分析物的一部分被包括。在一些实施方案中,多于一个条形码的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被封闭在颗粒中、被部分封闭在颗粒中或其任何组合。

在一些实施方案中,凝胶珠可以包括宽范围的不同的聚合物,包括但不限于:聚合物、热敏聚合物、光敏聚合物、磁性聚合物、pH敏感聚合物、盐敏感聚合物、化学敏感聚合物、聚电解质、多糖、肽、蛋白和/或塑料。聚合物可以包括但不限于以下材料:诸如聚(N-异丙基丙烯酰胺)(PNIPAAm)、聚(苯乙烯磺酸酯)(PSS)、聚(烯丙基胺)(PAAm)、聚(丙烯酸)(PAA)、聚(乙烯亚胺)(PEI)、聚(双烯丙基二甲基-氯化铵)(PDADMAC)、聚(吡咯(pyrolle))(PPy)、聚(乙烯基吡咯烷酮)(PVPON)、聚(乙烯基吡啶)(PVP)、聚(甲基丙烯酸)(PMAA)、聚(甲基丙烯酸甲酯)(PMMA)、聚苯乙烯(PS)、聚(四氢呋喃)(PTHF)、聚(邻苯二甲醛)(PPA)、聚(己基紫精)(PHV)、聚(L-赖氨酸)(PLL)、聚(L-精氨酸)(PARG)、聚(乳酸-共-羟基乙酸)(PLGA)。

许多化学刺激可以用于触发珠的破坏、溶解或降解。这些化学改变的实例可以包括但不限于pH介导的珠壁改变、经由交联键的化学裂解使珠壁分解、珠壁的触发解聚和珠壁转换反应。批量(bulk)改变也可以用于触发珠的破坏。

通过各种刺激对微胶囊的批量或物理改变在设计胶囊以释放试剂方面也提供了许多优点。在宏观尺度上发生批量或物理改变,其中珠破裂是由刺激引起的机械-物理力的结果。这些过程可以包括但不限于压力引起的破裂、珠壁熔化或珠壁的孔隙率的改变。

生物刺激也可以用于触发珠的破坏、溶解或降解。通常,生物触发物类似于化学触发物,但是许多实例使用生物分子或生命系统中常见的分子,诸如酶、肽、糖、脂肪酸、核酸等。例如,珠可以包含具有对特定蛋白酶的裂解敏感的肽交联的聚合物。更特别地,一种实例可以包括包含GFLGK肽交联的微胶囊。在添加生物触发物(诸如蛋白酶组织蛋白酶B)后,壳壁的肽交联被裂解并且珠的内容物被释放。在其他情况下,蛋白酶可以是热激活的。在另一种实例中,珠包括包含纤维素的壳壁。壳聚糖水解酶的添加用作纤维素键裂解、壳壁解聚及其内部内容物释放的生物触发物。

还可以在施加热刺激后诱导珠释放其内容物。温度的改变可以引起珠的各种改变。热量的变化可以引起珠熔化,使得珠壁崩解。在其他情况下,热量可以增加珠内部组分的内部压力,使得珠破裂或爆炸。在又其他的情况下,热量可以使珠转化成收缩的脱水状态。热量还可以作用于珠壁内的热敏聚合物,从而引起珠的破坏。

将磁性纳米珠包括在微胶囊的珠壁中可以允许珠的触发破裂以及将珠引导成阵列。本公开内容的装置可以包括用于任一目的的磁珠。在一种实例中,将Fe

珠也可以由于电刺激的结果被破坏、溶解或降解。与先前部分中描述的磁性颗粒类似,电敏珠可以允许珠的触发破裂以及其他功能,诸如电场中的对齐、电导率或氧化还原反应。在一种实例中,含电敏材料的珠在电场中对齐,从而可以控制内部试剂的释放。在其他实例中,电场可以在珠壁本身内引起氧化还原反应,这可以增加孔隙率。

也可以使用光刺激来破坏珠。许多光触发是可能的,并且可以包括使用各种分子(诸如能够吸收特定波长范围的光子的纳米颗粒和发色团)的系统。例如,金属氧化物涂层可以用作胶囊触发物。涂覆有SiO

例如,在图2中示出的条形码化(例如,随机条形码化)的非限制性实例中,在框208处将细胞(诸如单细胞)引入微孔阵列的多于一个微孔上之后,在框212处可以将珠引入微孔阵列的多于一个微孔上。每个微孔可以包含一个珠。珠可以包含多于一个条形码。条形码可以包含附接至珠的5’胺区域。条形码可以包含通用标记、条形码序列(例如,分子标记)、靶结合区或其任何组合。

本文公开的条形码可以与固体支持物(例如,珠)缔合(例如,附接)。与固体支持物缔合的条形码可各自包含选自以下组的条形码序列,该组包括至少100个或1000个具有独特序列的条形码序列。在一些实施方案中,与固体支持物缔合的不同条形码可以包含具有不同序列的条形码。在一些实施方案中,与固体支持物缔合的条形码的一定百分比包含相同的细胞标记。例如,百分比可以是以下或是约以下:60%、70%、80%、85%、90%、95%、97%、99%、100%或在这些值的任何两个之间的数字或范围。作为另一种实例,百分比可以是至少以下或是至多以下:60%、70%、80%、85%、90%、95%、97%、99%或100%。在一些实施方案中,与固体支持物缔合的条形码可以具有相同的细胞标记。与不同固体支持物缔合的条形码可以具有选自下组的不同的细胞标记,该组包括至少100个或1000个具有独特序列的细胞标记。

本文公开的条形码可以与固体支持物(例如,珠)缔合(例如,附接)。在一些实施方案中,可以用包括与多于一个条形码缔合的多于一个合成颗粒的固体支持物将样品中的多于一个靶条形码化。在一些实施方案中,固体支持物可以包括与多于一个条形码缔合的多于一个合成颗粒。不同固体支持物上的多于一个条形码的空间标记可以相差至少一个核苷酸。固体支持物可以例如在二维或三维包括多于一个条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔径玻璃珠、磁珠、dynabead、sephadex/sepharose珠、纤维素珠、聚苯乙烯珠或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体或其任何组合。在一些实施方案中,固体支持物可以自由浮动。在一些实施方案中,固体支持物可以包埋到半固体或固体阵列中。条形码可以不与固体支持物缔合。条形码可以是单独的核苷酸。条形码可以与基底缔合。

如本文使用的,术语“拴系的”、“附接的”和“固定的”可以互换使用,并且可以指用于将条形码附接至固体支持物的共价或非共价方式。可以将各种不同的固体支持物中的任何一种用作固体支持物,以用于附接预先合成的条形码或用于原位固相合成条形码。

在一些实施方案中,固体支持物是珠。珠可以包括一种或更多种类型的实心的、多孔的或空心的球体、球、承座、圆柱体或其他类似配置,其上可以固定核酸(例如,共价地或非共价地)。珠可以由例如塑料、陶瓷、金属、聚合物材料或其任何组合构成。珠可以是或包括球形的(例如,微球)或具有非球形或不规则形状的离散颗粒,所述形状诸如立方形、长方形、锥形、圆柱形、圆锥形、椭圆形或圆盘形等。在一些实施方案中,珠的形状可以是非球形的。

珠可以包括各种材料,包括但不限于顺磁性材料(例如,镁、钼、锂和钽)、超顺磁性材料(例如,铁氧体(Fe

在一些实施方案中,珠(例如,标记所附接的珠)是水凝胶珠。在一些实施方案中,珠包括水凝胶。

本文公开的一些实施方案包括一个或更多个颗粒(例如,珠)。每个颗粒可以包含多于一个寡核苷酸(例如,条形码)。多于一个寡核苷酸中的每一个可以包含条形码序列(例如,分子标记序列)、细胞标记和靶结合区(例如,寡(dT)序列、基因特异性序列、随机多聚体或其组合)。多于一个寡核苷酸的每一个的细胞标记序列可以是相同的。不同颗粒上的寡核苷酸的细胞标记序列可以是不同的,使得可以鉴定不同颗粒上的寡核苷酸。在不同实施方式中,不同细胞标记序列的数目可以是不同的。在一些实施方案中,细胞标记序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10

在每个颗粒上的多于一个寡核苷酸可以包含不同的条形码序列(例如,分子标记)。在一些实施方案中,条形码序列的数目可以是以下或可以是约以下:10、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、10

珠的尺寸可以不同。例如,珠的直径范围可以为从0.1微米至50微米。在一些实施方案中,珠的直径可以是以下或可以是约以下:0.1微米、0.5微米、1微米、2微米、3微米、4微米、5微米、6微米、7微米、8微米、9微米、10微米、20微米、30微米、40微米、50微米或在这些值的任何两个之间的数字或范围。

珠的直径可以与基底的孔的直径相关。在一些实施方案中,珠的直径可以比孔的直径长或短或者可以比孔的直径长或短约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或在这些值的任何两个之间的数字或范围。珠的直径可以与细胞的直径相关(例如,被基底的孔捕获的单细胞)。在一些实施方案中,珠的直径可以比孔的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞的直径相关(例如,被基底的孔捕获的单细胞)。在一些实施方案中,珠的直径可以比细胞的直径长或短或者可以比细胞的直径长或短约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%或在这些值的任何两个之间的数字或范围。在一些实施方案中,珠的直径可以比细胞的直径长或短至少或至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%。

珠可以附接至基底和/或包埋到基底中。珠可以附接至凝胶、水凝胶、聚合物和/或基质和/或包埋到凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上的条形码上存在的空间标记来鉴定,该空间标记可以用作位置地址。

珠的实例可以包括但不限于链霉抗生物素蛋白珠、琼脂糖珠、磁珠、

珠可以与量子点或荧光染料缔合(例如,用量子点或荧光染料浸渍),以使其在一个荧光光学通道或多于一个光学通道中发荧光。珠可以与氧化铁或氧化铬缔合,使其成为顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠成像。珠可以具有与珠缔合的可检测代码。例如,珠可以包含条形码。珠可以改变尺寸,例如由于在有机溶液或无机溶液中溶胀。珠可以是疏水的。珠可以是亲水的。珠可以是生物相容的。

固体支持物(例如,珠)可以被可视化。固体支持物可以包含可视化标签(例如,荧光染料)。固体支持物(例如,珠)可以蚀刻有标识符(例如,数字)。标识符可以通过对珠成像来可视化。

固体支持物可以包括半溶性或不溶性材料。当固体支持物包括接头、支架、构建模块(building block)或其他与其附接的反应性部分时,固体支持物可以被称为“官能化的”,而当固体支持物缺少这种与其附接的反应性部分时,固体支持物可以被称为“非官能化的”。固体支持物可以以溶液中游离,诸如在微量滴定孔中的形式;以流通形式,诸如在柱中;或以浸量尺(dipstick)使用。

固体支持物可以包括膜、纸(paper)、塑料、涂覆表面、平坦表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以采取树脂、凝胶、微球或其他几何配置的形式。固体支持物可以包括二氧化硅芯片、微米颗粒、纳米颗粒、板、阵列、毛细管、平坦支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢、金银、铝、硅和铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片、塑料材料包括多孔板或膜(例如,由聚乙烯、聚丙烯、聚酰胺、聚偏二氟乙烯形成),和/或晶片、梳、针或针头(例如,适于组合合成或分析的针阵列)或珠,平坦表面诸如晶片(例如,硅晶片)的凹陷或纳升孔阵列,具有凹陷的晶片(具有或不具有过滤器底部)。

固体支持物可以包括聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如,细胞器周围)。聚合物基质可以能够被泵送到整个循环系统。

如本文使用的,基底可以指固体支持物类型。基底可以指可以包含本公开内容的条形码或随机条形码的固体支持物。基底可以例如包括多于一个微孔。基底可以例如是包括两个或更多个微孔的孔阵列。在一些实施方案中,微孔可以包括定义体积的小的反应室。在一些实施方案中,微孔可以捕获一个或更多个细胞。在一些实施方案中,微孔可以仅捕获一个细胞。在一些实施方案中,微孔可以捕获一个或更多个固体支持物。在一些实施方案中,微孔可以仅捕获一个固体支持物。在一些实施方案中,微孔捕获单细胞和单个固体支持物(例如,珠)。微孔可以包含本公开内容的条形码试剂。

本公开内容提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中的不同位置处的不同靶的数目的方法。该方法可以包括将条形码(例如,随机条形码)非常靠近样品放置,裂解样品,将不同的靶与条形码缔合,对靶进行扩增和/或对靶进行数字计数。该方法还可以包括对从条形码上的空间标记获得的信息进行分析和/或可视化。在一些实施方案中,方法包括使样品中的多于一个靶可视化。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一个靶条形码化(例如,随机条形码化)之前或之后产生二维映射图和三维映射图。将样品中的多于一个靶可视化可以包括将多于一个靶映射到样品的映射图上。将多于一个靶映射到样品的映射图上可以包括产生样品的二维映射图或三维映射图。可以在将样品中的多于一个靶条形码化之前或之后产生二维映射图和三维映射图。在一些实施方案中,二维映射图和三维映射图可以在裂解样品之前或之后产生。在产生二维映射图或三维映射图之前或之后裂解样品可以包括加热样品、使样品与去污剂接触、改变样品的pH或其任何组合。

在一些实施方案中,将多于一个靶条形码化包括将多于一个条形码与多于一个靶杂交以产生条形码化靶(例如,随机条形码化的靶)。将多于一个靶条形码化可以包括产生条形码化靶的索引文库。产生条形码化靶的索引文库可以用包含多于一个条形码(例如,随机条形码)的固体支持物来进行。

本公开内容提供了用于使样品(例如,细胞)与本公开内容的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与条形码(例如,随机条形码)接触。细胞可以例如通过重力流来接触,其中可以使细胞沉淀并且产生单层。样品可以是组织薄切片。可以将薄切片放置于基底上。样品可以是一维的(例如,形成平坦表面)。可以使样品(例如,细胞)分散遍及基底,例如,通过在基底上生长/培养细胞。

当条形码紧密靠近靶时,靶可以与条形码杂交。条形码可以按不可耗尽的比例接触,使得每个不同的靶可以与本公开内容的不同条形码缔合。为了确保靶与条形码之间的有效缔合,可以将靶与条形码交联。

在细胞和条形码的分布之后,可以将细胞裂解以释放靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如通过化学或生化手段,通过渗透冲击,或通过热裂解、机械裂解或光学裂解的手段。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。为了增加靶与条形码的缔合,可以通过例如降低裂解物的温度和/或增加裂解物的粘度来改变靶分子的扩散速率。

在一些实施方案中,可以使用滤纸来裂解样品。可以用滤纸上部的裂解缓冲液浸泡滤纸。可以将滤纸用压力施加至样品,这可以促进样品的裂解以及样品的靶与底物的杂交。

在一些实施方案中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解来进行。化学裂解可以包括使用消化酶,诸如蛋白酶K、胃蛋白酶和胰蛋白酶。裂解可以通过将裂解缓冲液添加至底物来进行。裂解缓冲液可以包含Tris HCl。裂解缓冲液可以包含至少约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含至多约0.01M、0.05M、0.1M、0.5M或1M或更多的Tris HCl。裂解缓冲液可以包含约0.1M Tris HCl。裂解缓冲液的pH可以是至少约1、2、3、4、5、6、7、8、9、10或更高。裂解缓冲液的pH可以是至多约1、2、3、4、5、6、7、8、9、10或更高。在一些实施方案中,裂解缓冲液的pH是约7.5。裂解缓冲液可以包含盐(例如,LiCl)。裂解缓冲液中的盐浓度可以是至少约0.1M、0.5M或1M或更高。裂解缓冲液中的盐浓度可以是至多约0.1M、0.5M或1M或更高。在一些实施方案中,裂解缓冲液中的盐浓度是约0.5M。裂解缓冲液可以包含去污剂(例如,SDS、十二烷基硫酸锂、triton X、tween、NP-40)。裂解缓冲液中的去污剂浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。裂解缓冲液中的去污剂浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施方案中,裂解缓冲液中的去污剂浓度是约1%的十二烷基硫酸锂。裂解方法中使用的时间可以取决于所使用的去污剂的量。在一些实施方案中,使用的去污剂越多,裂解所需的时间越少。裂解缓冲液可以包含螯合剂(例如,EDTA、EGTA)。裂解缓冲液中的螯合剂浓度可以是至少约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。裂解缓冲液中的螯合剂浓度可以是至多约1mM、5mM、10mM、15mM、20mM、25mM或30mM或更高。在一些实施方案中,裂解缓冲液中的螯合剂浓度是约10mM。裂解缓冲液可以包含还原剂(例如,β-巯基乙醇、DTT)。裂解缓冲液中的还原剂浓度可以是至少约1mM、5mM、10mM、15mM或20mM或更高。裂解缓冲液中的还原剂浓度可以是至多约1mM、5mM、10mM、15mM或20mM或更高。在一些实施方案中,裂解缓冲液中的还原剂浓度是约5mM。在一些实施方案中,裂解缓冲液可以包含约0.1M TrisHCl,约pH7.5,约0.5M LiCl,约1%十二烷基硫酸锂,约10mM EDTA和约5mM DTT。

裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度进行。裂解可以进行约1分钟、5分钟、10分钟、15分钟或20分钟或更多分钟。裂解的细胞可以包含至少约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。裂解的细胞可以包含至多约100000个、200000个、300000个、400000个、500000个、600000个或700000个或更多个靶核酸分子。

在细胞裂解和核酸分子从其释放之后,核酸分子可以与共定位的固体支持物的条形码随机缔合。缔合可以包括使条形码的靶识别区与靶核酸分子的互补部分杂交(例如,条形码的寡(dT)可以与靶的聚(A)尾相互作用)。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂交体。在一些实施方案中,可以将从裂解的细胞释放的核酸分子与基底上的多于一个探针缔合(例如,与基底上的探针杂交)。当探针包含寡(dT)时,可以将mRNA分子与探针杂交并且逆转录。寡核苷酸的寡(dT)部分可以充当用于cDNA分子的第一链合成的引物。例如,在图2中框216处示出的条形码化的非限制性实例中,mRNA分子可以与珠上的条形码杂交。例如,单链的核苷酸片段可以与条形码的靶结合区杂交。

附接还可以包括将条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。测定程序还可以包括用限制性酶(例如,EcoRI)处理靶核酸以产生限制性位点突出端。然后条形码可以连接至包含与限制性位点突出端互补的序列的任何核酸分子。连接酶(例如,T4 DNA连接酶)可以用于连接两个片段。

例如,在图2中框220处示出的条形码化的非限制性实例中,随后可以将来自多于一个细胞(或多于一个样品)的标记的靶(例如,靶条形码分子)汇集至例如管中。标记的靶可以通过例如回收(retrieving)条形码和/或附接靶条形码分子的珠来汇集。

可以通过使用磁珠和外部施加的磁场来实现附接的靶条形码分子的基于固体支持物的集合的回收。汇集靶条形码分子后,所有进一步的处理可以在单个反应容器中进行。进一步的处理可以包括,例如,逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。进一步的处理反应可以在微孔内进行,即,不先汇集来自多于一个细胞的标记的靶核酸分子。

本公开内容提供了使用逆转录来产生靶条形码缀合物的方法(例如,在图2的框224处)。靶条形码缀合物可以包含条形码以及靶核酸的全部或一部分的互补序列(即,条形码化的cDNA分子,诸如随机条形码化的cDNA分子)。缔合的RNA分子的逆转录可以通过添加逆转录引物连同逆转录酶而发生。逆转录引物可以是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。寡(dT)引物的长度可以是12-18个核苷酸或可以是约12-18个核苷酸,并且与哺乳动物mRNA的3’端的内源聚(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。

在一些实施方案中,标记的RNA分子的逆转录可以通过添加逆转录引物而发生。在一些实施方案中,逆转录引物是寡(dT)引物、随机六核苷酸引物或靶特异性寡核苷酸引物。通常,寡(dT)引物的长度是12个-18个核苷酸,并且与哺乳动物mRNA的3’端的内源聚(A)尾结合。随机六核苷酸引物可以在各个互补位点处与mRNA结合。靶特异性寡核苷酸引物通常选择性地引发感兴趣的mRNA。

逆转录可以重复地发生以产生多于一个标记的cDNA分子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次逆转录反应。方法可以包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次逆转录反应。

可以进行一个或更多个核酸扩增反应(例如,在图2的框228处)以产生标记的靶核酸分子的多于一个拷贝。扩增可以以多重方式进行,其中多于一个靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(如果存在的话)的至少一部分。扩增反应可以包括扩增细胞标记和/或条形码序列(例如,分子标记)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、条形码序列(例如,分子标记)、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多于一个核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或在这些值的任何两个之间的范围或数字。方法还可以包括进行一个或更多个cDNA合成反应以产生包含样品标记、细胞标记、空间标记和/或条形码序列(例如,分子标记)的靶条形码分子的一个或更多个cDNA拷贝。

在一些实施方案中,可以使用聚合酶链式反应(PCR)进行扩增。如本文使用的,PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。如本文使用的,PCR可以涵盖反应的衍生形式,包括但不限于RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR和组装PCR。

标记的核酸的扩增可以包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环至环扩增(circle-to-circle amplification)。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)和Qβ复制酶(Qβ)方法、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。在一些实施方案中,扩增不产生环化转录物。

在一些实施方案中,本文公开的方法还包括对标记的核酸(例如,标记的RNA、标记的DNA、标记的cDNA)进行聚合酶链式反应以产生标记的扩增子(例如,随机标记的扩增子)。标记的扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或条形码序列(例如,分子标记)。标记的扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本公开内容的核酸可以包括合成的或改变的核酸。

扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一个或更多个扩增反应可以包括使用一个或更多个引物。一个或更多个引物可以包含例如,1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一个或更多个引物可以包含至少1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个或15个或更多个核苷酸。一个或更多个引物可以包含少于12个-15个核苷酸。一个或更多个引物可以退火至多于一个标记的靶(例如,随机标记的靶)的至少一部分。一个或更多个引物可以退火至多于一个标记的靶的3’端或5’端。一个或更多个引物可以退火至多于一个标记的靶的内部区域。内部区域可以距多于一个标记的靶的3’端至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一个或更多个引物可以包括一组固定的引物。一个或更多个引物可以包括至少一个或更多个定制引物。一个或更多个引物可以包括至少一个或更多个对照引物。一个或更多个引物可以包括至少一个或更多个基因特异性引物。

一个或更多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或更多个定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、条形码序列(例如,分子标记)、靶或其任何组合。一个或更多个引物可以包括通用引物和定制引物。定制引物可以设计成扩增一个或更多个靶。靶可以包括一个或更多个样品中总核酸的子集。靶可以包括一个或更多个样品中总的标记的靶的子集。一个或更多个引物可以包括至少96个或更多个定制引物。一个或更多个引物可以包括至少960个或更多个定制引物。一个或更多个引物可以包括至少9600个或更多个定制引物。一个或更多个定制引物可以退火至两个或更多个不同的标记的核酸。两个或更多个不同的标记的核酸可以对应于一个或更多个基因。

可以在本公开内容的方法中使用任何扩增方案。例如,在一种方案中,第一轮PCR可以使用基因特异性引物和针对通用Illumina测序引物1序列的引物来扩增附接至珠的分子。第二轮PCR可以使用侧翼为Illumina测序引物2序列的巢式基因特异性引物和针对通用Illumina测序引物1序列的引物扩增第一PCR产物。第三轮PCR添加P5和P7以及样品索引,以使PCR产物变成Illumina测序文库。使用150bp×2测序的测序可以揭示读段1上的细胞标记和条形码序列(例如,分子标记)、读段2上的基因以及索引1读段上的样品索引。

在一些实施方案中,可以使用化学裂解将核酸从基底去除。例如,存在于核酸中的化学基团或修饰的碱基可以用于促进将核酸从固体支持物去除。例如,酶可以用于将核酸从基底去除。例如,通过限制性内切核酸酶消化可以将核酸从基底去除。例如,用尿嘧啶-d-糖基化酶(UDG)处理含dUTP或ddUTP的核酸可以将核酸从基底去除。例如,可以使用进行核苷酸切除的酶(诸如,碱基切除修复酶,诸如,无嘌呤/无嘧啶(apurinic/apyrimidinic,AP)内切核酸酶)将核酸从基底去除。在一些实施方案中,可以使用可光裂解基团以及光将核酸从基底去除。在一些实施方案中,可以使用可裂解接头将核酸从基底除。例如,可裂解接头可以包括以下中的至少一种:生物素/抗生物素蛋白、生物素/链霉抗生物素蛋白、生物素/中性抗生物素蛋白、Ig蛋白A、光不稳定型接头、酸或碱不稳定型接头基团或适配体。

当探针是基因特异性时,可以将分子与探针杂交,并且逆转录和/或扩增。在一些实施方案中,在核酸已经合成(例如,逆转录)之后,可以将其扩增。扩增可以以多重方式进行,其中多于一个靶核酸序列同时进行扩增。扩增可以将测序衔接子添加至核酸。

在一些实施方案中,可以例如用桥接扩增在基底上进行扩增。cDNA可以加同聚物尾,以便产生相容末端,用于使用基底上的寡(dT)探针进行桥接扩增。在桥接扩增中,与模板核酸的3’端互补的引物可以是共价地附接至固体颗粒的每对引物的第一引物。当包含模板核酸的样品与颗粒接触并进行单个热循环时,可以将模板分子退火至第一引物,并且第一引物通过添加核苷酸而向前延伸以形成双链体分子,所述双链体分子由模板分子和与模板互补的新形成的DNA链构成。在下一循环的加热步骤中,双链体分子可以变性,从颗粒释放模板分子,并且留下通过第一引物附接至颗粒的互补DNA链。在随后的退火和延伸步骤的退火阶段中,互补链可以与第二引物杂交,第二引物在从第一引物去除的位置处与互补链的区段互补。这种杂交可导致互补链在第一引物和第二引物之间形成桥接,通过共价键连接(secure to)第一引物并通过杂交连接第二引物。在延伸阶段,在同一反应混合物中通过添加核苷酸,第二引物可以按相反方向延伸,从而将桥转化为双链桥。然后开始下一个循环,并且双链桥可以变性以产生两个单链核酸分子,每个单链核酸分子的一个末端分别经由第一引物和第二引物附接至颗粒表面,其中每个单链核酸分子的另一个末端是未附接的。在这第二个循环的退火和延伸步骤中,每条链可以与同一的颗粒上先前未使用的另外的互补引物杂交,以形成新的单链桥。现在杂交的两个先前未使用的引物延伸从而将两个新的桥转换成双链桥。

扩增反应可以包括扩增多于一个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。

标记的核酸的扩增可以包括基于PCR的方法或非基于PCR的方法。标记的核酸的扩增可以包括对标记的核酸的指数式扩增。标记的核酸的扩增可以包括对标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(PCR)来进行。PCR可以指用于通过DNA的互补链的引物同时延伸使特定DNA序列体外扩增的反应。PCR可以涵盖反应的衍生形式,包括但不限于,RT-PCR、实时PCR、巢式PCR、定量PCR、多重PCR、数字PCR、抑制PCR、半抑制PCR以及装配PCR。

在一些实施方案中,标记的核酸的扩增包括非基于PCR的方法。非基于PCR的方法的实例包括但不限于多重置换扩增(MDA)、转录介导的扩增(TMA)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、实时SDA、滚环扩增或环至环扩增(circle-to-circleamplification)。其他非基于PCR的扩增方法包括DNA依赖性RNA聚合酶驱动的RNA转录扩增或RNA指导的DNA合成和转录的多于一个循环以扩增DNA或RNA靶、连接酶链式反应(LCR)、Qβ复制酶(Qβ)、回文探针的使用、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、使引物与核酸序列杂交并且将所得双链体在延伸反应和扩增之前裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增和分支延伸扩增(RAM)。

在一些实施方案中,本文公开的方法还包括对扩增的扩增子(例如,靶)进行巢式聚合酶链式反应。扩增子可以是双链分子。双链分子可包括双链RNA分子、双链DNA分子或者与DNA分子杂交的RNA分子。双链分子的一条或两条链可以包含样品标签或分子标识符标记。可选地,扩增子可以是单链分子。单链分子可以包括DNA、RNA或其组合。本发明的核酸可以包括合成的或改变的核酸。

在一些实施方案中,方法包括重复扩增标记的核酸以产生多于一个扩增子。本文公开的方法可以包括进行至少约1次、2次、3次、4次、5次、6次、7次、8次、9次、10次、11次、12次、13次、14次、15次、16次、17次、18次、19次或20次扩增反应。可选地,方法包括进行至少约25次、30次、35次、40次、45次、50次、55次、60次、65次、70次、75次、80次、85次、90次、95次或100次扩增反应。

扩增还可以包括将一个或更多个对照核酸添加至一个或更多个包含多于一个核酸的样品中。扩增还可以包括将一个或更多个对照核酸添加至多于一个核酸中。对照核酸可以包含对照标记。

扩增可以包括使用一种或更多种非天然核苷酸。非天然核苷酸可以包括光不稳定型和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(PNA)、吗啉代和锁核酸(LNA)以及乙二醇核酸(GNA)与苏糖核酸(TNA)。可以将非天然核苷酸添加至扩增反应的一个或更多个循环中。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一个或更多个扩增反应可以包括使用一个或更多个引物。一个或更多个引物可以包括一个或更多个寡核苷酸。一个或更多个寡核苷酸可以包含至少约7个-9个核苷酸。一个或更多个寡核苷酸可以包含少于12个-15个核苷酸。一个或更多个引物可以退火至多于一个标记的核酸的至少一部分。一个或更多个引物可以退火至多于一个标记的核酸的3’端和/或5’端。一个或更多个引物可以退火至多于一个标记的核酸的内部区域。内部区域可以距多于一个标记的核酸的3’端至少约50个、100个、150个、200个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、650个、700个、750个、800个、850个、900个或1000个核苷酸。一个或更多个引物可以包括一组固定的引物。一个或更多个引物可以包括至少一个或更多个定制引物。一个或更多个引物可以包括至少一个或更多个对照引物。一个或更多个引物可以包括至少一个或更多个管家基因引物。一个或更多个引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一个或更多个定制引物可以退火至第一样品标签、第二样品标签、分子标识符标记、核酸或它们的产物。一个或更多个引物可以包括通用引物和定制引物。定制引物可以被设计成扩增一个或更多个靶核酸。靶核酸可以包括一个或更多个样品中总核酸的子集。在一些实施方案中,引物是与本公开内容的阵列附接的探针。

在一些实施方案中,将样品中的多于一个靶条形码化(例如,随机条形码化)还包括产生条形码化靶(例如,随机条形码化靶)或靶的条形码化片段的索引文库。不同的条形码的条形码序列(例如,不同的随机条形码的分子标记)可以彼此不同。产生条形码化靶的索引文库包括从样品中的多于一个靶产生多于一个索引多核苷酸。例如,对于包括第一索引靶和第二索引靶的条形码化靶的索引文库,第一索引多核苷酸的标记区与第二索引多核苷酸的标记区可以相差以下、相差约以下、相差至少以下或相差至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。在一些实施方案中,产生条形码化靶的索引文库包括使多于一个靶(例如mRNA分子)与包含聚(T)区和标记区的多于一个寡核苷酸接触;以及使用逆转录酶进行第一链合成以产生单链标记的cDNA分子(每个包含cDNA区和标记区),其中多于一个靶包括至少两个不同序列的mRNA分子,且多于一个寡核苷酸包括至少两个不同序列的寡核苷酸。产生条形码化靶的索引文库还可以包括扩增单链标记的cDNA分子以产生双链标记的cDNA分子;以及对双链标记的cDNA分子进行巢式PCR以产生标记的扩增子。在一些实施方案中,方法可以包括产生衔接子标记的扩增子。

条形码化(例如,随机条形码化)可以包括使用核酸条形码或标签以标记单个核酸(例如,DNA或RNA)分子。在一些实施方案中,其包括从mRNA产生cDNA分子时将DNA条形码或标签添加至cDNA分子。可以进行巢式PCR以使PCR扩增偏倚最小化。可以添加用于测序(例如下一代测序(NGS))使用的衔接子。例如在图2的框232处,可以使用测序结果来确定靶的一个或更多个拷贝的细胞标记、分子标记和核苷酸片段的序列。

图3是示出了产生条形码化靶(例如,随机条形码化靶)的索引文库,诸如条形码化的mRNA或其片段的索引文库的非限制性示例性过程的示意图。如步骤1中示出的,逆转录过程可以用独特分子标记、细胞标记和通用PCR位点对每个mRNA分子进行编码。具体地,通过将一组条形码(例如,随机条形码)310与RNA分子302的聚(A)尾区308杂交(例如,随机杂交),可以将RNA分子302逆转录以产生标记的cDNA分子304(包括cDNA区306)。条形码310中的每一个可以包括靶结合区,例如聚(dT)区312、标记区314(例如,条形码序列或分子)和通用PCR区316。

在一些实施方案中,细胞标记可以包含3个至20个核苷酸。在一些实施方案中,分子标记可以包含3个至20个核苷酸。在一些实施方案中,多于一个随机条形码中的每一个还包括通用标记和细胞标记中的一个或更多个,其中通用标记对于固体支持物上的多于一个随机条形码是相同的,并且细胞标记对于固体支持物上的多于一个随机条形码是相同的。在一些实施方案中,通用标记可以包含3个至20个核苷酸。在一些实施方案中,细胞标记包含3个至20个核苷酸。

在一些实施方案中,标记区314可以包含条形码序列或分子标记318和细胞标记320。在一些实施方案中,标记区314可以包括通用标记、维度标记和细胞标记中的一个或更多个。条形码序列或分子标记318的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值的任何之间的数字或范围的核苷酸。细胞标记320的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值的任何之间的数字或范围的核苷酸。通用标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值的任何之间的数字或范围的核苷酸。通用标记可以是对于固体支持物上的多于一个随机条形码相同的,并且细胞标记是对于固体支持物上的多于一个随机条形码相同的。维度标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值的任何之间的数字或范围的核苷酸。

在一些实施方案中,标记区314可以包括以下、包括约以下、包括至少以下或包括至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个不同标记或在这些值的任何之间的数字或范围的不同标记,诸如条形码序列或分子标记318和细胞标记320。每个标记的长度可以是以下、可以是约以下、可以是至少以下或可以是至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个核苷酸或在这些值的任何之间的数字或范围的核苷酸。一组条形码或随机条形码310可以包括以下、包括约以下、包括至少以下或可以是至多以下:10个、20个、40个、50个、70个、80个、90个、10

如步骤2中示出的,来自步骤1中的逆转录过程的产物可以汇集到1个管中,且用第1PCR引物池和第1通用PCR引物进行PCR扩增。因为独特标记区314,汇集是可能的。特别地,可以将标记的cDNA分子304扩增以产生巢式PCR标记的扩增子322。扩增可以包括多重PCR扩增。扩增可以包括以单一反应体积用96种多重引物进行的多重PCR扩增。在一些实施方案中,在单一反应体积中,多重PCR扩增可以利用以下、利用约以下、利用至少以下或利用至多以下:10、20、40、50、70、80、90、10

如图3的步骤3中示出的,来自步骤2中的PCR扩增的产物可以用巢式PCR引物池和第2通用PCR引物扩增。巢式PCR可以使PCR扩增偏倚最小化。特别地,巢式PCR标记的扩增子322可通过巢式PCR进行进一步扩增。巢式PCR可以包括在单一反应体积中用巢式PCR引物332a-c的巢式PCR引物池330和第2通用PCR引物328’进行的多重PCR。巢式PCR引物池328可以包含以下、包含约以下、包含至少以下或包含至多以下:1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个不同的巢式PCR引物330或在这些值的任何之间的数字或范围的不同的巢式PCR引物330。巢式PCR引物332可以包含衔接子334,并与标记的扩增子322的cDNA部分306”内的区域杂交。通用引物328’可以包含衔接子336,并与标记的扩增子322的通用PCR区域316杂交。由此,步骤3产生衔接子标记的扩增子338。在一些实施方案中,巢式PCR引物332和第2通用PCR引物328’可以不包含衔接子334和衔接子336。相反,衔接子334和衔接子336可以连接至巢式PCR的产物以产生衔接子标记的扩增子338。

如步骤4中示出的,可以使用文库扩增引物将来自步骤3的PCR产物进行PCR扩增用于测序。特别地,可以使用衔接子334和衔接子336对衔接子标记的扩增子338进行一个或更多个另外的测定。衔接子334和衔接子336可以与引物340和引物342杂交。一个或更多个引物340和引物342可以是PCR扩增引物。一个或更多个引物340和引物342可以是测序引物。一个或更多个衔接子334和衔接子336可以用于衔接子标记的扩增子338的进一步扩增。一个或更多个衔接子334和衔接子336可以用于对衔接子标记的扩增子338测序。引物342可以包含板索引344,使得使用同一组条形码或随机条形码310产生的扩增子可以使用下一代测序(NGS)在一个测序反应中测序。

本文公开的一些实施方案提供了多于一种组合物,每一种组合物包含与寡核苷酸缀合的细胞组分结合试剂(诸如蛋白结合试剂),其中寡核苷酸包含与其缀合的细胞组分结合试剂的独特标识符。细胞组分结合试剂(诸如条形码化抗体)及其用途(诸如对细胞进行样品索引化)在美国专利申请公布第2018/0088112号和美国专利申请第15/937,713号中描述;每一项的内容通过引用以其整体并入。

在一些实施方案中,细胞组分结合试剂能够与细胞组分靶特异性结合。例如,细胞组分结合试剂的结合靶可以是以下或包括以下:糖类、脂质、蛋白、胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白、胞内蛋白或其任何组合。在一些实施方案中,细胞组分结合试剂(例如,蛋白结合试剂)能够与抗原靶或蛋白靶特异性结合。在一些实施方案中,每个寡核苷酸可以包含条形码,诸如随机条形码。条形码可以包含条形码序列(例如,分子标记)、细胞标记、样品标记或其任何组合。在一些实施方案中,每个寡核苷酸可以包含接头。在一些实施方案中,每个寡核苷酸可以包含寡核苷酸探针的结合位点,诸如聚(A)尾。例如,聚(A)尾可以例如未锚定至固体支持物上或锚定至固体支持物。聚(A)尾的长度可以是约10个至50个核苷酸。在一些实施方案中,聚(A)尾的长度可以是18个核苷酸。寡核苷酸可以包括脱氧核糖核苷酸、核糖核苷酸或两者。

独特标识符可以是,例如,具有任何合适长度例如约4个核苷酸至约200个核苷酸的核苷酸序列。在一些实施方案中,独特标识符是长度为25个核苷酸至约45个核苷酸的核苷酸序列。在一些实施方案中,独特标识符可以具有是以下、是约以下、小于以下、大于以下的长度:4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸或在以上值的任何两个之间的范围。

在一些实施方案中,独特标识符选自不同组的独特标识符。不同组的独特标识符可以包括以下或包括约以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、5000个不同的独特标识符或在这些值的任何两个之间的数字或范围的不同的独特标识符。不同组的独特标识符可以包括至少以下或包括至多以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个或5000个不同的独特标识符。在一些实施方案中,独特标识符的组被设计成与待分析的样品的DNA或RNA序列具有最小的序列同源性。在一些实施方案中,独特标识符的组的序列或其互补序列彼此相差以下或相差约以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸或在这些值的任何两个之间的数字或范围。在一些实施方案中,独特标识符的组的序列或其互补序列彼此相差至少以下或相差至多以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸。在一些实施方案中,独特标识符的组的序列或其互补序列序列彼此相差至少3%、至少5%、至少8%、至少10%、至少15%、至少20%或更多。

在一些实施方案中,独特标识符可以包含引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包含至少两个引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包含至少三个引物(诸如通用引物)的结合位点。引物可以用于例如通过PCR扩增来扩增独特标识符。在一些实施方案中,引物可以用于巢式PCR反应。

本公开内容中设想了任何合适的细胞组分结合试剂,诸如蛋白结合试剂、抗体或其片段、适配体、小分子、配体、肽、寡核苷酸等或其任何组合。在一些实施方案中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(sc-Ab)或它们的片段,诸如Fab、Fv等。在一些实施方案中,多于一种细胞组分结合试剂可以包括以下或包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种不同的细胞组分试剂或在这些值的任何两个值之间的数字或范围的不同的细胞组分试剂。在一些实施方案中,多于一种细胞组分结合试剂可以包括至少以下或包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的细胞组分试剂。

寡核苷酸可以与细胞组分结合试剂通过各种机制缀合。在一些实施方案中,寡核苷酸可以与细胞组分结合试剂共价地缀合。在一些实施方案中,寡核苷酸可以与细胞组分结合试剂非共价地缀合。在一些实施方案中,寡核苷酸与细胞组分结合试剂通过接头缀合。接头可以是例如可从细胞组分结合试剂和/或寡核苷酸裂解或解离的。在一些实施方案中,接头可以包含将寡核苷酸与细胞组分结合试剂可逆地附接的化学基团。化学基团可以与接头例如通过胺基团缀合。在一些实施方案中,接头可以包含与缀合至细胞组分结合试剂的另一个化学基团形成稳定的键的化学基团。例如,化学基团可以是可UV光裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺等。在一些实施方案中,化学基团可以与细胞组分结合试剂通过氨基酸(诸如赖氨酸)或N末端上的伯胺缀合。可以使用商购可得的缀合试剂盒,诸如Protein-Oligo缀合试剂盒(Solulink,Inc.,San Diego,California)、

寡核苷酸可以与细胞组分结合试剂(例如,蛋白结合试剂)的任何合适的位点缀合,条件为寡核苷酸不干扰细胞组分结合试剂与其细胞组分靶之间的特异性结合。在一些实施方案中,细胞组分结合试剂是蛋白,诸如抗体。在一些实施方案中,细胞组分结合试剂不是抗体。在一些实施方案中,寡核苷酸可以与抗体的抗原结合位点之外的任何处缀合,例如Fc区、C

在一些实施方案中,多于一个细胞组分结合试剂能够与样品(诸如单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等)中的多于一种细胞组分靶特异性结合。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括胞内细胞组分。在一些实施方案中,多于一种细胞组分靶可以包括胞外细胞组分。在一些实施方案中,多于一种细胞组分可以是以下或可以是约以下:细胞或生物体中所有细胞组分(例如,蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分可以是至少以下或可以是至多以下:细胞或生物体中所有细胞组分(例如蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%。在一些实施方案中,多于一种细胞组分靶可以包括以下或可以包括约以下:2、3、4、5、10、20、30、40、50、100、1000、10000种或在这些值的任何两个之间的数字或范围的不同的细胞组分靶。在一些实施方案中,多于一种细胞组分靶可以包括至少以下或可以包括至多以下:2、3、4、5、10、20、30、40、50、100、1000、10000种不同的细胞组分靶。

图4示出了与包含抗体的独特标识符序列的寡核苷酸缔合(例如,缀合)的示例性细胞组分结合试剂(例如,抗体)的示意图。与细胞组分结合试剂缀合的寡核苷酸、用于与细胞组分结合试剂缀合的寡核苷酸或先前与细胞组分结合试剂缀合的寡核苷酸在本文可以被称为抗体寡核苷酸(缩写为结合试剂寡核苷酸)。与抗体缀合的寡核苷酸、用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸在本文可以被称为抗体寡核苷酸(缩写为“AbOligo”或“AbO”)。寡核苷酸还可以包含另外的组分,所述另外的组分包括但不限于一个或更多个接头、一个或更多个抗体的独特标识符、任选地一个或更多个条形码序列(例如,分子标记)和聚(dA)尾。在一些实施方案中,寡核苷酸可以从5’至3’包含接头、独特标识符、条形码序列(例如,分子标记)和聚(dA)尾。抗体寡核苷酸可以是mRNA模拟物。

图5示出了与包含抗体的独特标识符序列的寡核苷酸缔合(例如,缀合)的示例性细胞组分结合试剂(例如,抗体)的示意图。细胞组分结合试剂可以能够与至少一种细胞组分靶(诸如抗原靶或蛋白靶)特异性结合。结合试剂寡核苷酸(例如,样品索引寡核苷酸或抗体寡核苷酸)可以包含用于进行本公开内容方法的序列(例如,样品索引序列)。例如,样品索引寡核苷酸可以包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列。包含细胞组分结合试剂的多于一种组合物中的包含两种细胞组分结合试剂的至少两种组合物(例如,样品索引组合物)的索引序列(例如,样品索引序列)可以包含不同的序列。在一些实施方案中,结合试剂寡核苷酸与物种的基因组序列不同源。结合试剂寡核苷酸可以被配置为(或可以)可从细胞组分结合试剂解离或不可从细胞组分结合试剂解离。

与细胞组分结合试剂缀合的寡核苷酸可以例如包含条形码序列(例如,分子标记序列)、聚(dA)尾或其组合。与细胞组分结合试剂缀合的寡核苷酸可以是mRNA模拟物。在一些实施方案中,样品索引寡核苷酸包含与多于一个条形码中的至少一个条形码的捕获序列互补的序列。条形码的靶结合区可以包含捕获序列。靶结合区可以例如包含聚(dT)区。在一些实施方案中,与条形码的捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)尾。样品索引寡核苷酸可以包含分子标记。

在一些实施方案中,结合试剂寡核苷酸(例如,样品寡核苷酸)包含长度为以下的核苷酸序列或长度为约以下的核苷酸序列:6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、110个、120个、128个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、610个、620个、630个、640个、650个、660个、670个、680个、690个、700个、710个、720个、730个、740个、750个、760个、770个、780个、790个、800个、810个、820个、830个、840个、850个、860个、870个、880个、890个、900个、910个、920个、930个、940个、950个、960个、970个、980个、990个、1000个核苷酸或在这些值的任何两个之间的数字或范围的核苷酸。在一些实施方案中,结合试剂寡核苷酸包含长度为至少以下或长度为至多以下的核苷酸序列:6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、25个、30个、35个、40个、45个、50个、60个、70个、80个、90个、100个、110个、120个、128个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个、240个、250个、260个、270个、280个、290个、300个、310个、320个、330个、340个、350个、360个、370个、380个、390个、400个、410个、420个、430个、440个、450个、460个、470个、480个、490个、500个、510个、520个、530个、540个、550个、560个、570个、580个、590个、600个、610个、620个、630个、640个、650个、660个、670个、680个、690个、700个、710个、720个、730个、740个、750个、760个、770个、780个、790个、800个、810个、820个、830个、840个、850个、860个、870个、880个、890个、900个、910个、920个、930个、940个、950个、960个、970个、980个、990个或1000个核苷酸。

在一些实施方案中,细胞组分结合试剂包括抗体、四聚体、适配体、蛋白支架或其组合。结合试剂寡核苷酸可以与细胞组分结合试剂例如通过接头缀合。结合试剂寡核苷酸可以包含接头。接头可以包含化学基团。化学基团可以与细胞组分结合试剂的分子可逆地或不可逆地附接。化学基团可以选自由以下组成的组:可UV光裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺及其任何组合。

在一些实施方案中,细胞组分结合试剂可以与ADAM10、CD156c、ANO6、ATP1B2、ATP1B3、BSG、CD147、CD109、CD230、CD29、CD298、ATP1B3、CD44、CD45、CD47、CD51、CD59、CD63、CD97、CD98、SLC3A2、CLDND1、HLA-ABC、ICAM1、ITFG3、MPZL1、NA K ATP酶α1、ATP1A1、NPTN、PMCA ATP酶、ATP2B1、SLC1A5、SLC29A1、SLC2A1、SLC44A2或其任何组合结合。

在一些实施方案中,蛋白靶是以下或包括以下:胞外蛋白、胞内蛋白或其任何组合。在一些实施方案中,抗原或蛋白靶是以下或包括以下:细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白或其任何组合。抗原或蛋白靶可以是以下或包括以下:脂质、糖类或其任何组合。蛋白靶可以选自包括许多蛋白靶的组。抗原靶或蛋白靶的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或在这些值的任何两个之间的数字或范围。蛋白靶的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000。

细胞组分结合试剂(例如,蛋白结合试剂)可以与具有相同序列的两个或更多个结合试剂寡核苷酸(例如,样品索引寡核苷酸)缔合。细胞组分结合试剂可以与具有不同序列的两个或更多个结合试剂寡核苷酸缔合。在不同实施方式中,与细胞组分结合试剂缔合的结合试剂寡核苷酸的数目可以不同。在一些实施方案中,结合试剂寡核苷酸的数目,无论具有相同序列还是不同序列,可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,结合试剂寡核苷酸的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。

包含细胞组分结合试剂的多于一种组合物(例如,多于一种样品索引组合物)可以包含一种或更多种未与结合试剂寡核苷酸(诸如样品索引寡核苷酸)缀合的另外的细胞组分结合试剂,其在本文也被称为不含结合试剂寡核苷酸的细胞组分结合试剂(诸如不含样品索引寡核苷酸的细胞组分结合试剂)。在不同实施方式中,多于一种组合物中的另外的细胞组分结合试剂的数目可以不同。在一些实施方案中,另外的细胞组分结合试剂的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,另外的细胞组分结合试剂的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100。在一些实施方案中,细胞组分结合试剂和任何另外的细胞组分结合试剂可以是相同的。

在一些实施方案中,提供了包含与一个或更多个结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的细胞组分结合试剂和未与结合试剂寡核苷酸缀合的细胞组分结合试剂的混合物。混合物可以用于本文公开的方法的一些实施方案中,例如,接触样品和/或细胞。在不同实施方式中,混合物中(1)与结合试剂寡核苷酸缀合的细胞组分结合试剂的数目与(2)未与结合试剂寡核苷酸(例如,样品索引寡核苷酸)或其他结合试剂寡核苷酸缀合的另一种细胞组分结合试剂(例如,相同的细胞组分结合试剂)的数目的比例可以是不同的。在一些实施方案中,比例可以是以下或可以是约以下:1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000、1:10000或在所述值的任何两个之间的数字或范围。在一些实施方案中,比例可以是至少以下或可以是至多以下:1:1、1:1.1、1:1.2、1:1.3、1:1.4、1:1.5、1:1.6、1:1.7、1:1.8、1:1.9、1:2、1:2.5、1:3、1:4、1:5、1:6、1:7、1:8、1:9、1:10、1:11、1:12、1:13、1:14、1:15、1:16、1:17、1:18、1:19、1:20、1:21、1:22、1:23、1:24、1:25、1:26、1:27、1:28、1:29、1:30、1:31、1:32、1:33、1:34、1:35、1:36、1:37、1:38、1:39、1:40、1:41、1:42、1:43、1:44、1:45、1:46、1:47、1:48、1:49、1:50、1:51、1:52、1:53、1:54、1:55、1:56、1:57、1:58、1:59、1:60、1:61、1:62、1:63、1:64、1:65、1:66、1:67、1:68、1:69、1:70、1:71、1:72、1:73、1:74、1:75、1:76、1:77、1:78、1:79、1:80、1:81、1:82、1:83、1:84、1:85、1:86、1:87、1:88、1:89、1:90、1:91、1:92、1:93、1:94、1:95、1:96、1:97、1:98、1:99、1:100、1:200、1:300、1:400、1:500、1:600、1:700、1:800、1:900、1:1000、1:2000、1:3000、1:4000、1:5000、1:6000、1:7000、1:8000、1:9000或1:10000。

在一些实施方案中,比例可以是以下或可以是约以下:1:1、1.1:1、1.2:1、1.3:1、1.4:1、1.5:1、1.6:1、1.7:1、1.8:1、1.9:1、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、3000:1、4000:1、5000:1、6000:1、7000:1、8000:1、9000:1、10000:1或在所述值的任何两个之间的数字或范围。在一些实施方案中,比例可以是至少以下或可以是至多以下:1:1、1.1:1、1.2:1、1.3:1、1.4:1、1.5:1、1.6:1、1.7:1、1.8:1、1.9:1、2:1、2.5:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1、11:1、12:1、13:1、14:1、15:1、16:1、17:1、18:1、19:1、20:1、21:1、22:1、23:1、24:1、25:1、26:1、27:1、28:1、29:1、30:1、31:1、32:1、33:1、34:1、35:1、36:1、37:1、38:1、39:1、40:1、41:1、42:1、43:1、44:1、45:1、46:1、47:1、48:1、49:1、50:1、51:1、52:1、53:1、54:1、55:1、56:1、57:1、58:1、59:1、60:1、61:1、62:1、63:1、64:1、65:1、66:1、67:1、68:1、69:1、70:1、71:1、72:1、73:1、74:1、75:1、76:1、77:1、78:1、79:1、80:1、81:1、82:1、83:1、84:1、85:1、86:1、87:1、88:1、89:1、90:1、91:1、92:1、93:1、94:1、95:1、96:1、97:1、98:1、99:1、100:1、200:1、300:1、400:1、500:1、600:1、700:1、800:1、900:1、1000:1、2000:1、3000:1、4000:1、5000:1、6000:1、7000:1、8000:1、9000:1或10000:1。

细胞组分结合试剂可以与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合,也可以不与其缀合。在一些实施方案中,在包含与结合试剂寡核苷酸缀合的细胞组分结合试剂和未与结合试剂寡核苷酸缀合的细胞组分结合试剂的混合物中,与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的细胞组分结合试剂的百分比可以是以下或可以是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,混合物中与样品索引寡核苷酸缀合的细胞组分缀合试剂的百分比可以是至少以下或可以是至多以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

在一些实施方案中,在包含与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的细胞组分结合试剂和未与样品索引寡核苷酸缀合的细胞组分结合试剂的混合物中,未与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缀合的细胞组分结合试剂的百分比可以是以下或可以是约以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,混合物中未与结合试剂寡核苷酸缀合的细胞组分结合试剂的百分比可以是至少以下或可以是至多以下:0.000000001%、0.00000001%、0.0000001%、0.000001%、0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

在一些实施方案中,细胞组分结合试剂的混合物(例如,抗体混合物)可以用于增加本文公开的方法中的标记灵敏度。不受任何特定理论限制,认为这可能是因为细胞组分表达或蛋白表达可以在细胞类型和细胞状态之间不同,使得寻找标记所有细胞类型的通用细胞组分结合试剂或抗体具有挑战性。例如,细胞组分结合试剂的混合物可以用于允许对更多样品类型进行更灵敏和更有效的标记。细胞组分结合试剂的混合物可以包括两种或更多种不同类型的细胞组分结合试剂,例如更宽范围的细胞组分结合试剂或抗体。标记不同细胞组分靶的细胞组分结合试剂可以汇集在一起以产生足以标记所有细胞类型或者一种或更多种感兴趣的细胞类型的混合物。

在一些实施方案中,多于一种组合物(例如,样品索引组合物)中的每一种包含细胞组分结合试剂。在一些实施方案中,多于一种组合物中的组合物包含两种或更多种细胞组分结合试剂,其中两种或更多种细胞组分结合试剂中的每一种都与结合试剂寡核苷酸(例如,样品索引寡核苷酸)缔合,其中两种或更多种细胞组分结合试剂中的至少一种能够与一种或更多种细胞组分靶中的至少一种特异性结合。与两种或更多种细胞组分结合试剂缔合的结合试剂寡核苷酸的序列可以是相同的。与两种或更多种细胞组分结合试剂缔合的结合试剂寡核苷酸的序列可以包含不同的序列。多于一种组合物中的每一种可以包含两种或更多种细胞组分结合试剂。

在不同实施方式中,组合物中不同类型的细胞组分结合试剂(例如,CD147抗体和CD47抗体)的数目可以是不同的。具有两种或更多种不同类型的细胞组分结合试剂的组合物在本文可以被称为细胞组分结合试剂混合物(例如,样品索引组合物混合物)。混合物中不同类型的细胞组分结合试剂的数目可以不同。在一些实施方案中,混合物中不同类型的细胞组分结合试剂的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或在这些值的任何两个之间的数字或范围。在一些实施方案中,混合物中不同类型的细胞组分结合试剂的数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000或100000。不同类型的细胞组分结合试剂可以与具有相同或不同序列(例如,样品索引序列)的结合试剂寡核苷酸缀合。

在一些实施方案中,本文公开的方法还可以用于使用本文公开的组合物和寡核苷酸探针对样品中的多于一种细胞组分靶(例如,蛋白靶)进行定量分析,所述寡核苷酸探针可以将条形码序列(例如,分子标记序列)与细胞组分结合试剂(例如,蛋白结合试剂)的寡核苷酸缔合。细胞组分结合试剂的寡核苷酸可以是以下或可以包括以下:抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等。在一些实施方案中,样品可以是单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,样品可以包括细胞类型(诸如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞等)的混合物或来自不同受试者的细胞的混合物。

在一些实施方案中,样品可以包括被分开到单独区室诸如微孔阵列的微孔或液滴中的多于一个单细胞。

在一些实施方案中,多于一种细胞组分靶(即,细胞组分靶)的结合靶可以是以下或可以包括以下:糖类、脂质、蛋白、胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、整联蛋白、胞内蛋白或其任何组合。在一些实施方案中,细胞组分靶是蛋白靶。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括胞内细胞组分。在一些实施方案中,多于一种细胞组分可以是生物体中所有编码的细胞组分的至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或更多。在一些实施方案中,多于一种细胞组分靶可以包括至少2、至少3、至少4、至少5、至少10、至少20、至少30、至少40、至少50、至少100、至少1000、至少10000种或更多种不同的细胞组分靶。

在一些实施方案中,使多于一种细胞组分结合试剂与样品接触,以便与多于一种细胞组分靶特异性结合。未结合的细胞组分结合试剂可以例如通过洗涤来去除。在样品包括细胞的实施方案中,可以去除任何未与细胞特异性结合的细胞组分结合试剂。

在一些情况下,来自细胞群体的细胞可以被分开(例如,分离)到本公开内容的基底的孔中。细胞群体可以在分开之前被稀释。细胞群体可以被稀释,使得至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的基底孔接收单细胞。细胞群体可以被稀释,使得至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的基底孔接收单细胞。细胞群体可以被稀释,使得稀释的群体中的细胞数目是以下或是至少以下:基底上孔数目的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。细胞群体可以被稀释,使得稀释的群体中的细胞数目是以下或是至多以下:基底上孔数目的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,细胞群体被稀释,使得细胞数目是基底中孔数目的约10%。

单细胞在基底孔中的分布可以遵循泊松分布。例如,基底孔具有多于一个细胞的概率可以是至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更高。基底孔具有多于一个细胞的概率可以是至多0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更高。单细胞在基底孔中的分布可以是随机的。单细胞在基底孔中的分布可以是非随机的。细胞可以被分开,使得基底孔仅接收一个细胞。

在一些实施方案中,细胞组分结合试剂可以另外地与荧光分子缀合,以使得细胞能够流式分选(flow sorting)到单独区室中。

在一些实施方案中,本文公开的方法提供了使多于一种组合物与样品接触,以便与多于一种细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂(例如,抗体)与细胞组分靶特异性结合。在接触步骤之后,可以去除未结合的组合物。例如,在样品包括细胞并且组合物与是细胞表面细胞组分(诸如细胞表面蛋白)的细胞组分靶特异性结合的实施方案中,未结合的组合物可以通过用缓冲液洗涤细胞来去除,使得仅与细胞组分靶特异性结合的组合物与细胞一起保留。

在一些实施方案中,本文公开的方法可以包括将寡核苷酸(例如,条形码或随机条形码)(包含条形码序列(诸如分子标记)、细胞标记、样品标记等或其任何组合)缔合到与细胞组分结合试剂缔合的多于一个寡核苷酸。例如,包含条形码的多于一个寡核苷酸探针可以用于与组合物的多于一个寡核苷酸杂交。

在一些实施方案中,多于一个寡核苷酸探针可以被固定在固体支持物上。固体支持物可以是自由浮动的,例如溶液中的珠。固体支持物可以被包埋到半固体或固体阵列中。在一些实施方案中,多于一个寡核苷酸探针可以不被固定在固体支持物上。当多于一个寡核苷酸探针非常接近细胞组分结合试剂的多于一个寡核苷酸时,细胞组分结合试剂的多于一个寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以按不可耗尽的比例接触,使得细胞组分结合试剂的每个不同的寡核苷酸可以与本公开内容的具有不同条形码序列(例如,分子标记)的寡核苷酸探针缔合。

在一些实施方案中,本文公开的方法提供了寡核苷酸从与细胞组分靶特异性结合的细胞组分结合试剂的解离。解离可以以各种方式进行,以将化学基团从细胞组分结合试剂分开,所述各种方式诸如可UV光裂解、化学处理(例如,二硫苏糖醇处理)、加热、酶处理或其任何组合。将寡核苷酸从细胞组分结合试剂解离可以在将多于一个寡核苷酸探针与组合物中的多于一个寡核苷酸杂交的步骤之前、之后或期间进行。

在一些实施方案中,本文公开的方法还可以用于使用本文公开的组合物和寡核苷酸探针对样品中的多于一种细胞组分靶(例如,蛋白靶)和多于一种核酸靶分子进行同时定量分析,所述寡核苷酸探针可以将条形码序列(例如,分子标记序列)与细胞组分结合试剂的寡核苷酸和核酸靶分子两者缔合。同时定量分析多于一种细胞组分靶和多于一种核酸靶分子的其他方法在2017年9月25日提交的美国专利申请第15/715028号中描述;其内容通过引用以其整体并入本文。在一些实施方案中,样品可以是单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,样品可以包括细胞类型(诸如正常细胞、肿瘤细胞、血细胞、B细胞、T细胞、母体细胞、胎儿细胞)的混合物或来自不同受试者的细胞的混合物。

在一些实施方案中,样品可以包括被分开到单独区室诸如微孔阵列的微孔中的多于一个单细胞。

在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括胞内细胞组分。在一些实施方案中,多于一种细胞组分可以是以下或可以是约以下:生物体或生物体的一个或更多个细胞中所有细胞组分(诸如表达的蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分可以是至少以下或可以是至多以下:生物体或生物体的一个或更多个细胞中所有细胞组分(诸如可以被表达的蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%。在一些实施方案中,多于一种细胞组分靶可以包括以下或可以包括约以下:2、3、4、5、10、20、30、40、50、100、1000、10000种或在这些值的任何两个之间的数字或范围的不同的细胞组分靶。在一些实施方案中,多于一种细胞组分靶可以包括至少以下或可以包括至多以下:2、3、4、5、10、20、30、40、50、100、1000或10000种不同的细胞组分靶。

在一些实施方案中,使多于一种细胞组分结合试剂与样品接触,以便与多于一种细胞组分靶特异性结合。未结合的细胞组分结合试剂可以例如通过洗涤来去除。在样品包括细胞的实施方案中,可以去除任何未与细胞特异性结合的细胞组分结合试剂。

在一些情况下,来自细胞群体的细胞可以被分开(例如,分离)到本公开内容的基底的孔中。细胞群体可以在分开之前被稀释。细胞群体可以被稀释,使得至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的基底孔接收单细胞。细胞群体可以被稀释,使得至多1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的基底孔接收单细胞。细胞群体可以被稀释,使得稀释的群体中的细胞数目是以下或是至少以下:基底上孔数目的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。细胞群体可以被稀释,使得稀释的群体中的细胞数目是以下或是至多以下:基底上孔数目的1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%。在一些情况下,细胞群体被稀释,使得细胞数目是基底中孔数目的约10%。

单细胞在基底孔中的分布可以遵循泊松分布。例如,基底孔具有多于一个细胞的概率可以是至少0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更高。基底孔具有多于一个细胞的概率可以是至多0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%或10%或更高。单细胞在基底孔中的分布可以是随机的。单细胞在基底孔中的分布可以是非随机的。细胞可以被分开,使得基底孔仅接收一个细胞。

在一些实施方案中,细胞组分结合试剂可以另外地与荧光分子缀合,以使得细胞能够流式分选到单独区室中。

在一些实施方案中,本文公开的方法提供了使多于一种组合物与样品接触,以便与多于一种细胞组分靶特异性结合。应当理解,所使用的条件可以允许细胞组分结合试剂(例如,抗体)与细胞组分靶特异性结合。在接触步骤之后,可以去除未结合的组合物。例如,在样品包括细胞并且组合物特异性结合的细胞组分靶在细胞表面上(诸如细胞表面蛋白)的实施方案中,未结合的组合物可以通过用缓冲液洗涤细胞来去除,使得仅与细胞组分靶特异性结合的组合物与细胞一起保留。

在一些实施方案中,本文公开的方法可以提供从样品(例如,细胞)中释放多于一个核酸靶分子。例如,可以裂解细胞以释放多于一个核酸靶分子。细胞裂解可以通过各种手段中的任何一种来完成,例如,通过化学处理、渗透冲击、热处理、机械处理、光学处理或其任何组合。可以通过添加包含去污剂(例如,SDS、十二烷基硫酸锂、Triton X-100、Tween-20或NP-40)、有机溶剂(例如,甲醇或丙酮)或消化酶(例如,蛋白酶K、胃蛋白酶或胰蛋白酶)或其任何组合的细胞裂解缓冲液来裂解细胞。

本领域普通技术人员应该理解,多于一个核酸分子可以包括各种核酸分子。在一些实施方案中,多于一个核酸分子可以包括DNA分子、RNA分子、基因组DNA分子、mRNA分子、rRNA分子、siRNA分子或其组合,并且可以是双链或单链的。在一些实施方案中,多于一个核酸分子包括以下或包括约以下:100、1000、10000、20000、30000、40000、50000、100000、1000000种或在这些值的任何两个之间的数字或范围的物质。在一些实施方案中,多于一个核酸分子包括至少以下或包括至多以下:100、1000、10000、20000、30000、40000、50000、100000或1000000种物质。在一些实施方案中,多于一个核酸分子可以来自样品,诸如单细胞或多于一个细胞。在一些实施方案中,多于一个核酸分子可以从多于一个样品诸如多于一个单细胞中汇集。

在一些实施方案中,本文公开的方法可以包括将条形码(例如,随机条形码)(其可以包含条形码序列(诸如分子标记)、细胞标记、样品标记等或其任何组合)与多于一个核酸靶分子和细胞组分结合试剂的多于一个寡核苷酸缔合。例如,包含随机条形码的多于一个寡核苷酸探针可以用于与多于一个核酸靶分子和组合物的多于一个寡核苷酸杂交。

在一些实施方案中,多于一个寡核苷酸探针可以被固定在固体支持物上。固体支持物可以是自由浮动的,例如溶液中的珠。固体支持物可以被包埋到半固体或固体阵列中。在一些实施方案中,多于一个寡核苷酸探针可以不被固定在固体支持物上。当多于一个寡核苷酸探针与多于一个核酸靶分子和细胞组分结合试剂的多于一个寡核苷酸非常接近时,多于一个核酸靶分子和细胞组分结合试剂的多于一个寡核苷酸可以与寡核苷酸探针杂交。寡核苷酸探针可以按不可耗尽的比例接触,使得每个不同的核酸靶分子和细胞组分结合试剂的寡核苷酸可以与本公开内容的具有不同条形码序列(例如,分子标记)的寡核苷酸探针缔合。

在一些实施方案中,本文公开的方法提供了寡核苷酸从与细胞组分靶特异性结合的细胞组分结合试剂的解离。解离可以以各种方式进行,以将化学基团从细胞组分结合试剂分开,所述各种方式诸如可UV光裂解、化学处理(例如,二硫苏糖醇处理)、加热、酶处理或其任何组合。将寡核苷酸从细胞组分结合试剂解离可以在将多于一个寡核苷酸探针与多于一个核酸靶分子和组合物中的多于一个寡核苷酸杂交的步骤之前、之后或期间进行。

在一些实施方案中,本文公开的方法也可以用于多于一种类型靶分子例如蛋白和核酸靶的同时定量分析。例如,靶分子可以是或包括细胞组分。图6示出了在单细胞中同时定量分析核酸靶和其他细胞组分靶(例如,蛋白)的示例性方法的示意图。在一些实施方案中,提供了各自包含细胞组分结合试剂诸如抗体的多于一种组合物605a、605b、605c等。与不同的细胞组分靶结合的不同的细胞组分结合试剂诸如抗体与不同的独特标识符缀合。接下来,可以将细胞组分结合试剂与包含多于一个细胞的样品610一起孵育。不同的细胞组分结合试剂可以与细胞表面上的细胞组分(诸如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合)特异性结合。可以将未结合的细胞组分结合试剂去除,例如,通过用缓冲液洗涤细胞去除。然后,可以将带有细胞组分结合试剂的细胞分开到多于一个区室(诸如微孔阵列的微孔或乳液的液滴)中,其中单个区室615的尺寸适合于单细胞和单个珠620。每个珠可以包含多于一个寡核苷酸探针,所述寡核苷酸探针可以包含条形码序列(例如,分子标记序列)以及珠上所有寡核苷酸探针共有的细胞标记。在一些实施方案中,每个寡核苷酸探针可以包含靶结合区,例如,聚(dT)序列。与细胞组分结合试剂缀合的寡核苷酸625可以使用化学手段、光学手段或其他手段从细胞组分结合试剂解离。可以裂解细胞635以释放细胞内的核酸,诸如基因组DNA或细胞mRNA 630。细胞mRNA 630、寡核苷酸625或两者都可以被珠620上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交捕获。可以使用逆转录酶以使用细胞mRNA 630和寡核苷酸625作为模板延伸与细胞mRNA 630和寡核苷酸625杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以经历扩增和测序。测序读段可以经历序列的去多重化(demultiplex)或细胞标记、条形码(例如,分子标记)、基因、细胞组分结合试剂特异性寡核苷酸(例如,抗体特异性寡核苷酸)等的鉴定,这可以产生样品中每个单细胞的细胞组分和基因表达的数字表示。

与细胞组分结合试剂(例如,抗原结合试剂或蛋白结合试剂)和/或核酸分子缔合的寡核苷酸可以与寡核苷酸探针(例如,条形码,诸如随机条形码)随机缔合。与细胞组分结合试剂缔合的寡核苷酸,在本文被称为结合试剂寡核苷酸,可以是或包括本公开内容的寡核苷酸,诸如抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等。例如,缔合可以包括寡核苷酸探针的靶结合区与靶核酸分子的互补部分和/或蛋白结合试剂的寡核苷酸的互补部分的杂交。例如,条形码(例如,随机条形码)的寡(dT)区可以与靶核酸分子的聚(A)尾和/或蛋白结合试剂的寡核苷酸的聚(dA)尾相互作用。可以选择用于杂交的测定条件(例如,缓冲液pH、离子强度、温度等)以促进形成特定的稳定的杂交体。

本公开内容提供了使用逆转录将分子标记与靶核酸和/或细胞组分结合试剂缔合的寡核苷酸缔合的方法。作为逆转录酶,可以使用RNA和DNA两者作为模板。例如,细胞组分结合试剂上最初缀合的寡核苷酸可以是RNA碱基或DNA碱基或两者。除了结合试剂序列的序列或其一部分之外,结合试剂寡核苷酸可以被拷贝并连接(例如,共价地连接)至细胞标记和条形码序列(例如,分子标记)。作为另一种实例,除了mRNA分子的序列或其一部分之外,mRNA分子可以被拷贝并连接(例如,共价地连接)至细胞标记和条形码序列(例如,分子标记)。

在一些实施方案中,分子标记可以通过连接寡核苷酸探针靶结合区和靶核酸分子的一部分和/或与细胞组分结合试剂缔合(例如,当前或先前缔合)的寡核苷酸来添加。例如,靶结合区可以包含可以能够与限制性位点突出端(例如,EcoRI粘性末端突出端)特异性杂交的核酸序列。该方法还可以包括用限制性酶(例如,EcoRI)处理靶核酸和/或与细胞组分结合试剂缔合的寡核苷酸以产生产生限制性位点突出端。连接酶(例如,T4 DNA连接酶)可以用于连接两个片段。

在一些实施方案中,本文公开的方法包括确定每个独特标识符、每个核酸靶分子和/或每个结合试剂寡核苷酸(例如,抗体寡核苷酸)的独特分子标记序列的数目或存在。例如,测序读段可以用于确定每个独特标识符、每个核酸靶分子和/或每个结合试剂寡核苷酸的独特分子标记序列的数目。作为另一种实例,测序读段可以用于确定分子标记序列的存在或不存在(诸如与靶缔合的分子标记序列、结合试剂寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸、相互作用确定寡核苷酸等在测序读段中的存在或不存在)。

在一些实施方案中,每个独特标识符、每个核酸靶分子和/或每个结合试剂寡核苷酸的独特分子标记序列的数目指示样品中每种细胞组分靶(例如,抗原靶或蛋白靶)和/或每种核酸靶分子的量。在一些实施方案中,细胞组分靶的量与其对应的核酸靶分子(例如,mRNA分子)的量可以相互比较。在一些实施方案中,可以计算细胞组分靶的量与其对应的核酸靶分子(例如,mRNA分子)的量的比率。细胞组分靶可以是,例如,细胞表面蛋白标志物。在一些实施方案中,细胞表面蛋白标志物的蛋白水平与细胞表面蛋白标志物的mRNA水平之间的比率是低的。

本文公开的方法可以用于各种应用。例如,本文公开的方法可以用于样品的蛋白质组和/或转录物组分析。在一些实施方案中,本文公开的方法可以用于鉴定样品中的细胞组分靶和/或核酸靶,即,生物标志物。在一些实施方案中,细胞组分靶和核酸靶彼此对应,即,核酸靶编码细胞组分靶。在一些实施方案中,本文公开的方法可以用于鉴定样品中细胞组分靶的量与其对应的核酸靶分子(例如,mRNA分子)的量之间具有期望的比率的细胞组分靶。在一些实施方案中,比率是以下或是约以下:0.001、0.01、0.1、1、10、100、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,比率是至少以下或是至多以下:0.001、0.01、0.1、1、10、100或1000。在一些实施方案中,本文公开的方法可以用于鉴定样品中的细胞组分靶,样品中细胞组分靶对应的核酸靶分子的数量是以下或是约以下:1000、100、10、5、2、1、0或在这些值的任何两个之间的数字或范围。在一些实施方案中,本文公开的方法可以用于鉴定样品中的细胞组分靶,样品中细胞组分靶对应的核酸靶分子的数量多于以下或小于以下:1000、100、10、5、2、1或0。

本文公开的一些实施方案提供了用于同时定量分析样品中多于一种细胞组分(例如,蛋白)和/或多于一种核酸靶分子的试剂盒和组合物。在一些实施方案中,试剂盒和组合物可以包含各自与寡核苷酸缀合的多于一种细胞组分结合试剂(例如,多于一种蛋白结合试剂)(其中寡核苷酸包含细胞组分结合试剂的独特标识符)和多于一个寡核苷酸探针,其中多于一个寡核苷酸探针的每一个包含靶结合区、条形码序列(例如,分子标记序列),其中条形码序列来自不同组的独特条形码序列。在一些实施方案中,每个寡核苷酸可以包含分子标记、细胞标记、样品标记或其任何组合。在一些实施方案中,每个寡核苷酸可以包含接头。在一些实施方案中,每个寡核苷酸可以包含寡核苷酸探针的结合位点,诸如聚(dA)尾。例如,聚(dA)尾可以是例如寡dA

本文公开了包括多于一种样品索引组合物。多于一种样品索引组合物中的每一种可以包含两种或更多种细胞组分结合试剂。两种或更多种细胞组分结合试剂中的每一种都可以与样品索引寡核苷酸缔合。两种或更多种细胞组分结合试剂中的至少一种可以能够与至少一种细胞组分靶特异性结合。样品索引寡核苷酸可以包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列。多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列可以包含不同的序列。

本文公开了包含用于细胞鉴定的样品索引组合物的试剂盒。在一些实施方案中。两种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂(例如,蛋白结合试剂),其中细胞组分结合试剂能够与一种或更多种细胞组分靶(例如,一种或更多种蛋白靶)中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列。在一些实施方案中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点或其组合。

本文公开了包括用于细胞鉴定的试剂盒。在一些实施方案中,试剂盒包含:两种或更多种样品索引组合物。两种或更多种样品索引组合物中的每一种都可以包含与样品索引寡核苷酸缔合的细胞组分结合试剂(例如,抗原结合试剂),其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列。在一些实施方案中,样品索引寡核苷酸包含分子标记序列、通用引物的结合位点或其组合。本文公开了包括用于多重态(multiplet)鉴定的试剂盒。在一些实施方案中,试剂盒包含:两种样品索引组合物。两种样品索引组合物中的每一种可以包含与样品索引寡核苷酸缔合的细胞组分结合试剂(例如,抗原结合试剂),其中抗原结合试剂能够与一种或更多种细胞组分靶(例如,抗原靶)中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列。

独特标识符(或与细胞组分结合试剂缔合的寡核苷酸,诸如结合试剂寡核苷酸、抗体寡核苷酸、样品索引寡核苷酸、细胞鉴定寡核苷酸、对照颗粒寡核苷酸、对照寡核苷酸或相互作用确定寡核苷酸)可以具有任何合适的长度,例如,约25个核苷酸至约45个核苷酸长。在一些实施方案中,独特标识符可以具有是以下、是约以下、小于以下、大于以下的长度:4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、30个核苷酸、35个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、70个核苷酸、80个核苷酸、90个核苷酸、100个核苷酸、200个核苷酸或在以上值的任何两个之间的范围。

在一些实施方案中,独特标识符选自不同组的独特标识符。不同组的独特标识符可以包括以下或包括约以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个、5000个不同的独特标识符或在这些值的任何两个之间的数字或范围的不同的独特标识符。不同组的独特标识符可以包括至少以下或包括至多以下:20个、30个、40个、50个、60个、70个、80个、90个、100个、200个、300个、400个、500个、600个、700个、800个、900个、1000个、2000个或5000个不同的独特标识符。在一些实施方案中,独特标识符的组被设计成与待分析的样品的DNA或RNA序列具有最小的序列同源性。在一些实施方案中,独特标识符的组的序列或其互补序列彼此相差以下或相差约以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸、10个核苷酸或在这些值的任何两个之间的数字或范围。在一些实施方案中,独特标识符的组的序列或其互补序列彼此相差至少以下或相差至多以下:1个核苷酸、2个核苷酸、3个核苷酸、4个核苷酸、5个核苷酸、6个核苷酸、7个核苷酸、8个核苷酸、9个核苷酸或10个核苷酸。

在一些实施方案中,独特标识符可以包含引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包含至少两个引物(诸如通用引物)的结合位点。在一些实施方案中,独特标识符可以包含至少三个引物(诸如通用引物)的结合位点。引物可以用于例如通过PCR扩增来扩增独特标识符。在一些实施方案中,引物可以用于巢式PCR反应。

本公开内容中设想了任何合适的细胞组分结合试剂,诸如任何蛋白结合试剂(例如,抗体或其片段、适配体、小分子、配体、肽、寡核苷酸等或其任何组合)。在一些实施方案中,细胞组分结合试剂可以是多克隆抗体、单克隆抗体、重组抗体、单链抗体(scAb)或它们的片段,诸如Fab、Fv等。在一些实施方案中,多于一种蛋白结合试剂可以包括以下或包括约以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种、5000种不同的蛋白结合试剂或在这些值的任何两个值之间的数字或范围的不同的蛋白结合试剂。在一些实施方案中,多于一种蛋白结合试剂可以包括至少以下或包括至多以下:20种、30种、40种、50种、60种、70种、80种、90种、100种、200种、300种、400种、500种、600种、700种、800种、900种、1000种、2000种或5000种不同的蛋白结合试剂。

在一些实施方案中,寡核苷酸与细胞组分结合试剂通过接头缀合。在一些实施方案中,寡核苷酸可以与蛋白结合试剂共价地缀合。在一些实施方案中,寡核苷酸可以与蛋白结合试剂非共价地缀合。在一些实施方案中,接头可以包含将寡核苷酸与蛋白结合试剂可逆地或不可逆地附接的化学基团。化学基团可以与接头例如通过胺基团缀合。在一些实施方案中,接头可以包含与缀合至蛋白结合试剂的另一个化学基团形成稳定的键的化学基团。例如,化学基团可以是可UV光裂解基团、二硫键、链霉抗生物素蛋白、生物素、胺等。在一些实施方案中,化学基团可以与蛋白结合试剂通过氨基酸(诸如赖氨酸)或N末端上的伯胺缀合。寡核苷酸可以与蛋白结合试剂的任何合适的位点缀合,条件为寡核苷酸不干扰蛋白结合试剂与其蛋白靶之间的特异性结合。在蛋白结合试剂是抗体的实施方案中,寡核苷酸可以与抗体的抗原结合位点之外的任何处缀合,例如Fc区、C

在一些实施方案中,多于一种细胞组分结合试剂(例如,蛋白结合试剂)能够与样品中的多于一种细胞组分靶(例如,蛋白靶)特异性结合。样品可以是或包括单细胞、多于一个细胞、组织样品、肿瘤样品、血液样品等。在一些实施方案中,多于一种细胞组分靶包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,多于一种细胞组分靶可以包括胞内蛋白。在一些实施方案中,多于一种细胞组分靶可以包括胞外蛋白。在一些实施方案中,多于一种细胞组分靶可以是以下或可以是约以下:生物体中所有细胞组分靶(例如,表达的蛋白或可以表达的蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或在这些值的任何两个之间的数字或范围。在一些实施方案中,多于一种细胞组分靶可以是至少以下或可以是至多以下:生物体中所有细胞组分靶(例如,表达的蛋白或可以表达的蛋白)的1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、98%或99%。在一些实施方案中,多于一种细胞组分靶可以包括以下或可以包括约以下:2、3、4、5、10、20、30、40、50、100、1000、10000种或在这些值的任何两个之间的数字或范围的不同的细胞组分靶。在一些实施方案中,多于一种细胞组分靶可以包括至少以下或可以包括至多以下:2、3、4、5、10、20、30、40、50、100、1000或10000种不同的细胞组分靶。

本文公开的内容包括用于样品鉴定的方法。在一些实施方案中,该方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物;使用多于一个条形码(例如,随机条形码)将样品索引寡核苷酸条形码化(例如,随机条形码化)以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

与抗体缀合的寡核苷酸、用于与抗体缀合的寡核苷酸或先前与抗体缀合的寡核苷酸在本文被称为抗体寡核苷酸(“AbOligo”)。在样品索引化的背景中,抗体寡核苷酸在本文被称为样品索引寡核苷酸。与抗体寡核苷酸缀合的抗体在本文被称为热(hot)抗体或寡核苷酸抗体。未与抗体寡核苷酸缀合的抗体在本文被称为冷(cold)抗体或无寡核苷酸抗体。与结合试剂(例如,蛋白结合试剂)缀合的寡核苷酸、用于与结合试剂缀合的寡核苷酸或先前与结合试剂缀合的寡核苷酸在本文被称为试剂寡核苷酸。在样品索引化的背景中,试剂寡核苷酸在本文被称为样品索引寡核苷酸。与抗体寡核苷酸缀合的结合试剂在本文被称为热结合试剂或寡核苷酸结合试剂。未与抗体寡核苷酸缀合的结合试剂在本文被称为冷结合试剂或无寡核苷酸结合试剂。

图7示出了使用寡核苷酸缔合的细胞组分结合试剂进行样品索引化的示例性工作流程的示意图。在一些实施方案中,提供了各自包含结合试剂的多于一种组合物705a、705b等。结合试剂可以是蛋白结合试剂,诸如抗体。细胞组分结合试剂可以包括抗体、四聚体、适配体、蛋白支架或其组合。多于一种组合物705a、705b的结合试剂可以与相同的细胞组分靶结合。例如,多于一种组合物705a、705b的结合试剂可以是相同的(除了与结合试剂缔合的样品索引寡核苷酸不同)。

不同的组合物可以包含与具有不同样品索引序列的样品索引寡核苷酸缀合的结合试剂。在不同实施方式中,不同组合物的数目可以是不同的。在一些实施方案中,不同组合物的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或在这些值的任何两个之间的数字或范围。在一些实施方案中,不同组合物的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000。

在一些实施方案中,一种组合物中结合试剂的样品索引寡核苷酸可以包含相同的样品索引序列。一种组合物中结合试剂的样品索引寡核苷酸可以不相同。在一些实施方案中,一种组合物中具有相同样品索引序列的结合试剂的样品索引寡核苷酸的百分比可以是以下或可以是约以下:50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.9%或在这些值的任何两个之间的数字或范围。在一些实施方案中,一种组合物中具有相同样品索引序列的结合试剂的样品索引寡核苷酸的百分比可以是至少以下或可以是至多以下:50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.9%。

组合物705a和705b可以用于标记不同样品中的样品。例如,组合物705a中细胞组分结合试剂的样品索引寡核苷酸可以具有一种样品索引序列,并且可以用于标记样品707a(诸如患者样品)中的细胞710a(如黑色圆示出的)。组合物705b中细胞组分结合试剂的样品索引寡核苷酸可以具有另一种样品索引序列,并且可以用于标记样品707b(诸如另一患者的样品或同一患者的另一种样品)中的细胞710b(如阴影圆示出的)。细胞组分结合试剂可以与细胞表面上的细胞组分靶或蛋白(诸如细胞标志物、B细胞受体、T细胞受体、抗体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合)特异性结合。可以将未结合的细胞组分结合试剂去除,例如,通过用缓冲液洗涤细胞去除。

然后,可以将带有细胞组分结合试剂的细胞分开到多于一个区室诸如微孔阵列中,其中单个区室715a、715b的尺寸适合于单细胞710a和单个珠720a或单细胞710b和单个珠720b。每个珠720a、720b可以包含多于一个寡核苷酸探针,所述寡核苷酸探针可以包含分子标记序列以及珠上所有寡核苷酸探针共有的细胞标记。在一些实施方案中,每个寡核苷酸探针可以包含靶结合区,例如,聚(dT)序列。与组合物705a的细胞组分结合试剂缀合的样品索引寡核苷酸725a可以被配置为(或可以)可从细胞组分结合试剂解离或不可从细胞组分结合试剂解离。与组合物705a的细胞组分结合试剂缀合的样品索引寡核苷酸725a可以使用化学手段、光学手段或其他手段从细胞组分结合试剂解离。与组合物705b的细胞组分结合试剂缀合的样品索引寡核苷酸725b可以被配置为(或可以)可从细胞组分结合试剂解离或不可从细胞组分结合试剂解离。与组合物705b的细胞组分结合试剂缀合的样品索引寡核苷酸725b可以使用化学手段、光学手段或其他手段从细胞组分结合试剂解离。

可以裂解细胞710a以释放细胞710a内的核酸,诸如基因组DNA或细胞mRNA 730a。裂解的细胞735a以虚线圆示出。细胞mRNA 730a、样品索引寡核苷酸725a或两者都可以被珠720a上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交捕获。可以使用逆转录酶以使用细胞mRNA 730a和寡核苷酸725a作为模板延伸与细胞mRNA 730a和寡核苷酸725a杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以经历扩增和测序。

类似地,可以裂解细胞710b以释放细胞710b内的核酸,诸如基因组DNA或细胞mRNA730b。裂解的细胞735b以虚线圆显示。细胞mRNA730b、样品索引寡核苷酸725b或两者都可以被珠720b上的寡核苷酸探针捕获,例如,通过与聚(dT)序列杂交捕获。可以使用逆转录酶以使用细胞mRNA 730b和寡核苷酸725b作为模板延伸与细胞mRNA 730b和寡核苷酸725b杂交的寡核苷酸探针。由逆转录酶产生的延伸产物可以经历扩增和测序。

测序读段可以经历细胞标记、分子标记、基因身份和样品身份的去多重化(例如,根据样品索引寡核苷酸725a和725b的样品索引序列)。细胞标记、分子标记和基因身份的去多重化可以产生样品中每个单细胞的基因表达的数字表示。使用样品索引寡核苷酸的样品索引序列对细胞标记、分子标记和样品身份进行去多重化可以用于确定样品来源。

在一些实施方案中,针对细胞表面上的细胞组分结合试剂的细胞组分结合试剂可以与独特样品索引寡核苷酸文库缀合,以允许细胞保留样品身份。例如,针对细胞表面标志物的抗体可以与独特样品索引寡核苷酸文库缀合,以允许细胞保留样品身份。这将使得能够将多于一个样品装载到同一Rhapsody

本文公开了包括用于样品鉴定的方法。在一些实施方案中,该方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物中的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物。该方法可以包括使用多于一个条形码(例如,随机条形码)将样品索引寡核苷酸条形码化(例如,随机条形码化)以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,用于样品鉴定的方法包括:使来自多于一个样品中的每一个的一个或更多个细胞与多于一种样品索引组合物的样品索引组合物接触,其中一个或更多个细胞中的每一个包含一种或更多种细胞组分靶,其中多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分靶中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列;去除多于一种样品索引组合物中未结合的样品索引组合物;并且基于多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一个条形码(例如,随机条形码)将多于一种样品索引组合物的样品索引寡核苷酸条形码化(例如,随机条形码化)以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,鉴定至少一个细胞的样品来源可以包括鉴定多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸;获得多于一个复制的样品索引寡核苷酸的测序数据;并且基于测序数据中对应于至少一个条形码化样品索引寡核苷酸的多于一个样品索引寡核苷酸的复制的样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸包括:在复制至少一个条形码化样品索引寡核苷酸之前,将复制衔接子连接至至少一个条形码化样品索引寡核苷酸。复制至少一个条形码化样品索引寡核苷酸可以包括使用连接至至少一个条形码化样品索引寡核苷酸的复制衔接子复制至少一个条形码化样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

在一些实施方案中,复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸包括:在复制至少一个条形码化样品索引寡核苷酸之前,使捕获探针与至少一个样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;并且将与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针缔合的样品索引寡核苷酸。复制至少一个样品索引寡核苷酸可以包括复制与捕获探针缔合的样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

本文还公开了包括用于鉴定细胞过装载和多重态的方法、试剂盒和系统。这样的方法、试剂盒和系统可以用于以下或与以下组合使用:本文公开的任何合适的方法、试剂盒和系统,例如使用与寡核苷酸缔合的细胞组分结合试剂来测量细胞组分表达水平(诸如蛋白表达水平)的方法、试剂盒和系统。

使用当前的细胞装载技术,当将约20000个细胞装载到具有~60000个微孔的微孔筒或阵列中时,具有两个或更多个细胞(称为双重态(doublets)或多重态(multiplets))的微孔或液滴的数目可以是最小的。然而,当装载的细胞数目增加时,具有多于一个细胞的微孔或液滴的数目可以显著增加。例如,当将约50000个细胞装载到微孔筒或阵列的约60000个微孔中时,具有多于一个细胞的微孔的百分比可以相当高,诸如11%-14%。这样的将大量细胞装载到微孔中可以被称为细胞过装载。然而,如果将细胞分成许多组(例如,5个组),并且每组中的细胞用具有不同样品索引序列的样品索引寡核苷酸标记,则与两个或更多个样品索引序列缔合的细胞标记(例如,条形码诸如随机条形码的细胞标记)可以在测序数据中被鉴定并从后续处理中去除。在一些实施方案中,将细胞分成大量的组(例如,10000个组),并且每组中的细胞用具有不同样品索引序列的样品索引寡核苷酸标记,与两种或更多种样品索引序列缔合的样品标记可以在测序数据中被鉴定并从后续处理中去除。在一些实施方案中,不同的细胞用具有不同细胞鉴定序列的细胞鉴定寡核苷酸标记,与两种或更多种细胞鉴定寡核苷酸缔合的细胞鉴定序列可以在测序数据中被鉴定并从后续处理中去除。使得可以将相对于微孔筒或阵列中的微孔数目更加大量的细胞装载到微孔中。

本文公开了包括用于样品鉴定的方法。在一些实施方案中,该方法包括:使第一多于一个细胞和第二多于一个细胞分别与两种样品索引组合物接触,其中第一多于一个细胞中的每一个和第二多于一个细胞中的每一个包含一种或更多种细胞组分,其中两种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸,其中多于一个条形码中的每一个包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中多于一个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且鉴定获得的测序数据中每种与两种或更多种样品索引序列缔合的一种或更多种细胞标记序列;并且从获得的测序数据中去除每种与两种或更多种样品索引序列缔合的一种或更多种细胞标记序列的相关测序数据,和/或从后续分析(例如,单细胞mRNA谱分析(profiling)或全转录物组分析)中排除每种与两种或更多种样品索引序列缔合的一种或更多种细胞标记序列的相关测序数据。在一些实施方案中,样品索引寡核苷酸包含条形码序列(例如,分子标记序列)、通用引物的结合位点或其组合。

例如,该方法可以用于使用样品索引化来装载50000个或更多个细胞(与10000个-20000个细胞相比)。样品索引化可以使用寡核苷酸缀合的细胞组分结合试剂(例如,抗体)或针对细胞组分(例如,通用蛋白标志物)的细胞组分结合试剂,以独特样品索引标记来自不同样品的细胞。当来自不同样品的两个或更多个细胞、来自样品的不同细胞群体的两个或更多个细胞或样品的两个或更多个细胞被捕获在同一微孔或液滴中时,组合的“细胞”(或两个或更多个细胞的内容物)可以与具有不同样品索引序列的样品索引寡核苷酸(或具有不同细胞鉴定序列的细胞鉴定寡核苷酸)缔合。在不同实施方式中,不同细胞群体的数目可以是不同的。在一些实施方案中,不同群体的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,不同群体的数目可以是至少以下或可以是至多约以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100。在不同实施方式中,每个群体中细胞的数目或平均数目可以是不同的。在一些实施方案中,每个群体中细胞的数目或平均数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,每个群体中细胞的数目或平均数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100。当每个群体中细胞的数目或平均数目足够小(例如,等于或少于每个群体50个、25个、10个、5个、4个、3个、2个或1个细胞)时,用于细胞过装载和多重态鉴定的样品索引组合物可以被称为细胞鉴定组合物。

可以通过将样品的细胞等分到多于一个群体中,将样品的细胞分成多于一个群体。基于测序数据中与一种细胞标记序列(例如,条形码诸如随机条形码的细胞标记序列)缔合的两种或更多种样品索引序列,测序数据中与多于一种样品索引序列缔合的“细胞”可以被鉴定为“多重态”。组合的“细胞”的测序数据在本文也被称为多重态。多重态可以是双重态、三重态(triplet)、四重态(quartet)、五重态(quintet)、六重态(sextet)、七重态(septet)、八重态(octet)、九重态(nonet)或其任何组合。多重态可以是任何n重态(n-plet)。在一些实施方案中,n是以下或是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或在这些值的任何两个之间的范围。在一些实施方案中,n是至少以下或是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20。

当确定单细胞的表达谱时,两个细胞可以被鉴定为一个细胞,并且两个细胞的表达谱可以被鉴定为一个细胞的表达谱(称为双重态表达谱)。例如,当使用条形码(例如,随机条形码)确定两个细胞的表达谱时,两个细胞的mRNA分子可以与具有相同细胞标记的条形码缔合。作为另一种实例,两个细胞可以与一个颗粒(例如,珠)缔合。颗粒可以包括具有相同细胞标记的条形码。在裂解细胞之后,两个细胞中的mRNA分子可以与颗粒的条形码缔合,从而与相同的细胞标记缔合。双重态表达谱可以使表达谱的解释出现偏差(skew)。

双重态可以指与具有不同样品索引序列的两种样品索引寡核苷酸缔合的组合的“细胞”。双重态还可以指与具有两种样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。当在同一微孔或液滴中捕获与不同序列的两种样品索引寡核苷酸缔合的两个细胞(或与具有两种不同样品索引序列的样品索引寡核苷酸缔合的两个或更多个细胞)时,可以出现双重态,组合的“细胞”可以与具有不同样品索引序列的两种样品索引寡核苷酸缔合。三重态可以指与全都具有不同样品索引序列的三种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有三种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。四重态可以指与全都具有不同样品索引序列的四种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有四种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。五重态可以指与全都具有不同样品索引序列的五种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有五种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。六重态可以指与全都具有不同样品索引序列的六种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有六种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。七重态可以指与全都具有不同样品索引序列的七种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有七种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。八重态可以指与全都具有不同样品索引序列的八种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有八种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。九重态可以指与全都具有不同样品索引序列的九种样品索引寡核苷酸缔合的组合的“细胞”,或者与具有九种不同样品索引序列的样品索引寡核苷酸缔合的组合的“细胞”。当在同一微孔或液滴中捕获与不同序列的两种或更多种样品索引寡核苷酸缔合的两个或更多个细胞(或与具有两种或更多种不同样品索引序列的样品索引寡核苷酸缔合的两个或更多个细胞)时,可以出现多重态,组合的“细胞”可以与具有两种或更多种不同样品索引序列的样品索引寡核苷酸缔合。

作为另一种实例,该方法可以用于多重态鉴定,无论是在样品过装载的情况下,还是在将细胞装载到微孔阵列的微孔上或产生包含细胞的液滴的情况下。当两个或更多个细胞被装载到一个微孔中时,从组合的“细胞”(或两个或多个细胞的内容物)得到的数据是具有异常基因表达谱的多重态。通过使用样品索引化,人们可以通过寻找每种缔合或被分配具有不同样品索引序列的两种或更多种样品索引寡核苷酸(或具有两种或更多种样品索引序列的样品索引寡核苷酸)的细胞标记来识别这些多重态中的一些。利用样品索引序列,本文公开的方法可以用于多重态鉴定(无论是在样品过装载或未过装载的情况下,还是在将细胞装载到微孔阵列的微孔上或产生包含细胞的液滴的情况下)。在一些实施方案中,该方法包括:使第一多于一个细胞和第二多于一个细胞分别与两种样品索引组合物接触,其中第一多于一个细胞中的每一个和第二多于一个细胞中的每一个包含一种或更多种细胞组分,其中两种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分中的至少一种特异性结合,其中样品索引寡核苷酸包含样品索引序列,并且其中两种样品索引组合物的样品索引序列包含不同的序列;使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸,其中多于一个条形码中的每一个包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中多于一个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且鉴定获得的测序数据中每种与两种或更多种样品索引序列缔合的一种或更多种多重态细胞标记序列。

可以装载到微孔筒的微孔上或使用微流体装置产生的液滴中的细胞数目可以受到多重态比率的限制。装载更多的细胞可以导致更多的多重态,这在单细胞数据中可以是难以鉴定的并且产生噪声。利用样品索引化,该方法可以用于更准确地标记或鉴定多重态,并且从测序数据或后续分析中去除多重态。能够以较高的置信度鉴定多重态,可以提高用户对多重态比率的容忍度,并且在每个微孔筒上装载更多的细胞,或者产生每滴含有至少一个细胞的液滴。

在一些实施方案中,使第一多于一个细胞和第二多于一个细胞分别与两种样品索引组合物接触包括:使第一多于一个细胞与两种样品索引组合物中的第一样品索引组合物接触;并且使第二多于一个细胞与两种样品索引组合物中的第二样品索引组合物接触。在不同实施方式中,多于一个细胞的数目和多于一种样品索引组合物的数目可以是不同的。在一些实施方案中,多于一个细胞和/或多于一种样品索引组合物的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,多于一个细胞和/或多于一种样品索引组合物的数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。在不同实施方式中,细胞数目可以是不同的。在一些实施方案中,细胞数目或平均数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,细胞数目或平均数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。

在一些实施方案中,该方法包括:去除两种样品索引组合物中未结合的样品索引组合物。去除未结合的样品索引组合物可以包括用洗涤缓冲液洗涤第一多于一个细胞和第二多于一个细胞的细胞。去除未结合的样品索引组合物可以包括使用流式细胞术选择与两种样品索引组合物中的至少一种细胞组分结合试剂结合的细胞。在一些实施方案中,该方法包括:裂解来自多于一个样品的每一个中的一个或更多个细胞。

在一些实施方案中,样品索引寡核苷酸被配置为(或可以)可从细胞组分结合试剂解离或不可从细胞组分结合试剂解离。该方法可以包括使样品索引寡核苷酸从细胞组分结合试剂解离。使样品索引寡核苷酸解离可以包括通过可UV光裂解、化学处理(例如,使用还原剂,诸如二硫苏糖醇)、加热、酶处理或其任何组合使样品索引寡核苷酸从细胞组分结合试剂解离。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化样品索引寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增条形码序列(例如,分子标记序列)的至少一部分和样品索引寡核苷酸的至少一部分。在一些实施方案中,获得多于一个条形码化样品索引寡核苷酸的测序数据可以包括获得多于一个扩增子的测序数据。获得测序数据包括对条形码序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。在一些实施方案中,鉴定至少一个细胞的样品来源包括基于至少一个条形码化样品索引寡核苷酸的样品索引序列来鉴定多于一个条形码化靶的样品来源。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶,其中多于一个条形码中的每一个包含细胞标记序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得条形码化靶的测序数据。使用多于一个条形码将多于一个靶条形码化以产生多于一个条形码化靶可以包括:使靶的拷贝与条形码的靶结合区接触;并且使用多于一个条形码逆转录多于一个靶以产生多于一个逆转录的靶。

在一些实施方案中,该方法包括:在获得多于一个条形码化靶的测序数据之前,扩增条形码化靶以产生多于一个扩增的条形码化靶。扩增条形码化靶以产生多于一个扩增的条形码化靶可以包括:通过聚合酶链式反应(PCR)扩增条形码化靶。使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶可以包括:使用多于一个随机条形码将细胞的多于一个靶随机条形码化以产生多于一个随机条形码化靶。

在一些实施方案中,用于细胞鉴定的方法包括:使第一多于一个的一个或更多个细胞和第二多于一个的一个或更多个细胞分别与两种细胞鉴定组合物接触,其中第一多于一个的一个或更多个细胞中的每一个和第二多于一个的一个或更多个细胞中的每一个包含一种或更多种细胞组分,其中两种细胞鉴定组合物中的每一种包含与细胞鉴定寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分中的至少一种特异性结合,其中细胞鉴定寡核苷酸包含细胞鉴定序列,并且其中两种细胞鉴定组合物的细胞鉴定序列包含不同的序列;使用多于一个条形码将细胞鉴定寡核苷酸条形码化以产生多于一个条形码化细胞鉴定寡核苷酸,其中多于一个条形码中的每一个包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中多于一个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;获得多于一个条形码化细胞鉴定寡核苷酸的测序数据;并且鉴定获得的测序数据中每种与两种或更多种细胞鉴定序列缔合的一种或更多种细胞标记序列;并且从获得的测序数据中去除每种与两种或更多种细胞鉴定序列缔合的一种或更多种细胞标记序列的相关测序数据,和/或从后续分析(例如,单细胞mRNA谱分析或全转录物组分析)中排除每种与两种或更多种细胞鉴定序列缔合的一种或更多种细胞标记序列的相关测序数据。在一些实施方案中,细胞鉴定寡核苷酸包含条形码序列(例如,分子标记序列)、通用引物的结合位点或其组合。

当在同一微孔或液滴中捕获与不同序列的两种或更多种细胞鉴定寡核苷酸缔合的两个或更多个细胞(或与具有两种或更多种不同细胞鉴定序列的细胞鉴定寡核苷酸缔合的两个或更多个细胞)时,可以出现多重态(例如,双重态、三重态等),组合的“细胞”可以与具有两种或更多种不同细胞鉴定序列的细胞鉴定寡核苷酸缔合。

细胞鉴定组合物可以用于多重态鉴定,无论是在细胞过装载的情况下,还是在将细胞装载到微孔阵列的微孔上或产生包含细胞的液滴的情况下。当两个或更多个细胞被装载到一个微孔中时,从组合的“细胞”(或两个或多个细胞的内容物)得到的数据是具有异常基因表达谱的多重态。通过使用细胞鉴定,人们可以通过寻找每种缔合或被分配具有不同细胞鉴定序列的两种或更多种细胞鉴定寡核苷酸(或具有两种或更多种细胞鉴定序列的细胞鉴定寡核苷酸)的细胞标记(例如,条形码诸如随机条形码的细胞标记)来识别这些多重态中的一些。利用细胞鉴定序列,本文公开的方法可以用于多重态鉴定(无论是在样品过装载或未过装载的情况下,还是在将细胞装载到微孔阵列的微孔上或产生包含细胞的液滴的情况下)。在一些实施方案中,该方法包括:使第一多于一个的一个或更多个细胞和第二多于一个的一个或更多个细胞分别与两种细胞鉴定组合物接触,其中第一多于一个的一个或更多个细胞中的每一个和第二多于一个的一个或更多个细胞中的每一个包含一种或更多种细胞组分,其中两种细胞鉴定组合物中的每一种包含与细胞鉴定寡核苷酸缔合的细胞组分结合试剂,其中细胞组分结合试剂能够与一种或更多种细胞组分中的至少一种特异性结合,其中细胞鉴定寡核苷酸包含细胞鉴定序列,并且其中两种细胞鉴定组合物的细胞鉴定序列包含不同的序列;使用多于一个条形码将细胞鉴定寡核苷酸条形码化以产生多于一个条形码化细胞鉴定寡核苷酸,其中多于一个条形码中的每一个包含细胞标记序列、条形码序列(例如,分子标记序列)和靶结合区,其中多于一个条形码中的至少两个条形码的条形码序列包含不同的序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;获得多于一个条形码化细胞鉴定寡核苷酸的测序数据;并且鉴定获得的测序数据中每种与两种或更多种细胞鉴定序列缔合的一种或更多种多重态细胞标记序列。

可以装载到微孔筒的微孔上或使用微流体装置产生的液滴中的细胞数目可以受到多重态比率的限制。装载更多的细胞可以导致更多的多重态,这在单细胞数据中可以是难以鉴定的并且产生噪声。利用细胞鉴定,该方法可以用于更准确地标记或鉴定多重态,并且从测序数据或后续分析中去除多重态。能够以较高的置信度鉴定多重态,可以提高用户对多重态比率的容忍度,并且在每个微孔筒上装载更多的细胞,或者产生每滴含有至少一个细胞的液滴。

在一些实施方案中,使第一多于一个的一个或更多个细胞和第二多于一个的一个或更多个细胞分别与两种细胞鉴定组合物接触包括:使第一多于一个的一个或更多个细胞与两种细胞鉴定组合物中的第一细胞鉴定组合物接触;并且使第二多于一个的一个或更多个细胞与两种细胞鉴定组合物中的第二细胞鉴定组合物接触。在不同实施方式中,多于一种细胞鉴定组合物的数目可以是不同的。在一些实施方案中,细胞鉴定组合物的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,细胞鉴定组合物的数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。在不同实施方式中,每种多于一个的一个或更多个细胞中的细胞数目或平均数目可以是不同的。在一些实施方案中,每种多于一个的一个或更多个细胞中的细胞数目或平均数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000、1000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,每种多于一个的一个或更多个细胞中的细胞数目或平均数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、10000、100000或1000000。

在一些实施方案中,该方法包括:去除两种细胞鉴定组合物中未结合的细胞鉴定组合物。去除未结合的细胞鉴定组合物可以包括用洗涤缓冲液洗涤第一多于一个的一个或更多个细胞和第二多于一个的一个或更多个细胞的细胞。去除未结合的细胞鉴定组合物可以包括使用流式细胞术选择与两种细胞鉴定组合物中的至少一种细胞组分结合试剂结合的细胞。在一些实施方案中,该方法包括:裂解来自多于一个样品的每一个中的一个或更多个细胞。

在一些实施方案中,细胞鉴定寡核苷酸被配置为(或可以)可从细胞组分结合试剂解离或不可从细胞组分结合试剂解离。该方法可以包括使细胞鉴定寡核苷酸从细胞组分结合试剂解离。使细胞鉴定寡核苷酸解离可以包括通过可UV光裂解、化学处理(例如,使用还原剂,诸如二硫苏糖醇)、加热、酶处理或其任何组合使细胞鉴定寡核苷酸从细胞组分结合试剂解离。

在一些实施方案中,使用多于一个条形码将细胞鉴定寡核苷酸条形码化包括:使多于一个条形码与细胞鉴定寡核苷酸接触以产生与细胞鉴定寡核苷酸杂交的条形码;并且将与细胞鉴定寡核苷酸杂交的条形码延伸以产生多于一个条形码化细胞鉴定寡核苷酸。将条形码延伸可以包括:使用DNA聚合酶将条形码延伸以产生多于一个条形码化细胞鉴定寡核苷酸。将条形码延伸可以包括:使用逆转录酶将条形码延伸以产生多于一个条形码化细胞鉴定寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化细胞鉴定寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化细胞鉴定寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增条形码序列(例如,分子标记序列)的至少一部分和细胞鉴定寡核苷酸的至少一部分。在一些实施方案中,获得多于一个条形码化细胞鉴定寡核苷酸的测序数据可以包括:获得多于一个扩增子的测序数据。获得测序数据包括对条形码序列的至少一部分和细胞鉴定寡核苷酸的至少一部分进行测序。在一些实施方案中,鉴定至少一个细胞的样品来源包括基于至少一个条形码化细胞鉴定寡核苷酸的细胞鉴定序列来鉴定多于一个条形码化靶的样品来源。

在一些实施方案中,使用多于一个条形码将细胞鉴定寡核苷酸条形码化以产生多于一个条形码化细胞鉴定寡核苷酸包括使用多于一个随机条形码将细胞鉴定寡核苷酸随机条形码化以产生多于一个随机条形码化细胞鉴定寡核苷酸。

本文公开了包括用于样品鉴定或索引化的方法的实施方案。在一些实施方案中,该方法包括在样品多重化(multiplex)(或本文公开的其他方法,诸如细胞过装载)之前,用不同的样品特异性核酸条形码(例如,样品索引寡核苷酸)标记不同样品的细胞。在一些实施方案中,凝集素靶向试剂或分子(例如,凝集素靶向蛋白)和/或细胞透过性(cell-permeabilizing)试剂或分子可以用于细胞靶向。在一些实施方案中,该方法可以补充或补足依赖于抗体的蛋白靶的存在的其他细胞标记方法。这样的蛋白靶可能不是在所有细胞类型上都表达。因此,本文公开的方法可以用于靶向更多的或所有的细胞类型。

在一些实施方案中,凝集素靶向试剂可以是或可以包括麦胚凝集蛋白(WGA)。在一些实施方案中,细胞透过性分子可以是或可以包括钙黄绿素。在一些实施方案中,凝集素靶向分子或细胞透过性分子可以与寡核苷酸(诸如样品索引寡核苷酸)缔合(例如,缀合或结合)。与凝集素靶向分子或细胞透过性分子缔合的寡核苷酸(例如,样品索引寡核苷酸)可以包含聚(dA)尾,该聚(dA)尾可以被条形码(诸如单细胞3’RNA测序平台(例如,BDRhapsody

可以将与寡核苷酸缔合的凝集素靶向分子或细胞透过性分子与细胞一起孵育,使得分子可以通过普遍存在的表面凝集素(例如,WGA)结合或被内化(例如,钙黄绿素)。在洗涤之后,可以将细胞汇集以用于进一步的下游实验,并且基于测序期间确定的样品条形码序列,在生物信息学上追溯至初始细胞群体(例如,样品的初始细胞群体)。

图8A-图8B示出了使用寡核苷酸缔合的糖类结合试剂或细胞膜透过性试剂进行样品索引化的示例性工作流程的示意图。该方法可以包括在步骤800a使多于一个样品808a-808e的每一个样品的细胞804a-804e与多于一种样品索引组合物812a-812e的样品索引组合物接触。多于一个样品可以例如包括:包含细胞808a的对照804a、包含细胞808b的第一样品804b、包含细胞808c的第二样品804c等等。样品索引组合物可以是或可以包括糖类结合试剂816a-816e中的一种,每种糖类结合试剂与样品索引寡核苷酸820a-820e中的一种缔合。该方法可以包括在步骤800b汇集来自与样品索引组合物接触的不同样品804a-804e的细胞808a-808e;并且在步骤800c,将汇集的细胞808a-808e的单细胞与单个珠828共分区到多于一个分区中。珠828可以包括多于一个条形码(例如,随机条形码),每个条形码包含靶结合区(诸如所示的聚(dT)区824a)。该方法可以包括在步骤800d在分区中裂解细胞并将样品索引组合物的样品索引寡核苷酸820a-820e条形码化。例如,样品索引寡核苷酸的聚(dA)尾可以与条形码的靶结合区结合。该方法可以包括在步骤800e获得条形码化样品索引寡核苷酸的测序数据。

图9示出了非限制性示例性样品索引寡核苷酸820。所示的样品索引寡核苷酸820包含通用引物结合位点820up(例如,PCR手柄,完整或部分的Illumina R2和/或P7序列)、样品索引标识符或条形码序列820si(在本文也被称为样品索引序列)和聚(dA)尾820pa。聚(dA)尾820pa的存在使得能够捕获样品索引寡核苷酸并且随后使用单细胞3’RNA测序平台(例如,BD Rhapsody

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触(例如,在图8A中的步骤800a)。多于一个样品中的每一个可以包含一个或更多个细胞(例如,图8A中分别为样品804a-804e的细胞808a-808e),每个细胞包含一种或更多种细胞表面糖类靶。样品索引组合物可以包含与样品索引寡核苷酸缔合的糖类结合试剂(例如,糖类结合试剂816a-816e中的一种,诸如麦胚凝集蛋白(WGA))。糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合。样品索引寡核苷酸(例如,图8A中的样品索引寡核苷酸820a-820e中的一种)可以包含样品索引序列(例如,图9中的样品索引标识符或条形码序列820si),并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列可以包含不同的序列。该方法可以包括使用多于一个条形码(诸如随机条形码)将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸(例如,在图8B中的步骤800e);获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触(例如,在参考图8A描述的步骤800a)。多于一个样品中的每一个包含一个或更多个细胞,每个细胞包含一种或更多种细胞表面糖类靶(例如,图8A中分别为样品804a-804e的细胞808a-808e)。样品索引组合物可以包含与样品索引寡核苷酸(例如,图8A中的样品索引寡核苷酸820a-820e)缔合的糖类结合试剂(诸如麦胚凝集蛋白(WGA))。糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合。样品索引寡核苷酸可以包含样品索引序列(例如,图9中的标识符或条形码序列820si),并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。该方法可以包括:基于多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源。在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一个条形码将多于一种样品索引组合物的样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸(例如,在图8B中的步骤800e);获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于测序数据中多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,鉴定至少一个细胞的样品来源包括鉴定多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸;获得多于一个复制的样品索引寡核苷酸的测序数据;并且基于测序数据中对应于至少一个条形码化样品索引寡核苷酸的多于一个样品索引寡核苷酸的复制的样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,将复制衔接子与至少一个条形码化样品索引寡核苷酸连接,并且其中复制至少一个条形码化样品索引寡核苷酸包括使用与至少一个条形码化样品索引寡核苷酸连接的复制衔接子复制至少一个条形码化样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,使捕获探针与至少一个样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;并且将与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针缔合的样品索引寡核苷酸,并且其中复制至少一个样品索引寡核苷酸包括复制与捕获探针缔合的样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

在一些实施方案中,多于一种样品索引组合物中的每一种包含糖类结合试剂。在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含未与样品索引寡核苷酸缔合的第二糖类结合试剂。糖类结合试剂和第二糖类结合试剂可以是相同的(例如,在结构和/或序列上)。

在不同实施方式中,样品索引组合物中的糖类结合试剂的数目可以是不同的。在一些实施方案中,样品索引组合物中的糖类结合试剂的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引组合物中的糖类结合试剂的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在一些实施方案中,样品索引寡核苷酸与糖类结合试剂附接。样品索引寡核苷酸可以与糖类结合试剂共价地附接。样品索引寡核苷酸可以与糖类结合试剂缀合。样品索引寡核苷酸可以与糖类结合试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与糖类结合试剂非共价地附接。样品索引寡核苷酸可以与糖类结合试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸可以是不可从糖类结合试剂解离的,或者可以被配置为不可从糖类结合试剂解离。样品索引寡核苷酸可以是可从糖类结合试剂解离的,或者可以被配置为可从糖类结合试剂解离。该方法可以包括:使样品索引寡核苷酸从糖类结合试剂解离。使样品索引寡核苷酸解离可以包括通过可UV光裂解、化学处理、加热、酶处理或其任何组合使样品索引寡核苷酸从糖类结合试剂解离。

在不同实施方式中,样品索引寡核苷酸的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。样品索引寡核苷酸的长度可以是例如50-500个核苷酸。

在不同实施方式中,样品索引序列的长度可以是不同的。在一些实施方案中,样品索引序列的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引序列的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。样品索引序列的长度可以是例如6-60个核苷酸。

在不同实施方式中,包含具有不同序列的样品索引序列的多于一种样品索引组合物的样品索引组合物的数目可以是不同的。在一些实施方案中,包含具有不同序列的样品索引序列的样品索引组合物的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、10000、100000、1000000、10000000、100000000、1000000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,包含具有不同序列的样品索引序列的样品索引组合物的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、10000、100000、1000000、10000000、100000000或1000000000。多于一种样品索引组合物中的例如至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

样品索引寡核苷酸可以包含分子标记序列、通用引物的结合位点或两者。分子标记序列的长度可以是例如2-20个核苷酸。通用引物的长度可以是例如5-50个核苷酸。通用引物可以包括扩增引物(例如,Illumina P7序列或其子序列)、测序引物(例如,IlluminaR2序列或其子序列)或其组合。

在不同实施方式中,样品索引寡核苷酸的分子标记的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的分子标记的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的分子标记的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在不同实施方式中,样品索引寡核苷酸的通用引物结合位点的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的通用引物结合位点的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的通用引物结合位点的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。在不同实施方式中,靶结合区的长度可以是不同的。在一些实施方案中,靶结合区(例如,聚(dT)区)的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,靶结合区的长度可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。在不同实施方式中,与捕获序列(例如,聚(dA)区)互补的样品索引寡核苷酸的序列可以是不同的。在一些实施方案中,靶结合区的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,与捕获序列互补的样品索引寡核苷酸的序列的长度可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源,与物种的基因组序列同源,或其组合。该物种可以是非哺乳动物物种。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列(例如,图9中的对齐序列820bb)。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。

在不同实施方式中,对齐序列的长度可以是不同的。在一些实施方案中,对齐序列的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,对齐序列的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。在不同实施方式中,对齐序列中鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是不同的。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在一些实施方案中,糖类结合试剂(例如,图8A中的糖类结合试剂816a-816e)可以包括或可以是糖类结合蛋白。糖类结合蛋白可以包括凝集素。凝集素包括甘露糖结合凝集素、半乳糖结合凝集素、N-乙酰半乳糖胺结合凝集素、N-乙酰葡萄糖胺结合凝集素、N-乙酰神经氨酸结合凝集素、岩藻糖结合凝集素或其组合。凝集素可以包括伴刀豆球蛋白A(ConA)、扁豆凝集素(LCH)、雪花莲凝集素(GNA)、蓖麻凝蛋白(RCA)、花生凝集蛋白(PNA)、波罗蜜凝集素(AIL)、毛叶苕子凝集素(VVL)、麦胚凝集蛋白(WGA)、接骨木凝集素(SNA)、朝鲜槐白细胞凝集素(MAL)、朝鲜槐血凝素(MAH)、荆豆凝集蛋白(UEA)、橙黄网孢盘菌凝集素(AAL)或其组合。凝集素可以是凝集蛋白。凝集蛋白可以是麦胚凝集蛋白(WGA)。糖类结合蛋白可以来自或来源于动物、细菌、病毒或真菌。糖类结合蛋白可以来自或来源于植物。植物可以是直生刀豆、兵豆、雪花莲、蓖麻、落花生、波罗蜜、毛叶苕子、普通小麦、西洋接骨木、朝鲜槐、荆豆、橙黄网孢盘菌或其组合。

在一些实施方案中,糖类结合试剂可以与具有相同序列的两个或更多个样品索引寡核苷酸缔合。糖类结合试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。在不同实施方式中,与糖类结合试剂缔合的样品索引寡核苷酸的数目可以是不同的。在一些实施方案中,与糖类结合试剂缔合的样品索引寡核苷酸的数目,无论具有相同序列还是不同序列,可以是以下或是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,与糖类结合试剂缔合的样品索引寡核苷酸的数目,无论具有相同序列还是不同序列,可以是至少以下或是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。

在一些实施方案中,细胞表面糖类靶包括糖、寡糖、多糖、其衍生物或其组合。细胞表面糖类靶可以包括单糖、二糖、多元醇、麦芽寡糖、非麦芽寡糖、淀粉、非淀粉多糖、其衍生物或其组合。细胞表面糖类靶可以包括葡萄糖、半乳糖、果糖、木糖、蔗糖、乳糖、麦芽糖、海藻糖、山梨醇、甘露醇、麦芽糖糊精、棉子糖、水苏糖、果寡糖、直链淀粉、支链淀粉、改性淀粉、糖原、纤维素、半纤维素、果胶、水胶体、其衍生物或其组合。细胞表面糖类靶可以包括α-D-甘露糖基残基、α-D-葡糖基残基、高α-甘露糖型支链α-甘露糖苷结构、混合型和二分支复合型N-聚糖的支链α-甘露糖苷结构、二分支和三分支复合型N-聚糖的岩藻糖基化核心区、α1-3和α1-6连接的高甘露糖结构、Galβ1-4GalNAcβ1-R、Galβ1-3GalNAcα1-Ser/Thr、(Sia)Galβ1-3GalNAcα1-Ser/Thr、GalNAcα-Ser/Thr、GlcNAcβ1-4GlcNAcβ1-4GlcNAc、Neu5Ac(唾液酸)、Neu5Acα2-6Gal(NAc)-R、Neu5Ac/Gcα2,3Galβ1,4Glc(NAc)、Neu5Ac/Gcα2,3Galβ1,3(Neu5Acα2,6)GalNac、Fucα1-2Gal-R、Fucα1-2Galβ1-4(Fucα1-3/4)Galβ1-4GlcNAc、R2-GlcNAcβ1-4(Fucα1-6)GlcNAc-R1、其衍生物或其组合。细胞表面糖类靶可以包括糖蛋白、糖脂或其组合。细胞表面糖类靶可以包括糖类、脂质、蛋白、胞外蛋白、细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体、胞内蛋白或其任何组合。

在一些实施方案中,细胞表面糖类靶选自包括10-100种不同细胞表面糖类靶的组。细胞表面糖类靶可以选自由以下或约以下组成的组:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000或在这些值的任何两个之间的数字或范围的不同细胞表面糖类靶。细胞表面糖类靶可以选自由至少以下或至多以下组成的组:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000种不同细胞表面糖类靶。在不同实施方式中,细胞表面糖类靶的数目可以是不同的。在一些实施方案中,细胞表面糖类靶的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,细胞表面糖类靶的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合的第二糖类结合剂。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的同一种细胞表面糖类靶结合,并且其中第二糖类结合试剂未与样品索引寡核苷酸缔合。第二糖类结合试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且其中样品索引序列和第二样品索引序列是不相同的。糖类结合试剂和第二糖类结合试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。糖类结合试剂和第二糖类结合试剂可以是相同的(例如,在结构和/或序列上)。糖类结合试剂和第二糖类结合试剂可以是不同的(例如,在序列和/或结构上)。

在不同实施方式中,不同糖类结合试剂的数目可以是不同的。在一些实施方案中,不同糖类结合试剂的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,不同糖类结合试剂的数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在不同实施方式中,糖类结合试剂和第二糖类结合试剂(或任何两种糖类结合试剂)的序列同一性可以是不同的。在一些实施方案中,糖类结合试剂和第二糖类结合试剂(或任何两种糖类结合试剂)可以具有以下或约以下的序列同一性:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、30%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,糖类结合试剂和第二糖类结合试剂(或任何两种糖类结合试剂)可以具有至少以下或至多以下的序列同一性:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、30%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

糖类结合试剂和第二糖类结合试剂可以能够与同一种细胞表面糖类靶的不同区域结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的不同细胞表面糖类靶结合。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

在一些实施方案中,多于一个样品中的样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。多于一个样品可以包括哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。

在一些实施方案中,该方法包括去除多于一种样品索引组合物中未结合的样品索引组合物。去除未结合的样品索引组合物可以包括用洗涤缓冲液洗涤来自多于一个样品的每一个中的一个或更多个细胞。去除未结合的样品索引组合物可以包括使用流式细胞术选择与至少一种糖类结合试剂结合的细胞。在一些实施方案中,该方法包括:裂解来自多于一个样品的每一个中的一个或更多个细胞(例如,在图8B中的步骤800e)。

在一些实施方案中,该方法可以包括:在将样品索引寡核苷酸条形码化之前,将与多于一种样品索引组合物接触的多于一个样品汇集(例如,在图8B中的步骤800d)。

在一些实施方案中,多于一个条形码中的条形码包含靶结合区和分子标记序列,并且多于一个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可以包含聚(dT)区。

在一些实施方案中,多于一个条形码与颗粒缔合。多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被封闭在颗粒中、被部分封闭在颗粒中或其组合。颗粒是可破坏的。颗粒可以包括珠。颗粒可以包括Sepharose珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、水凝胶珠、抗生物素微珠、抗荧光染料微珠或其任何组合,或者其中颗粒包括选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、sepharose、纤维素、尼龙、硅酮及其任何组合。颗粒可以包括可破坏的水凝胶珠。

在一些实施方案中,颗粒的条形码可以包括选自至少1000种、10000种不同的分子标记序列或其组合的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包括至少10000种条形码。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括,在将与样品索引寡核苷酸杂交的条形码延伸之前,将与样品索引寡核苷酸杂交的条形码汇集,并且其中将与样品索引寡核苷酸杂交的条形码延伸包括将所汇集的与样品索引寡核苷酸杂交的条形码延伸以产生多于一个汇集的条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化样品索引寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多于一个条形码化样品索引寡核苷酸的测序数据可以包括获得多于一个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶,其中多于一个条形码中的每一个包含细胞标记序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得条形码化靶的测序数据。使用多于一个条形码将多于一个靶条形码化以产生多于一个条形码化靶可以包括:使靶的拷贝与条形码的靶结合区接触;并且使用多于一个条形码逆转录多于一个靶以产生多于一个逆转录的靶。该方法可以包括:在获得多于一个条形码化靶的测序数据之前,扩增条形码化靶以产生多于一个扩增的条形码化靶。扩增条形码化靶以产生多于一个扩增的条形码化靶可以包括:通过聚合酶链式反应(PCR)扩增条形码化靶。使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶可以包括:使用多于一个随机条形码将细胞的多于一个靶随机条形码化以产生多于一个随机条形码化靶。

本文公开了包括多于一种样品索引组合物的实施方案。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的糖类结合试剂,糖类结合试剂能够与至少一种细胞表面糖类靶特异性结合,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

在一些实施方案中,样品索引序列的长度是6-60个核苷酸。样品索引寡核苷酸的长度可以是50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与糖类结合试剂附接。样品索引寡核苷酸可以与糖类结合试剂共价地附接。样品索引寡核苷酸可以与糖类结合试剂缀合。样品索引寡核苷酸可以与糖类结合试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与糖类结合试剂非共价地附接。样品索引寡核苷酸可以与糖类结合试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源。多于一个样品中的至少一个样品可以包括一个或更多个单细胞、多于一个细胞、组织、肿瘤样品或其任何组合。样品可以包括哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。

在一些实施方案中,样品索引寡核苷酸包含分子标记序列、聚(dA)区或其组合。分子标记序列的长度是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,糖类结合试剂包括糖类结合蛋白。糖类结合蛋白可以包括凝集素。凝集素可以包括甘露糖结合凝集素、半乳糖结合凝集素、N-乙酰半乳糖胺结合凝集素、N-乙酰葡萄糖胺结合凝集素、N-乙酰神经氨酸结合凝集素、岩藻糖结合凝集素或其组合。凝集素可以包括伴刀豆球蛋白A(ConA)、扁豆凝集素(LCH)、雪花莲凝集素(GNA)、蓖麻凝蛋白(RCA)、花生凝集蛋白(PNA)、波罗蜜凝集素(AIL)、毛叶苕子凝集素(VVL)、麦胚凝集蛋白(WGA)、接骨木凝集素(SNA)、朝鲜槐白细胞凝集素(MAL)、朝鲜槐血凝素(MAH)、荆豆凝集蛋白(UEA)、橙黄网孢盘菌凝集素(AAL)或其组合。凝集素可以是凝集蛋白。凝集蛋白可以是麦胚凝集蛋白(WGA)。糖类结合蛋白可以来自或来源于动物、细菌、病毒或真菌。糖类结合蛋白可以来自或来源于植物。植物可以是直生刀豆、兵豆、雪花莲、蓖麻、落花生、波罗蜜、毛叶苕子、普通小麦、西洋接骨木、朝鲜槐、荆豆、橙黄网孢盘菌或其组合。

在一些实施方案中,细胞表面糖类靶包括糖、寡糖、多糖、其衍生物或其组合。细胞表面糖类靶可以包括单糖、二糖、多元醇、麦芽寡糖、非麦芽寡糖、淀粉、非淀粉多糖、其衍生物或其组合。细胞表面糖类靶可以包括葡萄糖、半乳糖、果糖、木糖、蔗糖、乳糖、麦芽糖、海藻糖、山梨醇、甘露醇、麦芽糖糊精、棉子糖、水苏糖、果寡糖、直链淀粉、支链淀粉、改性淀粉、糖原、纤维素、半纤维素、果胶、水胶体、其衍生物或其组合。细胞表面糖类靶可以包括α-D-甘露糖基残基、α-D-葡糖基残基、高α-甘露糖型支链α-甘露糖苷结构、混合型和二分支复合型N-聚糖的支链α-甘露糖苷结构、二分支和三分支复合型N-聚糖的岩藻糖基化核心区、α1-3和α1-6连接的高甘露糖结构、Galβ1-4GalNAcβ1-R、Galβ1-3GalNAcα1-Ser/Thr、(Sia)Galβ1-3GalNAcα1-Ser/Thr、GalNAcα-Ser/Thr、GlcNAcβ1-4GlcNAcβ1-4GlcNAc、Neu5Ac(唾液酸)、Neu5Acα2-6Gal(NAc)-R、Neu5Ac/Gcα2,3Galβ1,4Glc(NAc)、Neu5Ac/Gcα2,3Galβ1,3(Neu5Acα2,6)GalNac、Fucα1-2Gal-R、Fucα1-2Galβ1-4(Fucα1-3/4)Galβ1-4GlcNAc、R2-GlcNAcβ1-4(Fucα1-6)GlcNAc-R1、其衍生物或其组合。细胞表面糖类靶可以包括糖蛋白、糖脂或其组合。细胞表面糖类靶可以包括细胞表面蛋白、细胞标志物、B细胞受体、T细胞受体、主要组织相容性复合体、肿瘤抗原、受体或其任何组合。在一些实施方案中,细胞表面糖类靶选自包括10-100种不同细胞表面糖类靶的组。

在一些实施方案中,糖类结合试剂与具有相同序列的两个或更多个样品索引寡核苷酸缔合。糖类结合试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。

在一些实施方案中,样品索引组合物包含第二糖类结合试剂,并且其中第二糖类结合试剂能够与一种或更多种细胞表面糖类靶中的至少一种特异性结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的同一种细胞表面糖类靶结合,并且第二糖类结合试剂可以未与样品索引寡核苷酸缔合。第二糖类结合试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且样品索引序列和第二样品索引序列可以是不相同的。糖类结合试剂和第二糖类结合试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。糖类结合试剂和第二糖类结合试剂可以是相同的,例如,在序列和/或结构上。糖类结合试剂和第二糖类结合试剂可以能够与同一种细胞表面糖类靶的不同区域结合。糖类结合试剂和第二糖类结合试剂可以能够与一种或更多种细胞表面糖类靶中的不同细胞表面糖类靶结合。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

图8A-图8B示出了使用寡核苷酸缔合的细胞膜透过性试剂进行样品索引或样品鉴定的示例性工作流程的示意图。该方法可以包括在步骤800a,使每个样品的细胞与样品索引组合物接触;在步骤800b,汇集来自与样品索引组合物接触的不同样品的细胞;在步骤800c,用单个珠将汇集的细胞的单细胞共分区至多于一个分区;在步骤800d,在分区中裂解细胞并将样品索引组合物的样品索引寡核苷酸条形码化;以及在步骤800e,获得条形码化样品索引寡核苷酸的测序数据。

本文公开了包括用于样品鉴定的方法的实施方案。在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触(例如,在图8A中的步骤800a)。多于一个样品中的每一个可以包含一个或更多个细胞(例如,图8A中分别为样品804a-804e的细胞808a-808e)。样品索引组合物可以包含与样品索引寡核苷酸缔合的细胞膜透过性试剂(例如,细胞膜透过性试剂816a-816e中的一种)。细胞膜透过性试剂可以是,例如,钙黄绿素、其前体或其衍生物。样品索引寡核苷酸(例如,图8A中的样品索引寡核苷酸820a-820e中的一种)包含样品索引序列(例如,图9中的样品索引标识符或条形码序列820si),并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。该方法可以包括使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸(例如,在图8B中的步骤800e);获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列,鉴定一个或更多个细胞中的至少一个细胞的样品来源。

在一些实施方案中,该方法包括:使多于一个样品中的每一个分别与多于一种样品索引组合物中的样品索引组合物接触(例如,在图8A中的步骤800a)。多于一个样品中的每一个可以包含一个或更多个细胞(例如,图8A中分别为样品804a-804e的细胞808a-808e)。样品索引组合物可以包含与样品索引寡核苷酸(例如,图8A中的样品索引寡核苷酸820a-820e中的一种)缔合的细胞膜透过性试剂(例如,细胞膜透过性试剂816a-816e中的一种,诸如钙黄绿素)。样品索引寡核苷酸可以包含样品索引序列(例如,图9中的样品索引标识符或条形码序列820si),并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。该方法可以包括基于至少一个样品的样品索引序列鉴定一个或更多个细胞中的至少一个细胞的样品来源(例如,在图8B中的步骤800e)。在一些实施方案中,鉴定至少一个细胞的样品来源包括:使用多于一个条形码将多于一种样品索引组合物中的样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸;获得多于一个条形码化样品索引寡核苷酸的测序数据;并且基于测序数据中多于一个条形码化样品索引寡核苷酸中的至少一个条形码化样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,鉴定至少一个细胞的样品来源可以包括鉴定多于一种样品索引组合物中的至少一个样品索引寡核苷酸的样品索引序列的存在或不存在。鉴定样品索引序列的存在或不存在可以包括:复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸;获得多于一个复制的样品索引寡核苷酸的测序数据;并且基于测序数据中对应于至少一个条形码化样品索引寡核苷酸的多于一个样品索引寡核苷酸的复制的样品索引寡核苷酸的样品索引序列鉴定细胞的样品来源。

在一些实施方案中,复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,将复制衔接子与至少一个条形码化样品索引寡核苷酸连接,并且复制至少一个条形码化样品索引寡核苷酸可以包括使用与至少一个条形码化样品索引寡核苷酸连接的复制衔接子复制至少一个条形码化样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。复制至少一个样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸可以包括:在复制至少一个条形码化样品索引寡核苷酸之前,使捕获探针与至少一个样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的捕获探针;并且将与样品索引寡核苷酸杂交的捕获探针延伸以产生与捕获探针缔合的样品索引寡核苷酸,并且复制至少一个样品索引寡核苷酸可以包括复制与捕获探针缔合的样品索引寡核苷酸以产生多于一个复制的样品索引寡核苷酸。

在一些实施方案中,多于一种样品索引组合物中的每一种包含细胞膜透过性试剂。在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含未与样品索引寡核苷酸缔合的第二细胞膜透过性试剂。细胞膜透过性试剂和第二细胞膜透过性试剂可以是相同的(例如,在结构和/或序列上)。

在不同实施方式中,样品索引组合物中的细胞膜透过性试剂的数目可以是不同的。在一些实施方案中,样品索引组合物中的细胞膜透过性试剂的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引组合物中的细胞膜透过性试剂的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在一些实施方案中,样品索引寡核苷酸与细胞膜透过性试剂附接。样品索引寡核苷酸可以与细胞膜透过性试剂共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂缀合。样品索引寡核苷酸可以与细胞膜透过性试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与细胞膜透过性试剂非共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸可以是不可从细胞膜透过性试剂解离的,或者可以被配置为不可从细胞膜透过性试剂解离。样品索引寡核苷酸可以是可从细胞膜透过性试剂解离的,或者可以被配置为可从细胞膜透过性试剂解离。该方法可以包括使样品索引寡核苷酸从细胞膜透过性试剂解离。使样品索引寡核苷酸解离可以包括通过可UV光裂解、化学处理、加热、酶处理或其任何组合使样品索引寡核苷酸从细胞膜透过性试剂解离。

在不同实施方式中,样品索引寡核苷酸的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。样品索引寡核苷酸的长度可以是例如50-500个核苷酸。

在不同实施方式中,样品索引序列的长度可以是不同的。在一些实施方案中,样品索引序列的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引序列的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。样品索引序列的长度可以是例如6-60个核苷酸。

在不同实施方式中,包含具有不同序列的样品索引序列的多于一种样品索引组合物的样品索引组合物的数目可以是不同的。在一些实施方案中,包含具有不同序列的样品索引序列的样品索引组合物的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、10000、100000、1000000、10000000、100000000、1000000000或在这些值的任何两个之间的数字或范围。在一些实施方案中,包含具有不同序列的样品索引序列的样品索引组合物的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、10000、100000、1000000、10000000、100000000或1000000000。多于一种样品索引组合物中的例如至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

样品索引寡核苷酸可以包含分子标记序列、通用引物的结合位点或两者。分子标记序列的长度可以是例如2-20个核苷酸。通用引物的长度可以是例如5-50个核苷酸。通用引物可以包括扩增引物(例如,Illumina P7序列或其子序列)、测序引物(例如,IlluminaR2序列或其子序列)或其组合。

在不同实施方式中,样品索引寡核苷酸的分子标记的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的分子标记的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的分子标记的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在不同实施方式中,样品索引寡核苷酸的通用引物结合位点的长度可以是不同的。在一些实施方案中,样品索引寡核苷酸的通用引物结合位点的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,样品索引寡核苷酸的通用引物结合位点的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在一些实施方案中,样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。在不同实施方式中,靶结合区的长度可以是不同的。在一些实施方案中,靶结合区(例如,聚(dT)区)的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,靶结合区的长度可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。在不同实施方式中,与捕获序列(例如,聚(dA)区)互补的样品索引寡核苷酸的序列可以是不同的。在一些实施方案中,靶结合区的长度可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,与捕获序列互补的样品索引寡核苷酸的序列的长度可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源,与物种的基因组序列同源,或其组合。该物种可以是非哺乳动物物种。

在一些实施方案中,样品索引寡核苷酸包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。

在不同实施方式中,对齐序列的长度可以是不同的。在一些实施方案中,对齐序列的长度可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,对齐序列的长度可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。在不同实施方式中,对齐序列中鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是不同的。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是以下或可以是约以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100或在这些值的任何两个之间的数字或范围。鸟嘌呤、胞嘧啶、胸腺嘧啶或尿嘧啶的数目可以是至少以下或可以是至多以下:1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100。

在一些实施方案中,细胞膜透过性试剂被内化到一个或更多个细胞中。细胞膜透过性试剂可以通过扩散通过一个或更多个细胞的细胞膜被内化到一个或更多个细胞中。该方法可以包括使一个或更多个细胞的细胞膜透化。使一个或更多个细胞的细胞膜透化包括使用去污剂使一个或更多个细胞的细胞膜透化。细胞膜透过性试剂可以经由一个或更多个细胞的一种或更多种膜转运蛋白被内化到一个或更多个细胞中。

在一些实施方案中,细胞膜透过性试剂包括有机分子、肽、脂质或其组合。有机分子可以包括细胞膜透过性有机分子。有机分子可以包括染料。有机分子可以包括荧光染料。有机分子可以包括环结构。环结构可以包含例如5-50个碳原子。有机分子可以包括碳链。碳链可以包含例如5-50个碳原子。有机分子在被内化到一个或更多个细胞中之后可以被转化为第二有机分子。有机分子可以是乙酰氧基甲基钙黄绿素(钙黄绿素AM),并且其中第二有机分子是钙黄绿素。

在不同实施方案中,环结构可以具有不同数目的碳原子。在一些实施方案中,环结构中的碳原子的数目可以是以下或可以是约以下:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或在这些值的任何两个之间的数字或范围。在一些实施方案中,环结构中的碳原子的数目可以是至少以下或可以是至多以下:4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50。

在不同实施方案中,碳链可以具有不同数目的碳原子。在一些实施方案中,碳链中的碳原子的数目可以是以下或可以是约以下:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或在这些值的任何两个之间的数字或范围。在一些实施方案中,碳链中的碳原子的数目可以是至少以下或可以是至多以下:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50。

在一些实施方案中,肽可以包括细胞膜透过性肽。肽的长度可以是例如5-30个氨基酸。在不同实施方案中,肽的长度可以是不同的。在一些实施方案中,肽的长度可以是以下或可以是约以下:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100或在这些值的任何两个之间的数字或范围。在一些实施方案中,肽的长度可以是至少以下或可以是至多以下:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90或100。细胞膜透过性试剂可以插入一个或更多个细胞的细胞膜中。细胞膜透过性试剂可以包括脂质。

在一些实施方案中,细胞膜透过性试剂与具有相同序列的两个或更多个样品索引寡核苷酸缔合。细胞膜透过性试剂可以与具有不同样品索引序列的两个或更多个样品索引寡核苷酸缔合。在不同实施方式中,与细胞膜透过性试剂缔合的样品索引寡核苷酸的数目可以是不同的。在一些实施方案中,与细胞膜透过性试剂缔合的样品索引寡核苷酸的数目,无论具有相同序列还是不同序列,可以是以下或是约以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,与细胞膜透过性试剂缔合的样品索引寡核苷酸的数目,无论具有相同序列还是不同序列,可以是至少以下或是至多以下:1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000。

在一些实施方案中,多于一种样品索引组合物中的样品索引组合物包含第二细胞膜透过性试剂。第二细胞膜透过性试剂可以与包含第二样品索引序列的第二样品索引寡核苷酸缔合,并且其中样品索引序列和第二样品索引序列是不相同的。细胞膜透过性试剂和第二细胞膜透过性试剂可以至少60%、70%、80%、90%或95%相同(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以是相同的(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以是不同的(例如,在序列和/或结构上)。细胞膜透过性试剂和第二细胞膜透过性试剂可以经由相同机制或不同机制被内化到细胞中。样品索引序列和第二样品索引序列可以是相同的。样品索引序列和第二样品索引序列可以是不同的。

在不同实施方式中,不同细胞膜透过性试剂的数目可以是不同的。在一些实施方案中,不同细胞膜透过性试剂的数目可以是以下或可以是约以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000或在这些值的任何两个之间的数字或范围。在一些实施方案中,不同细胞膜透过性试剂的数目可以是至少以下或可以是至多以下:2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990或1000。

在不同实施方式中,细胞膜透过性试剂和第二细胞膜透过性试剂(或任何两种细胞膜透过性试剂)的序列同一性可以是不同的。在一些实施方案中,细胞膜透过性试剂和第二细胞膜透过性试剂(或任何两种细胞膜透过性试剂)可以具有以下或约以下的序列同一性:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、30%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%或在这些值的任何两个之间的数字或范围。在一些实施方案中,细胞膜透过性试剂和第二细胞膜透过性试剂(或任何两种细胞膜透过性试剂)可以具有至少以下或至多以下的序列同一性:1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、30%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%。

在一些实施方案中,多于一个样品中的样品包括多于一个细胞、多于一个单细胞、组织、肿瘤样品或其任何组合。多于一个样品可以包括哺乳动物细胞、细菌细胞、病毒细胞、酵母细胞、真菌细胞或其任何组合。

在一些实施方案中,该方法包括:去除多于一种样品索引组合物中未结合的样品索引组合物。去除未结合的样品索引组合物可以包括用洗涤缓冲液洗涤来自多于一个样品的每一个中的一个或更多个细胞。去除未结合的样品索引组合物可以包括使用流式细胞术选择未与至少一种细胞膜透过性试剂接触的细胞。在一些实施方案中,该方法包括裂解来自多于一个样品的每一个中的一个或更多个细胞。

在一些实施方案中,该方法包括:在将样品索引寡核苷酸条形码化之前,将与多于一种样品索引组合物接触的多于一个样品汇集(例如,在图8B中的步骤800d)。

在一些实施方案中,多于一个条形码中的条形码包含靶结合区和分子标记序列,并且多于一个条形码中的至少两个条形码的分子标记序列包含不同的分子标记序列。条形码可以包含细胞标记序列、通用引物的结合位点或其任何组合。靶结合区可以包含聚(dT)区。

在一些实施方案中,多于一个条形码与颗粒缔合。多于一个条形码中的至少一个条形码可以被固定在颗粒上、被部分固定在颗粒上、被封闭在颗粒中、被部分封闭在颗粒中或其组合。颗粒可以是可破坏的。颗粒可以包括珠。颗粒可以包括sepharose珠、链霉抗生物素蛋白珠、琼脂糖珠、磁珠、缀合珠、蛋白A缀合珠、蛋白G缀合珠、蛋白A/G缀合珠、蛋白L缀合珠、寡(dT)缀合珠、二氧化硅珠、二氧化硅样珠、水凝胶珠、抗生物素微珠、抗荧光染料微珠或其任何组合,或者其中颗粒包括选自由以下组成的组的材料:聚二甲基硅氧烷(PDMS)、聚苯乙烯、玻璃、聚丙烯、琼脂糖、明胶、水凝胶、顺磁物质、陶瓷、塑料、玻璃、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、sepharose、纤维素、尼龙、硅酮及其任何组合。颗粒可以包括可破坏的水凝胶珠。

在一些实施方案中,颗粒的条形码可以包括选自至少1000种、10000种不同的分子标记序列或其组合的分子标记序列。条形码的分子标记序列可以包含随机序列。颗粒可以包括至少10000种条形码。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化包括:使多于一个条形码与样品索引寡核苷酸接触以产生与样品索引寡核苷酸杂交的条形码;并且将与样品索引寡核苷酸杂交的条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:在将与样品索引寡核苷酸杂交的条形码延伸之前,将与样品索引寡核苷酸杂交的条形码汇集,并且其中将与样品索引寡核苷酸杂交的条形码延伸包括将所汇集的与样品索引寡核苷酸杂交的条形码延伸以产生多于一个汇集的条形码化样品索引寡核苷酸。将条形码延伸可以包括使用DNA聚合酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。将条形码延伸可以包括使用逆转录酶将条形码延伸以产生多于一个条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:扩增多于一个条形码化样品索引寡核苷酸以产生多于一个扩增子。扩增多于一个条形码化样品索引寡核苷酸可以包括使用聚合酶链式反应(PCR)扩增分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分。获得多于一个条形码化样品索引寡核苷酸的测序数据可以包括获得多于一个扩增子的测序数据。获得测序数据可以包括对分子标记序列的至少一部分和样品索引寡核苷酸的至少一部分进行测序。

在一些实施方案中,使用多于一个条形码将样品索引寡核苷酸条形码化以产生多于一个条形码化样品索引寡核苷酸包括使用多于一个随机条形码将样品索引寡核苷酸随机条形码化以产生多于一个随机条形码化样品索引寡核苷酸。

在一些实施方案中,该方法包括:使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶,其中多于一个条形码中的每一个包含细胞标记序列,并且其中多于一个条形码中的至少两个条形码包含相同的细胞标记序列;并且获得条形码化靶的测序数据。使用多于一个条形码将多于一个靶条形码化以产生多于一个条形码化靶可以包括:使靶的拷贝与条形码的靶结合区接触;并且使用多于一个条形码逆转录多于一个靶以产生多于一个逆转录的靶。该方法可以包括:在获得多于一个条形码化靶的测序数据之前,扩增条形码化靶以产生多于一个扩增的条形码化靶。扩增条形码化靶以产生多于一个扩增的条形码化靶可以包括:通过聚合酶链式反应(PCR)扩增条形码化靶。使用多于一个条形码将细胞的多于一个靶条形码化以产生多于一个条形码化靶可以包括:使用多于一个随机条形码将细胞的多于一个靶随机条形码化以产生多于一个随机条形码化靶。

本文公开了包括多于一种样品索引组合物。在一些实施方案中,多于一种样品索引组合物中的每一种包含与样品索引寡核苷酸缔合的细胞膜透过性试剂,样品索引寡核苷酸包含用于鉴定样品中的一个或更多个细胞的样品来源的样品索引序列,并且多于一种样品索引组合物中的至少两种样品索引组合物的样品索引序列包含不同的序列。

在一些实施方案中,样品索引序列的长度是6-60个核苷酸。样品索引寡核苷酸的长度可以是50-500个核苷酸。多于一种样品索引组合物中的至少10种、100种或1000种样品索引组合物的样品索引序列可以包含不同的序列。

在一些实施方案中,样品索引寡核苷酸与细胞膜透过性试剂附接。样品索引寡核苷酸可以与细胞膜透过性试剂共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂缀合。样品索引寡核苷酸可以与细胞膜透过性试剂通过选自由以下组成的组的化学基团缀合:可UV光裂解基团、链霉抗生物素蛋白、生物素、胺及其组合。样品索引寡核苷酸可以与细胞膜透过性试剂非共价地附接。样品索引寡核苷酸可以与细胞膜透过性试剂通过接头缔合。

在一些实施方案中,样品索引寡核苷酸与一个或更多个细胞中任一个的基因组序列不同源。多于一个样品中的至少一个样品可以包括一个或更多个单细胞、多于一个细胞、组织、肿瘤样品或其任何组合。样品可以包括哺乳动物样品、细菌样品、病毒样品、酵母样品、真菌样品或其任何组合。

在一些实施方案中,其中样品索引寡核苷酸包含与捕获序列互补的序列,该捕获序列被配置为捕获样品索引寡核苷酸的序列。条形码可以包括包含捕获序列的靶结合区。靶结合区可以包含聚(dT)区。与捕获序列互补的样品索引寡核苷酸的序列可以包含聚(dA)区。

在一些实施方案中,样品索引寡核苷酸可以包含与聚(dA)区相邻的对齐序列。对齐序列的长度可以是一个或更多个核苷酸。对齐序列的长度可以是两个或更多个核苷酸。对齐序列可以包含鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶或其组合。对齐序列可以包含聚(dT)区、聚(dG)区、聚(dC)区、聚(dU)区或其组合。样品索引寡核苷酸可以包含分子标记序列、聚(dA)区或其组合。分子标记序列的长度可以是2-20个核苷酸。通用引物的长度可以是5-50个核苷酸。通用引物可以包括扩增引物、测序引物或其组合。

在一些实施方案中,其中细胞膜透过性试剂被配置为被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的透化的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为通过扩散通过一个或更多个细胞的去污剂透化的细胞膜被内化到一个或更多个细胞中。细胞膜透过性试剂可以被配置为经由一个或更多个细胞的一种或更多种膜转运蛋白被内化到一个或更多个细胞中。

在一些实施方案中,细胞膜透过性试剂包括有机分子、肽、脂质或其组合。有机分子可以包括细胞膜透过性有机分子。有机分子可以包括染料。有机分子可以包括荧光染料。有机分子可以包括环结构。环结构可以包含5-50个碳原子。有机分子可以包括碳链。碳链包含5-50个碳原子。有机分子在被内化到一个或更多个细胞中之后可以被转化为第二有机分子。有机分子可以是乙酰氧基甲基钙黄绿素(钙黄绿素AM),并且其中第二有机分子是钙黄绿素。

在一些实施方案中,肽可以包括细胞膜透过性肽。肽的长度可以是5-30个氨基酸。细胞膜透过性试剂可以插入一个或更多个细胞的细胞膜中。细胞膜透过性试剂可以包括脂质。

实施例

以上讨论的实施方案的一些方面在以下实例中进一步详细公开,其并非意图以任何方式限制本公开内容的范围。

该实施例展示了可以与蛋白结合试剂缀合的寡核苷酸的设计。寡核苷酸可以用于同时确定蛋白表达和基因表达。寡核苷酸也可以用于样品索引化,以确定相同或不同样品的细胞。

使用以下方法产生候选寡核苷酸序列和对应的引物序列,用于同时确定蛋白表达和基因表达或样品索引化。

使用以下过程产生候选寡核苷酸序列,用于同时确定蛋白表达和基因表达或用于样品索引化。

步骤1a.随机产生许多具有期望长度(45bp)的候选序列(50000种序列)。

步骤1b.将转录调控因子LSRR序列附接至所产生的序列的5’端,并且将聚(dA)序列(25bp)附接至所产生的序列的3’端。

步骤1c.去除产生和附接的不具有40%至50%范围内的GC含量的序列。

步骤1d.去除每种具有一个或更多个发夹结构的剩余序列。

剩余的候选寡核苷酸序列的数目是423种。

使用以下方法为剩余的423种候选寡核苷酸序列设计引物。

2.2a.去除不从N1序列下游开始的候选N2引物。

2.2b.去除在候选寡核苷酸序列的最后35bp中重叠的候选N2引物。

2.2c.去除与使用寡核苷酸研究的物种细胞的转录物组(例如,人类转录物组或小鼠转录物组)对齐的候选引物。

2.2d.使用ILR2序列作为缺省对照(ACACGACGCTCTTCCGATCT;SEQ ID NO.6)以使引物-引物相互作用最小化或避免引物-引物相互作用。

在423种候选寡核苷酸序列中,为390种候选物设计了N2引物。

使用以下过程过滤剩余的390种候选引物序列。

3a.排除任何具有以A结尾的随机序列的候选寡核苷酸序列(即,聚(dA)序列的实际长度大于25bp),以保持所有条形码的聚(dA)尾长度相同。

3b.因为在G的情况下寡核苷酸合成中额外的成本和潜在的较低产量,因此排除任何具有4个或更多个连续G(>3G)的候选寡核苷酸序列。

图10A示出了使用以上方法产生的非限制性示例性候选寡核苷酸序列。

使用以下方法产生候选寡核苷酸序列和对应的引物序列,用于同时确定蛋白表达和基因表达以及用于样品索引化。

使用以下产生候选寡核苷酸序列,用于同时确定蛋白表达和基因表达以及用于样品索引化。

1a.随机产生许多具有期望长度(128bp)的候选序列(100000种序列)。

1b.将转录调控因子LSRR序列和另外的非人类、非小鼠的锚定序列附接至所产生的序列的5’端,并且将聚(dA)序列(25bp)附接至所产生的序列的3’端。

1c.去除产生和附接的不具有40%至50%范围内的GC含量的序列。

1d.基于发夹结构评分对剩余的候选寡核苷酸序列进行分选。

1e.选择1000种剩余的具有最低发夹评分的候选寡核苷酸序列。

使用以下方法为400种具有最低发夹评分的候选寡核苷酸序列设计引物。

2.2N2引物(用于扩增特定样品索引寡核苷酸;例如,图10B和图10C中的N2引物):

2.2a.去除不从N1序列下游23nt开始的候选N2引物(锚定序列在所有候选寡核苷酸序列中都是通用的)。

2.2b.去除在靶序列的最后100bp中重叠的候选N2引物。所得的候选引物可以在靶序列的第48个核苷酸和第100个核苷酸之间。

2.2c.去除与使用寡核苷酸研究的物种细胞的转录物组(例如,人类转录物组或小鼠转录物组)对齐的候选引物。

2.2d.使用ILR2序列5’-ACACGACGCTCTTCCGATCT-3’(SEQ ID NO.6)作为缺省对照,以使引物-引物相互作用最小化或避免引物-引物相互作用。

2.2e.去除在靶序列的最后100bp中重叠的候选N2引物。

在400种候选寡核苷酸序列中,为392种候选物设计了N2引物。

使用以下过滤剩余的392种候选引物序列。

3a.排除任何具有以A结尾的随机序列的候选寡核苷酸序列(即,聚(dA)序列的实际长度大于25bp),以保持所有条形码的聚(dA)尾长度相同。

3b.因为在G的情况下寡核苷酸合成中额外的成本和潜在的较低产量,因此排除任何具有4个或更多个连续G(>3G)的候选寡核苷酸序列。

图10B示出了使用以上方法产生的非限制性示例性候选寡核苷酸序列。图10B中示出的巢式N2引物可以与抗体或样品特异性序列结合,以用于靶向扩增。图10C示出了相同的非限制性示例性候选寡核苷酸序列,其中巢式通用N2引物对应于锚定序列,以用于靶向扩增。图10D示出了相同的非限制性示例性候选寡核苷酸序列,其中N2引物用于一步靶向扩增。

总之,这些数据表明不同长度的寡核苷酸序列可以被设计成用于同时确定蛋白表达和基因表达或用于样品索引化。寡核苷酸序列可以包括通用引物序列、抗体特异性寡核苷酸序列或样品索引序列以及聚(dA)序列。

该实施例展示了使用寡核苷酸缀合的抗体来确定蛋白靶的表达谱的工作流程。

将受试者的冷冻的细胞(例如,冷冻的外周血单核细胞(PBMC))解冻。将解冻的细胞用寡核苷酸缀合的抗体(例如,以0.06μg/100μl的抗CD4抗体(1:333稀释的寡核苷酸缀合的抗体储备液))在一定温度染色一段持续时间(例如,室温持续20分钟)。寡核苷酸缀合的抗体缀合有1个、2个或3个寡核苷酸(“抗体寡核苷酸”)。抗体寡核苷酸的序列在图11中示出。洗涤细胞以去除未结合的寡核苷酸缀合的抗体。将细胞任选地用钙黄绿素AM(BD(Franklin Lake,New Jersey))和Draq7

在包含单细胞和珠的孔中,将孔中的单细胞(例如,3500个活细胞)在裂解缓冲液(例如,含有5mM DTT的裂解缓冲液)中裂解。靶(例如,CD4)的mRNA表达谱使用BD Rhapsody

逆转录产物和复制产物使用引物进行PCR扩增,以便使用N1引物确定感兴趣基因的mRNA表达谱,并且使用抗体寡核苷酸N1引物确定靶的蛋白表达谱。例如,逆转录产物和复制产物可以使用引物在60度退火温度PCR扩增持续15个循环,以便使用血液组(bloodpanel)N1引物确定488个血液组基因的mRNA表达谱,并且使用抗体寡核苷酸N1引物(“PCR1”)确定CD4蛋白的表达谱。过量的条形码任选地通过Ampure清理来去除。来自PCR 1的产物任选地分成两份等分试样,一份等分试样用于使用针对感兴趣基因的N2引物确定感兴趣基因的mRNA表达谱,并且一份等分试样用于使用抗体寡核苷酸N2引物(“PCR 2”)确定感兴趣靶的蛋白表达谱。两份等分试样都进行PCR扩增(例如,在60度退火温度持续15个循环)。基于如图11中示的抗体寡核苷酸(“PCR 2”),确定细胞中的靶的蛋白表达。在添加测序衔接子(“PCR 3”)诸如测序衔接子连接之后获得测序数据并进行分析。细胞类型基于感兴趣基因的mRNA表达谱确定。

总之,该实施例描述了使用寡核苷酸缀合的抗体来确定感兴趣靶的蛋白表达谱。该实施例还描述了可以同时确定感兴趣靶的蛋白表达谱和感兴趣基因的mRNA表达谱。

在至少一些先前描述的实施方案中,在一种实施方案中使用的一个或更多个要素可以互换地用于另一种实施方案中,除非这种替换在技术上不可行。本领域技术人员将理解,在不脱离所要求保护的主题的范围的情况下,可以对上述方法和结构进行各种其他的省略、添加和修改。所有此类修改和改变都旨在落在由所附权利要求书限定的主题的范围内。

关于本文中基本上任何复数和/或单数术语的使用,在对于背景和/或应用适当的情况下,本领域技术人员可以从复数转换为单数和/或从单数转换为复数。为了清楚起见,可以在本文明确阐述各种单数/复数排列。如本说明书和所附权利要求书中使用的,单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数指代物,除非上下文另外明确指示。除非另外说明,否则在本文中对“或”的任何提及旨在涵盖“和/或”。

本领域技术人员将理解,通常,本文使用的术语,并且特别是所附权利要求书(例如,所附权利要求书的主体)中的术语,通常旨在作为“开放性的”术语(例如,术语“包括/包含(including)”应解释为“包括但不限于(including but not limited to)”,术语“具有(having)”应解释为“具有至少(having at least)”,术语“包括/包含(includes)”应解释为“包括但不限于(includes but is not limited to)”等)。本领域技术人员将进一步理解,如果意图所介绍的权利要求陈述的特定数字,则这样的意图将明确地陈述于权利要求中,并且在这种陈述不存在的情况下,不存在这种意图。例如,作为对理解的帮助,所附权利要求书可以包含介绍性措辞“至少一个”和“一个或更多个”的使用,以介绍权利要求陈述。然而,此类措辞的使用不应解读为意味着由不定冠词“一(a)”或“一(an)”介绍权利要求陈述会将任何包含这种介绍的权利要求陈述的具体权利要求限制到包含仅一个这种陈述的实施方案中,甚至当相同的权利要求包括介绍性措辞“一个或更多个”或“至少一个”以及不定冠词诸如“一(a)”或“一(an)”时也是如此(例如,“一(a)”和/或“一(an)”应解释为意指“至少一个”或“一个或更多个”);这对于使用定冠词来介绍权利要求陈述同样适用。此外,即使明确地陈述了介绍的权利要求陈述的特定数字,本领域技术人员将认识到,这种陈述应解释为意指至少所陈述的数字(例如,仅陈述“两个陈述”而没有其他修饰词意指至少两个陈述或两个或更多个陈述)。此外,在使用类似于“A、B和C等中的至少一个”的惯例的那些情况下,通常这种句法结构意图为本领域技术人员将理解该惯例的意义(例如,“具有A、B和C中的至少一个的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。在使用类似于“A、B或C等中的至少一个”的惯例的那些情况下,通常这种句法结构意图为本领域技术人员将理解该惯例的意义(例如,“具有A、B或C中的至少一个的系统”将包括但不限于具有单独的A,具有单独的B,具有单独的C,A和B一起,A和C一起,B和C一起,和/或A、B和C一起等的系统)。本领域技术人员将进一步理解,实际上,无论在说明书、权利要求书还是在附图中,呈现两个或更多个替代术语的任何分离性词语和/或措辞应被理解为考虑到包括术语之一、任一术语或两个术语的可能性。例如,短语“A或B”应被理解为包括“A”或“B”或“A和B”的可能性。

此外,当本公开内容的特征或方面以马库什组(Markush group)描述时,本领域技术人员将意识到本公开内容还由此以马库什组的任何个体成员或成员子组描述。

如本领域技术人员将理解的,为了任何和所有目的,诸如在提供书面描述方面,本文公开的所有范围还包括任何和所有可能的该范围的子范围和子范围组合。任何列举的范围可以被容易地认为充分地描述了并且使得同一范围能够被分成至少相等的二分之一、三分之一、四分之一、五分之一、十分之一。作为非限制性实例,本文讨论的每个范围可以被容易地分成下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的,所有语言文字诸如“多达(up to)”、“至少”、“大于”、“少于”等包括所引述的数字并且指随后可以被分成如以上讨论的子范围的范围。最后,如本领域技术人员将理解的,范围包括每个个体的成员。因此,例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组,等等。

尽管本文已经公开了各种方面和实施方案,但其他方面和实施方案对本领域技术人员将是明显的。本文公开的各种方面和实施方案用于说明的目的而并不意图限制由所附权利要求书所指出的真实范围和精神。

序列表

<110> 赛卢拉研究公司

玛格丽特·纳卡莫托

艾琳·夏姆

<120> 使用糖类结合试剂和膜透过性试剂进行样品多重化

<130> 68EB-298702-WO

<150> 62/723,958

<151> 2018-08-28

<160> 8

<170> PatentIn version 3.5

<210> 1

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 1

aaaaaaaaaa aaaaaaaaaa 20

<210> 2

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 2

tttttttttt tttttttttt 20

<210> 3

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<220>

<221> 5AmMC6

<222> (1)..(1)

<223> 5'氨基修饰物C6

<400> 3

gttgtcaaga tgctaccgtt cagagtacgt ggagttggtg gcccgacccc gagcgctacg 60

agccccccgg aaaaaaaaaa aaaaaaaaaa aaaaa 95

<210> 4

<211> 200

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<220>

<221> 5AmMC6

<222> (1)..(1)

<223> 5'氨基修饰物C6

<400> 4

gttgtcaaga tgctaccgtt cagagctact gtccgaagtt accgtgtatc taccacgggt 60

ggtttttcga atccggaaaa gatagtaata agtgttttag ttggaataag tcgcaacttt 120

tggagacggt tacctctcaa tttttctgat ccgtaggccc cccgatctcg gcctcaaaaa 180

aaaaaaaaaa aaaaaaaaaa 200

<210> 5

<211> 25

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 5

gttgtcaaga tgctaccgtt cagag 25

<210> 6

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 6

acacgacgct cttccgatct 20

<210> 7

<211> 95

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 7

gttgtcaaga tgctaccgtt cagagcccca tgtctagtac ctattggtcc cctatcctca 60

gattcgttta aaaaaaaaaa aaaaaaaaaa aaaaa 95

<210> 8

<211> 26

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 注释=“人工序列:合成的寡核苷酸的描述”

<400> 8

tttttttttt tttttttttt tttttt 26

相关技术
  • 使用糖类结合试剂和膜透过性试剂进行样品多重化
  • 反转录酶分析试剂盒及其使用以及用于在生物样品中进行RT活性分析的方法
技术分类

06120112852797