掌桥专利:专业的专利平台
掌桥专利
首页

用于在多维空间中映射单分子的位置的方法、组合物和系统

文献发布时间:2024-04-18 19:53:33


用于在多维空间中映射单分子的位置的方法、组合物和系统

相关申请的交叉引用

本申请要求于2020年7月17日提交的美国临时申请号63/053,326的权益,该申请的全部内容通过引用并入本文。

技术领域

本发明总体上涉及样品表征领域,更具体地涉及用于样品表征领域中的多维靶标映射的新型和有用的系统、方法和组合物。

背景技术

随着对理解生物样品中特定靶标分析物分布的兴趣的增加,允许分析物映射的改进组合物、方法和系统变得非常有价值。当前技术在映射分辨率、多维度映射能力、跨量级映射能力、映射不同类型分析物的能力和/或其他方式方面受到限制。此外,用于实现映射的组合物可能需要组合物的高精度和均匀性,以便实现准确映射。因此,在样品表征领域中需要用于样品表征领域的多维靶标映射的新型和有用的系统、方法和组合物。

附图说明

图1A描述了用于在多维空间中映射靶标位置的组合物的实施方案的示意图。

图1B描述了可以使用的组合物单元的各种比例和样品类型。

图2A描述了组合物的捕获探针的实现的实施方案。

图2B描述了组合物的相邻颗粒的活性区段之间的相互作用的实施方案。

图3A-图3C描述了用于邻居识别的活性区段可以操作的机制的变化。

图4描述了组合物的用途应用的实施方案。

图5描述了用于在多维空间中映射靶标位置的方法的实施方案。

图6描述了用于在多维空间中映射靶标位置的颗粒的示例配置。

具体实施方式

本发明的优选实施方案的以下描述不旨在将本发明限制于这些优选实施方案,而是使本领域的任何技术人员能够制造和使用本发明。

1.益处和应用

所描述的本发明可赋予优于常规系统、方法和组合物的若干益处。

本发明赋予了提供非天然存在的组合物的益处,该组合物有助于从样品中捕获靶标生物材料并映射靶标生物材料在空间(例如,二维[2D]空间、三维[3D]空间)中的分布,同时提供靶标生物材料和/或邻近材料的一个或多个标识符。此类组合物可包括已经从其天然状态改性(例如,在提供与天然组合物的结构差异方面)的材料。此外,本发明涉及材料的组合,其中材料的组合是非天然存在的(例如,相比所描述和要求保护的组合物没有天然存在的对应物)。

因此,本发明的应用可以包括使用新型功能化颗粒进行靶标检测和映射来提高空间多组学(例如,空间转录组学、空间基因组学等)的性能。

本发明还赋予了提供有效捕获和标记靶标材料(例如,DNA、RNA、miRNA、蛋白质、小分子、单分析物、多分析物等)的机制的益处,以便能够分析靶标材料的映射分布。对于核酸靶标,描述的组合物的捕获探针可以包括核酸靶标的互补分子。对于蛋白质靶标或小分子靶标,描述的组合物的捕获探针可以包括与用于检测的特定核酸序列缀合的抗体或适体。

本发明还赋予了在多个维度(例如,2D、3D)中实现靶标映射的益处,其中映射可以针对整个组织结构、组织片(例如,如在组织学中,针对活检组织、针对组织块、针对与接种支架相关的组织切片等)、液滴(例如,乳液液滴)、器官、整个生物体、细胞悬液、单个细胞、细胞器、细胞器内、病毒、微生物,以及其他天然结构进行。另外或可替代地,可以针对非天然存在的结构(例如微孔、微阵列、支架和其他非天然存在结构)进行映射。

通过并入被配置用于与相邻对象(例如,组合物的其他单元)相互作用的分子结构,本发明能够捕获靶标,并随后解码与所捕获的靶标相关联的颗粒之间的空间关系,然后可以使用该空间关系来确定靶标在空间中的位置(例如,相对于其他天然和非天然存在的结构等在原位)。

关于多维映射,描述的组合物的颗粒可以以单层形式(例如,使用施加磁力或其他力以形成颗粒单层的系统)实施,其中样品(例如,组织、细胞)定位在单层附近以进行后续处理和映射。单层可以堆叠在样品之间,以便实现3D映射。可替代地,可以将描述的组合物的颗粒输注到样品/试样中(例如,通过磁力、通过电穿孔、通过使用载体等)。可替代地,描述的组合物的颗粒可以偶联到样品/试样的表面(例如,通过化学结合、通过磁性结合或通过其他结合),以实现表面映射。可替代地,描述的组合物的颗粒可以被引导或以其他方式保留在3D结构中(例如,在网格中、在非网格结构中),例如微孔、微阵列(例如,具有核酸捕获颗粒)、支架或其他3D结构中。在相关应用中,物理力或其他力可用于定义与样品相互作用的颗粒分布的结构(例如,紧密堆积结构),以实现映射。

可替代地,关于多维映射,描述的组合物的颗粒可以在空间中随机分布。

本发明还赋予了在空间转录组学中实现应用的益处。例如,描述的组合物、方法和系统可用于随时间映射样品中的靶标,以便了解疾病病理和进展(例如,随时间的靶标扩散和表达变化)。

另外地或可替代地,本发明可以赋予任何其他合适的益处。

2.颗粒组合物

如图1A所示,用于分子映射的组合物100的实施方案包括:主体110和分子集115,该分子集偶联到主体110并被构造用于组合物100的功能化。

在实施方案中,分子集115可以包括被构造用于靶标分析物捕获的第一分子子集120,其中第一子集120的单元可以包括以下一个或多个:第一锚定区段121、第一颗粒识别区段(P)122、唯一分子标识符(M)123和捕获探针124。在实施方案中,分子集115可以包括第二分子子集130,其被构造用于与一个或多个相邻对象(例如,组合物100的其他单元)相互作用,其中第二子集130的单元可以包括以下一个或多个:接头区131、第二锚定区段132、第二颗粒识别区段(P)133和用于与相邻对象相互作用的活性区段134。在应用中,组合物100可以作为颗粒集(例如,在溶液中)提供,其中该颗粒集中的每一个都与分子偶联(例如,涂覆有分子),用于与生物样品的靶标分子的位置映射相关联的各种测定。

组合物100可被配置用于与靶标捕获和邻近对象检测相关联的过程和反应,包括以下一个或多个:用于与靶标捕获相关联的cDNA合成的逆转录反应(RT反应)、用于扩增cDNA的扩增反应(例如,PCR)、高通量测序、连接、杂交、聚合酶延伸和其他合适的反应。这样的反应可以与系统(在下面进一步详细描述)相关地进行,所述系统包括以下一个或多个:天然结构(例如,细胞器、细胞、组织、器官、天然支架等)、合成结构(例如,阵列、合成支架、微孔等)和/或样品材料的随机分散体。

在一些非限制性示例中,可从中捕获靶标的样品材料可包括以下一种或多种:神经系统生物材料、心血管系统生物材料、表皮系统生物材料、骨骼系统生物材料、肌肉系统生物材料、呼吸系统生物材料、消化系统生物材料、内分泌系统生物材料、泌尿系统生物材料和生殖系统生物材料。细胞材料可能与正常和患病状态相关联,包括以下一种或多种:癌症细胞、循环肿瘤细胞、转移细胞、良性细胞或其任何组合。在实施方案中,样品可以包括从受试者获得的固体/连续组织材料。

下面更详细地描述本发明的附加方面和用途应用。

2.1颗粒

主体110的功能是提供分子集115可以偶联至的基底,以便在实施相应的测定和反应以及随后的映射操作方面为组合物100提供功能化。

关于形态,主体110可以具有微球的形式。可替代地,主体110可以具有非球形(例如,椭圆形、棱柱形、多面体、无定形等)主体的形式,其中穿过主体110的横截面是非圆形的。然而,主体110可以可替代地具有另一种合适的形式。关于尺寸,主体110可以具有纳米到微米量级的直径(或特征宽度),其中粒度决定映射分辨率。颗粒尺度的示例如图1B所示,与靶标相对于细胞、组织和器官的映射以及位于细胞或其他组分内的靶标的映射有关。主体110的纳米尺度应用可以与细胞内、亚细胞尺度或其他纳米尺度映射应用相关联。主体110的微米尺度应用可以与细胞间、组织尺度、细胞尺度或其他微米尺度映射应用相关联。主体110可替代地具有其他合适的特征尺寸。在使用过程中,颗粒的溶液可以具有均匀(或近似均匀)的粒度;可替代地,在使用期间,颗粒的溶液可以具有不均匀的粒度。在用于在2D中检查10mm x 10mm组织切片中的靶标分布的第一示例中,主体110和偶联分子可以提供直径为10um的特征颗粒尺寸,从而需要大约1000x1000=100万个独特颗粒用于相对于组织切片的靶标映射。

关于密度,主体110可以被配置为具有比旨在用于组合物100的工艺液体的密度更大的密度(例如,关于特定反应或测定),使得在操作期间,组合物100通过重力沉降在工艺液体内。可替代地,主体110可以被配置为具有与旨在用于组合物100的工艺液体的密度相等的密度(例如,关于特定反应或测定),使得在操作期间,组合物100在工艺液体内处于平衡状态。仍可替代地,主体110可以被配置为具有比旨在用于组合物100的工艺液体的密度更小的密度(例如,关于特定反应或测定),使得在操作期间,组合物100在工艺液体内为漂浮的。例如,可将漂浮颗粒分布在工艺流体的整个表面上的膜中,并且可将样品放置在漂浮颗粒附近,以便实现靶标映射。

关于热性能,主体110被配置为在温度下限(例如,与低温反应和过程相关联,与储存相关联等)与温度上限(如,与高温反应和过程相关联,例如用于热循环)之间操作。然而,主体110可被配置用于其他操作温度。

关于物理性能,主体110被配置为保持在溶液中的结构(例如,在储存期间在缓冲液中,在进行测定期间在溶液中)。同样地,主体110被配置为不溶胀且不浸出。然而,在替代实施方案中,主体110可被配置为溶胀期望的量(例如,与实现用于应用中的处理或使用的期望大小或形态相关)、被配置为浸出某些化合物(例如,处理试剂)以进行测定,和/或在进行测定或其他过程期间以期望的方式溶解。此外,关于物理性能,主体110可被配置为具有与进行测定或其他过程相关的期望的亲水程度(例如,在亲水到疏水的光谱上)。因此,主体110的变体可以具有合适类型的交联(例如,化学交联、物理交联等)和交联百分比(例如,30-99%的交联),以在使用条件下提供期望水平的稳定性或降解性。

关于其他表面性能,主体110可被配置具有期望的结合位点密度,以能够实现合适的接头/锚定密度(例如,通过在主体110上提供连接点),其中主体110的添加在以下与分子设计相关的章节中更详细地描述。此外,主体110可包括用于偶联下文所述的接头分子的表面基团(例如,羟基、胺基、羧基、硫化物基、硅烷醇基等)。

关于磁性能,主体110可被配置为对磁场作出响应(例如,与涉及颗粒保留在适当位置的测定有关,以便随后从样品中映射靶标分析物)。在主体110的变体中,主体110的某些区域(例如,核区域)可以是磁性的(例如,磁性、顺磁性等),并且主体110的某些区域(例如,壳区域)可以非磁性的。关于表面性能,主体110可被配置为带电荷或不带电荷,以便于与样品的靶标材料结合,或便于制造涉及关于电穿孔应用的功能性分子。

关于光学性能,主体110可被配置为非荧光的(例如,以便不干扰基于光学的检测分析)。然而,在变体中,例如,为了跟踪目的,主体110可被配置为光学可检测的(例如,经由非荧光模态、经由荧光模态、经由红外检测模态、经由热检测模态等)。另外地或可替代地,主体110可以通过编码核酸碱基的光学特征来表征,所述核酸碱基在检测光学特征时可识别。

关于机械性能,主体110可被配置为具有期望的硬度(例如,在莫氏硬度表上测量的,在另一硬度表上测量的),以便在用途应用过程中保持期望的硬度水平。另外地或可替代地,主体110可被配置为具有与以下一个或多个相关联的期望的机械性能:刚度、弹性行为(例如,在模量方面、在塑性和弹性变形方面等)、粘弹性行为、疲劳抗性、断裂抗性、剪切强度、抗压强度、拉伸强度、流变行为(例如,在磨损条件下)和其他机械性能。

关于组合物,主体110可以由以下一种或多种组成:聚合物(例如,聚苯乙烯、聚苯乙烯-二乙烯基苯、聚甲基丙烯酸甲酯(PMMA)等)、水凝胶、二氧化硅、硅、无孔玻璃、多孔玻璃、镀膜玻璃、琼脂糖、丙烯酰胺、聚丙烯酰胺、铁、钢或陶瓷材料和/或一种或多种合适材料的组合。如上文和下文所述,主体110的不同区域可以由不同的材料构成(例如,核区域可以由第一材料构成,壳区域可以由第二材料构成)。在一些实施方案中,可以存在作为多个壳区域的多个区域,或者存在诸如无定形或有序空间布置的其他配置。在仍进一步的示例中,主体110可以包括或采取聚合物/分子主体(例如,DNA纳米球、树枝状聚合物等)形式,其中,在应用中,树枝状聚合物的尺寸可以减小为“功能性单体”(即,作为最小的功能性分子组装单元)。

主体110/功能化颗粒的单元可以预先组装到膜中或在表面上,其中膜和表面可以根据下面更详细描述的方法被配置为与组织或其他生物样品相互作用。例如,具有预先组装的功能化颗粒的这种膜可以沉积在样品(例如,组织样品)上,或者样品(例如,组织样品)可以沉积在用描述的颗粒单元功能化的表面上。

2.2第一分子子集—靶标捕获

如图1A所示,组合物100包括第一分子子集120,其偶联到主体110并被配置用于靶标分析物捕获,其中第一子集120的单元可以包括以下一个或多个:第一锚定区段121、第一颗粒识别区段(P)122、唯一分子标识符(M)123和捕获探针124。第一分子子集120的功能是以允许后续处理和唯一识别捕获的靶标材料(例如,使用高通量测序技术)的方式,提供用于从正在处理的样品中捕获靶标的期望化学(例如,结合化学)。第一分子子集120的分子可以是基于核酸的,具有天然和/或修饰的核苷酸。

如图1A所示,第一分子子集120的单元可以包括第一锚定区段121,其被配置用于在下游处理步骤(例如靶标后结合和/或互补分子的合成,例如用于mRNA结合的cDNA)中进行PCR相关反应(例如,扩增)。因此,锚定区段121可以包括PCR引物。如上所述,关于不同类型的核酸相关联反应、蛋白质相关联反应和/或其他反应,用于第一分子子集120的不同单元的PCR引物可以彼此相同或不同。例如,在第一变体中,第一分子子集120的单元的第一子集可以包括与第一反应或工艺相关联的第一序列,并且第一分子子集120的单元的第二子集可以包括与第二反应或工艺相关联的第二序列。

在实施方案中,第一锚定区段121直接偶联到主体110。然而,在其他变体中,第一锚定区段121可以以另一种方式相对于组合物的其他部分偶联。例如,第一锚定区段121可以偶联到接头分子,该接头分子将第一锚定区段121偶联到主体。接头分子可被配置为以提供足够数量的位点来进行靶标捕获的方式控制与主体110偶联的第一分子子集120的密度和间距。接头的使用还可以起到防止主体110表面处的分子折叠或以其他方式形成不期望的结构(例如,二级结构、三级结构等)的作用。同样地,在变体中,接头可被配置为线性分子区段,或者可替代地被配置为分支分子区段(例如,树枝状聚合物区段、其他分支区段)。另外地或可替代地,接头分子可被配置用于选择性连接(例如,具有对特定化学物质有特异性的官能团)和/或可激活切割(例如,如分子剪刀形式),以使衍生自捕获靶标的材料能够受控地从主体110释放。在变体中,可激活切割可通过接头实现,该接头被配置为响应于以下一种或多种切割:热切割机制、pH值变化、光切割机制、酶切割机制或另一种合适的切割机制。

在实施方案中,第一锚定区段121可以具有5-50个碱基,并且可以包括定制引物(例如,为特定靶标设计的)或非定制引物;然而,在替代变体中,第一锚定区段121可以具有其他合适数量的碱基。

如图1A所示,第一分子子集120可以包括与第一锚定区段121偶联的第一颗粒识别区段(P)122,其功能是提供识别分子所偶联的唯一颗粒的标签。第一颗粒识别区段(P)122被配置为对于每个颗粒是唯一的。此外,第一颗粒识别区段(P)122被配置为具有多样性,使得颗粒溶液中的每个颗粒可以被唯一地识别(例如,基于泊松统计)。可替代地,第一颗粒识别区段(P)122可以以另一种合适的方式在多样性方面进行表征。例如,第一颗粒识别区段(P)122可以通过“距离”度量来表征,例如汉明距离(例如,使不同核酸分子相同所需的突变数量)。

在实施方案中,第一颗粒识别区段(P)122可以具有5-50个碱基,以便为给定过程的溶液中期望数量的颗粒提供足够数量的唯一序列(即,使得可以唯一地识别每个颗粒,并且颗粒识别区段与靶标的杂交生成衍生材料,该衍生材料可以用于将测序的靶标与相应的颗粒相关联);然而,在替代变体中,第一颗粒识别区段(P)122可以具有其他合适数量的碱基(例如,少于5个碱基,多于35个碱基)。另外地或可替代地,第一颗粒识别区段(P)122可以具有被设计成占据第一分子子集120的单元长度一定百分比(例如,10%、20%、30%等)的多个碱基。

第一颗粒识别区段(P)可以偶联到第一锚定区段121或以其他方式沿着相应的分子定位。

如图1A所示,第一分子子集120还可以包括唯一的分子标识符(M)123,其功能是提供标识在使用组合物期间(例如,关于新一代测序、关于文库制备等)由捕获探针124捕获的唯一分子(例如,核酸分子、寡核苷酸缀合材料等)的标签。唯一分子标识符(M)123被配置为具有多样性,使得其附近的靶标分子可以被唯一标记(例如,基于泊松统计)。可替代地,唯一分子标识符(M)123可以以另一种合适的方式在多样性方面进行表征。例如,唯一分子标识符(M)123可以通过“距离”度量来表征,例如汉明距离(例如,使不同核酸分子相同所需的突变数量)。

唯一分子标识符(M)123可以是各种测序平台(例如,新一代测序平台)所特有的。此外,第一分子子集120中的每一个可以具有单个唯一分子标识符(M)123或多个唯一分子标识符123区段(例如,以提供进一步的多样性)。唯一分子标识符(M)123可被配置为不以碱基(例如GG)(或不太适合于特定测序平台的其他序列)结尾;然而,唯一分子标识符(M)123区段可以以另一种合适的方式配置。偶联到特定主体110的所有分子中的唯一分子标识符(M)123的序列可以通过制造被配置为具有高度一致性(例如,关于最小化无意删除、替换或添加),以便在使用期间产生低错误率。

此外,关于第一颗粒识别区段(P)122,唯一分子标识符(M)123和第一颗粒识别区段(P)123的序列的多样性可以通过制造一组随机序列,或者可替代地,通过一组预定序列来实现。在制造过程中,序列的多样性可以通过对主体110和/或与主体110偶联的分子的初始区段进行化学合成、通过分离-合并(split-pool)合成、通过乳液PCR(emPCR)或通过其他合成方法来实现。

在实施方案中,唯一分子标识符(M)123可以具有总共5-50个碱基,以便为预期捕获的靶标分子的期望数量提供足够数量的唯一序列(即,使得可以唯一地识别每个靶标);然而,在替代变体中,唯一分子标识符(M)123可以具有其他合适数量的碱基。另外地或可替代地,唯一分子标识符(M)123可以具有被设计成占据第一分子子集120的单元长度一定百分比的多个碱基(例如,10%、20%、30%等)。

唯一分子标识符(M)123可以直接偶联到第一颗粒识别区段(P)122,或者可以替代地相对于沿着第一分子子集120的分子的位置来配置。

如图1A和图2A所示,第一分子子集120可以包括捕获探针124,其用于从样品中捕获靶标材料。捕获探针124可以直接偶联到唯一分子标识符(M)123,或者可以替代地相对于沿着第一分子子集120的分子的位置来配置。在变体中,由捕获探针124捕获的分析物可以包括:核酸(例如,DNA、mRNA、miRNA等)和/或连接到其他类型分子(例如,抗体、蛋白质、肽、化学物质等)的寡核苷酸。

在一个变体中,如图2A所示,捕获探针124可被配置用于靶标mRNA结合(例如,用于捕获聚A mRNA的dT、dTVN),随后进行逆转录以使第一分子子集120的捕获探针部分附加cDNA(例如,如图2A所示)。然后,在扩增合成的cDNA之后,可以使用高通量测序来读出使用第一分子子集120捕获的靶标分子。在替代变体中,在第一分子子集120中包括其他捕获探针类型可以配置第一分子子集120以捕获以下一种或多种:DNA、其他RNA(例如,miRNA)、蛋白质(例如,抗体,使用TotalSeq

组合物的单元可以被配置有足够数量的捕获探针142(例如,每个颗粒的总数,结合到溶液中的颗粒的总数),以有效捕获靶标材料(例如,每个细胞约数万个mRNA分子,每种样品类型的另一个靶标数量)。在变体中,溶液中使用的捕获探针142的数量可以是旨在用于捕获的靶标的数量的10-100x(例如,以摩尔浓度表示、以另一浓度单位等表示)。

在变体中,第一分子子集120的单元可以根据需要省略或包括额外的区段。例如,第一分子子集120中的一个或多个可以包括被配置为简化特定测序平台的文库制备步骤或测序过程的区段。更详细地,第一分子子集120的分子可以包括衔接子区段(例如,与Illumina

如图1A所示,组合物100还包括第二分子子集130,该第二分子子集130偶联到主体110并被构造用于与一个或多个相邻对象(例如,组合物100的其他单元)相互作用,其中第二子集130的单元可以包括以下一个或多个:接头区131、第二锚定区段132、第二颗粒识别区段(P)133和用于与相邻对象相互作用的活性区段134。第二分子子集130用于提供用于识别相邻对象(例如,相邻颗粒)的期望化学成分,以便在使用组合物期间提取样品靶标的2D和/或3D映射。第二分子子集130的分子可以是基于核酸的,具有天然和/或修饰的核苷酸。第二分子子集130的分子可以围绕主体110与第一分子子集120的分子随机散布,或者可以可替代地相对于第一分子子集120的分子围绕主体110非随机分布。

如图1A所示,第二分子子集130可以包括接头区131,其功能是将第二分子子集130的单元延伸出并并入空间中(例如,使得第二子集的单元延伸超出第一分子子集120的单元的末端部分),从而使第二分子子集130能够与相邻对象(例如,组合物的其他颗粒的活性区段)相互作用。

关于组合物,接头区131优选由聚合物(例如,非核酸聚合物)组成,并且在具体示例中,接头区131可由聚乙二醇(PEG)或另一种合适的聚合物组成。然而,接头区131可以由另一种合适的材料(例如,天然材料、合成材料)组成。

关于结构,接头区131可以具有将第二分子子集130的单元延伸到空间中的线性结构,从而能够与相邻对象(例如,组合物的其他单元)相互作用。可替代地,接头区131可以具有分支或其他非线性结构(例如,树枝状大分子区段、其他分支区段)。例如,在其中接头区131被配置为控制与主体110偶联的分子的间距/密度的变体中,接头区131可以具有分支结构,该分支结构降低了与主体110偶联的分子的密度和/或控制与主体100偶联的分子间距/取向。另外地或可替代地,接头区131可被配置用于选择性连接(例如,具有对特定化学物质有特异性的官能团)和/或可激活切割(例如,如分子剪刀形式),以使衍生自捕获靶标的材料能够受控地从主体110释放。在变体中,可激活切割可通过接头区实现,该接头区被配置为响应于以下一种或多种切割:热切割机制、pH值变化、光切割机制、酶切割机制或另一种合适的切割机制。

关于性能,接头区131可以被配置有期望的电荷和/或其他特征(例如,亲水性水平、疏水性水平等),以防止分子之间的不希望的相互作用(例如,缠结、聚集、不希望的结构等)。这样,接头区131可被配置为将分子131延伸到空间中(例如,垂直于主体110的表面);然而,接头区131可被配置为以另一种合适的方式从主体110延伸。

接头区131可以有助于第二分子子集130的单元的总长度,使得组合物的颗粒之间的持久长度(persistence length)是重叠的(例如,以允许邻居之间的相互作用)。更详细地,组合物的第一单元的接头区和组合物的第二单元的接头区有助于组合物的第一单元和第二单元之间的重叠持久长度或以其他方式通过组合物的第一单元和第二单元之间的重叠持久长度表征。在变体中,接头区131的长度可以是主体110的特征尺寸(例如,直径、宽度)的0.1-5倍;然而,另外地或可替代地,接头区131可以具有另一合适的长度(例如,取决于第一分子子集120和第二分子子集130的分子的总长度的长度)。

如图1A所示,第二分子子集130可以包括第二锚定区段132,其被配置用于进行PCR相关联反应(例如,扩增最近相邻颗粒的连接,以实现下游映射分析)。因此,第二锚定区段131可以包括PCR引物。在实施方案中,第二锚定区段131通过接头区131偶联到主体110。然而,在其他变体中,第二锚定区段131可以以另一种方式相对于组合物的其他部分偶联。在实施方案中,第二锚定区段131可以具有5-40个碱基,并且可以包括定制或非定制引物;然而,在替代变体中,第二锚定区段131可以具有其他合适数目的碱基。

如图1A所示,第二分子子集130可以包括与第二锚定区段偶联的第二颗粒识别区段(P)133,其功能是提供识别分子所偶联的唯一颗粒的标签。第二颗粒识别区段(P)132被配置为对于每个颗粒是唯一的。此外,第二颗粒识别区段(P)132被配置为具有多样性,使得颗粒溶液中的每个颗粒可以被唯一地识别(例如,基于泊松统计)。可替代地,第一颗粒识别区段(P)122可以以另一种合适的方式在多样性方面进行表征。例如,第一颗粒识别区段(P)122可以通过“距离”度量来表征,例如汉明距离(例如,使不同核酸分子相同所需的突变数量)。

第二颗粒识别区段(P)132可以与用于靶标捕获的第一分子子集120的第一颗粒识别区段(P)122相同(例如,按顺序)(例如,以促进颗粒识别区段的合成效率),或者可替代地可以与第一分子子集120的第一颗粒识别区段(P)122不相同。

在实施方案中,第二颗粒识别区段(P)132可以具有5-50个碱基,以便为给定过程的溶液中期望数量的颗粒提供足够数量的唯一序列(即,使得可以唯一地识别每个颗粒,并且颗粒识别区段与靶标的杂交生成衍生材料,该衍生材料可以用于将测序的靶标与相应的颗粒相关联);然而,在替代变体中,第二颗粒识别区段(P)132可以具有其他合适数量的碱基(例如,少于5个碱基,多于35个碱基)。另外地或可替代地,第二颗粒识别区段(P)132可以具有被设计成占据第二分子子集130的单元长度一定百分比(例如,10%、20%、30%等)的多个碱基。

如图1A和图2B所示,第二分子子集130可以包括用于与相邻对象相互作用的活性区段134,该活性区段的功能是与来自另一个颗粒的分子的相应区段相互作用,从而能够确定颗粒的最近邻居。活性区段134优选地位于第二分子子集130的每个分子的末端,以便更好地促进相邻颗粒/对象的活性区段134之间的相互作用。然而,活性区段134可以另外沿着第二分子子集130的分子长度定位。

在图3A-图3C中示出了其示例的变体中,活性区段134可被配置为与相应的相互作用元件(IE)相互作用。此外,活性区段134以防止自杂交或自相互作用的方式配置,以防止生成不涉及相邻颗粒的不期望的结构和/或相互作用。此外,各个颗粒的所有活性区段134优选地被配置为不与该各个颗粒的其他活性区段相互作用(或优选地与其他颗粒的活性区段相互作用),以便促进对相邻颗粒之间的相互作用和相邻颗粒的位置的有效解码。在特定示例中,功能化颗粒的第一子集可以具有第一活性区段,并且功能化颗粒的第二子集可以具有第二活性区段,其中第一活性区段被构造(例如,通过序列设计)成与第二活性区段相互作用,第一活性区段被构造(例如,通过序列设计)成防止与自身或具有第一活性区段的其他颗粒的相互作用,并且第二活性区段被构造(例如,经由序列设计)成防止与自身或具有第二活性区段的其他颗粒的相互作用。这样,不同的活性区段可被配置为与邻居相互作用,但不彼此相互作用。扩展示例,功能化颗粒集可以具有第三活性区段、第四个活性区段等,其中具有两个活性区段时,约50%的相邻颗粒相互作用将生成空间映射读数。随着与功能化颗粒的不同子集相对应的不同活性区段的数量增加,相邻功能化颗粒之间的功能相互作用的概率降低。

在如图3A所示的第一示例中(下面将更详细地描述),活性区段134可被配置为通过互补序列的杂交(例如,与第一颗粒相关联的第一活性序列和第二颗粒的第二活性序列,彼此互补的第一和第二序列),然后聚合酶延伸,来与相应的相互作用元件(IE)相互作用。

在第二示例中,如图3B所示(下面更详细地描述),活性区段134可被配置为通过实施黏端连接(例如,与第一颗粒相关联的第一黏端和第二颗粒的第二黏端),然后聚合酶延伸,来与相应的相互作用元件(IE)相互作用。

在第三示例中,如图3C所示(下面更详细地描述),活性区段134可被配置为通过实施平端连接(例如,与第一颗粒相关联的第一平端和第二颗粒的第二平端),然后聚合酶延伸,来与相应的相互作用元件(IE)相互作用。

然而,活动区段134可以通过另一种合适的机制来操作。这样,活性区段134的端部可以在具有或不具有合适的限制酶的情况下生成,以便提供与具有或不具有端部碱基配对的相邻颗粒相互作用的端部。在一个这样的变体中,可以使用具有用于生成具有互补端部的区段的合适限制位点的质粒来生成相应的活性区段134,其中区段与第二分子子集130的合成单元的端部偶联(例如,在第二颗粒识别区段133之后)。然而,另外地或可替代地,活性区段可以以另一种合适的方式与第二分子子集130的单元合成。

使用杂交和聚合酶延伸的相互作用的示例如图3A所示,其中第一颗粒的活性区段134a与邻近第一颗粒的第二颗粒的活性区段134b互补,并且在第一操作中执行聚合酶延伸以连接活性区段134a和134b。然后,PCR用于在第二操作中扩增相邻颗粒的连接,高通量测序用于读取相邻颗粒的连接,以提取用于映射靶标分布的信息。

在图3B中示出了使用黏端的相互作用然后连接的示例,其中第一颗粒的活性区段134c与邻近第一颗粒的第二颗粒的活性区段134d互补,并且执行第一操作中的黏端连接,随后第二操作中的聚合酶延伸,以连接活性区段134a和134b。然后,PCR用于在第三操作中扩增相邻颗粒的连接,高通量测序用于读取相邻颗粒的连接,以提取用于映射靶标分布的信息。

在图3C中示出了使用平端的相互作用然后连接的示例,其中第一颗粒的活性区段134e与邻近第一颗粒的第二颗粒的活性区段134f互补,并且执行第一操作中的平端连接,然后第二操作中的聚合酶延伸,以连接活性区段134e和134f。然后,PCR用于在第三操作中扩增相邻颗粒的连接,高通量测序用于读取相邻颗粒的连接,以提取用于映射靶标分布的信息。

在变体中,第一分子子集120的单元可以根据需要省略或包括额外的区段。例如,第二分子子集130中的一个或多个可以包括被配置为用于特定测序平台的测序过程的区段。更详细地,第二分子子集130的分子可以包括衔接子区段(例如,与Illumina

在变体中,第二分子子集130和/或相应的活性区段134可被配置为可从主体110释放。例如,第二分子子集130和/或相应的活性区段可以在与来自相邻功能化颗粒的相应活性区段相互作用之前(例如,就在其之前)从主体110释放。另外地或可替代地,第二分子子集130和/或相应的活性区段可以在与来自相邻功能化颗粒的相应活性区段相互作用之后从主体110释放。以受控方式的连接和释放可以通过选择性连接机制(例如,具有对特定化学物质有特异性的官能团)和/或可激活切割(例如,如分子剪刀形式等)来实现,以在与方案相关的需要时实现活性区段从主体110的受控释放。在变体中,可激活切割可通过接头实现,该接头被配置为响应于以下一种或多种切割:热切割机制、pH值变化、光切割机制、酶切割机制或另一种合适的切割机制。

此外,第一分子子集120和/或第二分子子集130的分子可以在处理期间通过约束以不期望的方式进行的扩散而被限制。例如,可以将组合物的单元限制在合适的结构内和/或可以使用限制介质(例如,水凝胶介质、粘性介质等)使组合物的单元受到限制,以防止释放的分子和/或功能化颗粒扩散离开期望的位置。

在仍进一步的变体中,第一分子子集120和第二分子子集的分子可以以其他方式配置和/或包括附加的功能区段。

2.4用于确定最近相邻颗粒的配置示例

图4描绘了上述组合物的颗粒的2D网络的配置示例。在该示例中,每个颗粒位于节点(即,C1、C2、C3、C4、…、Cn),并且每个颗粒具有含有颗粒识别区段(Lp)的功能化分子,如上所述,其中Lp颗粒识别区段具有在样品处理期间要复制的区域,以允许识别最近的邻居。

在示例的变体中,对于具有特征尺寸(D)和表面积(a)的颗粒,具有以表面积定义的功能位点(C)的密度,颗粒将具有多个功能位点(F)=AC。为了实现最近相邻相互作用,需要建立颗粒之间的临界距离(d),其中d等于上述接头区长度的2倍。因此,为了在可以近似为具有特征长度(l)和特征宽度(w)的矩形的2D空间[S]中映射靶标,[S]内需要至少l/d xw/d个颗粒,并且用于靶标捕获的功能位点的数量将等于F(l/d)(w/d),以便在[S]中映射靶标。类似地,对于具有特征高度(h)的3D体积,将提供用于靶标捕获的F(l/d)(w/d)(h/d)个功能位点(然而,可以在其他变体中实现其他体积近似)。另外地或可替代地,该方法可以适用于非矩形或矩形棱柱的2D空间或3D体积内颗粒分布的其他函数。

因此,对于具有100nm特征尺寸的颗粒,表面积(例如,4πr

这种颗粒配置可用于单细胞分析背景中,其中颗粒分布可“注入”细胞中,以映射亚细胞尺度靶标。另外地或可替代地,这种颗粒分布的变化可用于组织尺度分析、器官尺度分析、生物体尺度分析和/或其他合适的分析。

虽然描述了2D示例,但是配置示例可以扩展到3D维度非随机网络和/或随机组织的网络。例如,组织切片的2D示例可以扩展到涉及组织块的应用(例如,3D空间中的无定形组织块、其他形状因子的组织块、接种有生物材料的3D支架等)。另外地或可替代地,示例的应用可应用于固定在3D介质中的颗粒、细胞、液滴或其他材料的悬浮液。

3.方法

如图5所示,用于在多维空间(例如,一维空间、二维空间、三维空间)中映射靶标(例如,单个分子、其他靶标)位置的方法400可以包括:建立在空间中和在样品附近的功能化颗粒分布,包括一个或多个靶标的分布S410;促进通过与功能化颗粒分布偶联的第一分子子集选择性捕获一个或多个靶标的单元S420;促进与功能化颗粒分布偶联的第二分子子集的活性区之间的相互作用S430;对于功能化颗粒分布中的每一个:识别相应功能化颗粒的相邻颗粒子集S440;以及识别由相应功能化颗粒捕获的靶标子集S450;从相邻颗粒子集生成功能化颗粒分布的相对位置图(例如,空间图)S460;以及从为每个功能化颗粒捕获和识别的靶标子集识别一个或多个靶标相对于功能化颗粒分布的相对位置图的位置S470。

方法400的实施方案的功能是通过映射靶标生物材料在空间(例如,二维空间、三维空间)中的分布来促进从样品中捕获靶标生物材料。方法400的实施方案还用于提供用于有效捕获和标记靶标材料(例如,DNA、RNA、miRNA、蛋白质、小分子、单个分析物、多分析物等)的机制,以便能够分析多维度(例如,2D、3D)中靶标材料的映射分布,其中映射可以针对整个组织结构、组织块(例如,如在组织学中,针对活检组织、针对接种的天然支架等)、器官、整个生物体、细胞悬浮液、液滴(例如,乳液的液滴)、单个细胞、细胞器、细胞器内、病毒、微生物和其他自然结构进行。另外或可替代地,可以针对非天然存在的结构(例如微孔、微阵列、支架和其他非天然存在结构)进行映射。

方法400可以通过上述组合物的实施方案、变体和示例和/或其他合适的系统和组合物来实现。

3.1方法—功能化颗粒分布

方框S410记载了:建立在空间中和在样品附近的功能化颗粒分布,包括一个或多个靶标的分布。方框S410用于在空间中以允许相邻功能化颗粒之间的相互作用以及选择性捕获样品靶标的方式分布功能化颗粒。

在变体中,方框S410可以包括以有序方式(例如,1D阵列、2D阵列、3D阵列等)分布功能化颗粒。在这样的变体中,以有序方式分布功能化颗粒可以包括实施一种或多种用于将功能化颗粒保持在适当位置的结构,其中,在示例中,结构可以包括基底(例如,用功能化颗粒分布进行图案化的基底)、微孔、微阵列(例如,具有核酸捕获颗粒)、支架或其他3D结构。另外地或可替代地,方框S410可以包括通过使用力(例如,针对功能化磁性颗粒的磁力、电力/带电表面、重力、使用声学或其他振动施加的力、离心力、浮力、化学结合等)将功能化颗粒保留在适当位置。在这些变体中,方法400可以包括通过以下一种或多种从支持结构释放保留的功能化颗粒:施加相反极性的磁力或去除磁场(例如,对于功能化的磁性颗粒)、施加相反极性电荷或其他去除电力、去除重力、去除使用声学或其他振动施加的力、施加洗涤剂以去除化学键、和/或其他合适的机制。因此,保留和释放可以以可逆或不可逆的方式进行。

可替代地,方框S410可以包括以随机方式(例如,以随机分散的方式在溶液中、在乳液内、在乳液的液滴内等)分布功能化颗粒。

关于建立功能化颗粒分布,方框S410可以包括将功能化颗粒分布定位为在样品(例如,细胞样品、组织、样品等)附近(例如,与样品接触)。另外地或可替代地,方框S410可以包括将功能化颗粒输注到样品(例如,注入细胞、注入组织、注入器官等)中。输注的示例可以包括以下一种或多种:注射、电穿孔、载体(例如,病毒载体)的使用和其他输注方法。另外地或可替代地,方框S410可以包括将功能化颗粒分散在样品的各部分之间(例如,相对于细胞悬浮液、相对于分散组织、相对于具有分散组分的其他样品)。另外地或可替代地,方框S410可以包括将功能化颗粒偶联到样品/试样的表面(例如,通过化学结合、通过磁性结合、通过其他结合)。在相关应用中,方框S410可以实施物理力或其他力来定义与样品相互作用的颗粒分布的结构(例如,紧密堆积结构),以实现映射。

在其中功能化颗粒以有序方式(例如,作为阵列)分布在空间中的变体中,功能化颗粒分布的方式可用于将边界条件/约束应用于下文更详细描述的映射算法。另外地或可替代地,在涉及功能化颗粒的随机分布的变体中,下面更详细描述的映射算法可以应用与颗粒的随机分散相关联的假设。

3.2方法—颗粒捕获靶标

方框S420记载了:促进通过与功能化颗粒分布偶联的第一分子子集选择性捕获一个或多个标靶的单元。方框S420用于实现与功能化颗粒的核主体偶联的分子子集的捕获探针,如上所述,以捕获样品的靶标。促进选择性捕获可以包括在合适的环境(例如,关于溶液、温度、pH、组分浓度、流量、洗涤、试剂等)中用功能化颗粒集处理样品。另外地或可替代地,促进选择性捕获可以包括其他合适的处理步骤(例如,样品组分的裂解、不期望的样品组分洗涤等)。

在关于上文图2A所述的一个变体中,方框S420可以包括捕获样品的靶标mRNA(例如,使用具有dT、dTVN的捕获探针来捕获聚A mRNA),然后进行逆转录以将捕获探针附加cDNA。在替代变体中,方框S420可以包括促进以下一个或多个的选择性捕获:DNA、其他RNA(例如,miRNA)、蛋白质(例如,抗体,使用TotalSeq

3.3方法—最近邻居相互作用

方框S430记载了:促进与功能化颗粒分布偶联的第二分子子集的活性区之间的相互作用。方框S430用于实现相邻功能化颗粒之间的相互作用,从而允许相邻颗粒以允许映射颗粒分布的方式相互作用,如下文更详细描述的。促进相互作用可以包括在合适的环境(例如,关于溶液、温度、pH、组分浓度、流量、洗涤、试剂等)中用功能化颗粒集处理样品。

方框S430可以包括实现与功能化颗粒的核主体偶联的第二分子子集的接头部分,如上所述,其中接头部分将分子延伸到空间中以进行最近邻居相互作用。关于颗粒的分布,附近颗粒之间的最小距离可以相对于接头长度的2倍来定义,使得功能化颗粒的活性区段足够接近以彼此相互作用。

在图3A-图3C中示出的变体的示例中,与方框S430相关联的相互作用可以包括通过实施黏端然后是连接,通过实施平端连接,或通过另一种合适的机制的互补序列杂交和随后的聚合酶延伸。

如上所述,使用杂交和聚合酶延伸的相互作用的示例如图3A所示。如上所述,使用黏端的相互作用然后连接的示例如图3B中所示。如上所述,使用平端的相互作用然后连接的示例如图3C所示。

方框S420和S430可以同时发生(例如,同时地,在时间上彼此接近地,并行地)。另外地或可替代地,方框S420和S430可以顺序发生。

3.4方法—邻居识别和靶标检测

对于功能化颗粒分布中的每一个,方法400的实施方案包括:方框S440,其记载了:识别相应功能化颗粒的相邻颗粒子集的连接性S440;以及方框S450,其记载了:识别由相应功能化颗粒捕获的靶标子集。方框S440和S450用于识别:1)相邻功能化颗粒的构型、相邻功能化颗粒的活性区段之间的后相互作用,以及2)由功能化颗粒捕获的靶标。因此,从方框S440和S450提取的信息可以用于在该方法的后续部分期间映射样品的靶标在空间中的分布/位置。

方框S440可以包括对相互作用的最近邻居(例如,连接的后扩增)之间的连接(例如,已经彼此相互作用的功能化颗粒的活性区)测序,如上所述,其中颗粒识别区段可以用于了解哪些功能化颗粒彼此相互作用。在一个变体中,高通量测序可用于读取相邻颗粒的连接,以提取用于映射靶标分布的信息。另外地或可替代地,可以使用其他测序方法来读取相互作用的最近邻居之间的连接。

类似地,方框S450可以包括对由功能化颗粒集的捕获探针捕获的靶标分子的测序(例如,对于上述mRNA应用,合成的cDNA的后逆转录和扩增)。在一个变体中,高通量测序可用于读取捕获的靶标分子。另外地或可替代地,其他测序方法可用于读取捕获的靶标分子。

3.5方法—颗粒和靶标分布的映射

方框S460记载了:从相邻颗粒子集的连接性生成功能化颗粒分布的相对位置图,其用于处理从方框S440导出的信息,以了解在与样品的靶标相互作用期间哪些颗粒彼此相邻。方框S460可以由一个或多个计算系统实现,该计算系统具有用于处理来自方框S440的测序数据的一个或多个处理器,以便生成功能化颗粒分布的相对位置图。

方框S460可以包括结合颗粒识别区段的测序来处理针对相邻颗粒之间的连接的测序数据(如关于方框S440所述),以识别与每个颗粒相邻的功能化颗粒的子集。这样,方框S460可以基于经测序的颗粒识别区段和连接来实现连接性算法(例如,使用图论)、映射算法、网络算法和/或其他合适的算法。

方框S460中使用的算法可以与位置算法协同使用,以便允许在1D、2D或3D结构的特定位置处映射颗粒的位置。这样,在涉及功能化颗粒的有序或其他结构化配置(例如,使用阵列、使用力、使用紧密堆积等)的方法400的变体中,定位算法可以实现结构定义作为约束,以便映射预定义或其他方面已知的空间内的功能化颗粒位置。

另外地或可替代地,方框S460可以实现考虑相邻颗粒之间的距离的算法(例如,使用接头部分长度等),从而允许以结构化较少或非结构化的配置来映射功能化颗粒(例如,涉及随机分散在溶液中的功能化颗粒,涉及注入样品中的功能化颗粒等)。

在一个示例中,如图6所示,方框S460可以处理来自方框S440的测序数据,以确定功能化颗粒之间的连接。使用颗粒9(如图6所示)作为示例,处理来自方框S440的测序数据将返回颗粒3、4、10、16、15和8作为相邻颗粒。类似地,使用颗粒10(如图6所示)作为示例,处理来自方框S440的测序数据将返回颗粒4、5、11、17、16和9作为相邻颗粒。将在方框460中进一步实现基于预先定义的颗粒的紧密堆积来实现边界约束,以基于已知的紧密堆积配置来映射颗粒在空间中的位置。

方框S470记载了:从为每个功能化颗粒捕获和识别的靶标子集识别一个或多个靶标相对于功能化颗粒分布的相对位置图的位置。方框S470用于处理从方框S450导出的信息,以了解在先前步骤中的样品处理期间,各个功能化颗粒的每个捕获探针捕获了哪些靶标。方框S470可以由一个或多个计算系统实现,该计算系统具有用于处理来自方框S450的测序数据的一个或多个处理器,以便相对于在方框S460中映射出的功能化颗粒分布的颗粒定位捕获的靶标。

方框S470可以包括结合颗粒识别区段的测序来处理捕获的靶标和/或捕获探针的测序数据(如关于方框S450所述),以识别与每个颗粒相邻的功能化颗粒的子集。这样,方框S460可以处理来自方框S450的捕获靶标的测序数据,并且利用与捕获靶标相对应的颗粒识别区段,将每个功能化颗粒用其各自的捕获靶标标记。这样,方框S470的返回输出可以包括样品在空间中的靶标位置的映射。

关于图6所示的示例,方框S470的输出可用于基于方框S460中生成的功能化颗粒的映射来映射空间(例如,1D空间、2D空间、3D空间等)中的捕获靶标(例如,样品的mRNA物种)。例如,方框S470的输出可以揭示颗粒9、10、17和23捕获第一靶标(例如,mRNA物种1),从而通过整合从方框S460的映射导出的信息,允许第一靶标在空间中的映射。类似地,方框S470的输出可以揭示颗粒1、2、3、8、14和19捕获第二靶标(例如,mRNA物种2),从而通过整合从方框S460的映射导出的信息,允许第二靶标在空间中的映射。可以以另一种合适的方式实现该示例的变体。

因此,通过重复实现方法400,可以使用方框S470的输出的下游应用来了解样品的靶标的分布和/或靶标的分布随时间的变化。

然而,方法400可以包括其他合适的步骤和/或实现其他下游应用。

5.结论

附图图示了根据优选实施方案、示例配置及其变体的系统、方法和计算机程序产品的可能实现的架构、功能和操作。在这方面,流程图或框图中的每个方框可以表示代码的模块、段或部分,其包括用于实现指定逻辑功能的一个或多个可执行指令。还应注意的是,在一些替代实施方式中,方框中指出的功能可以按照附图中指出的顺序出现。例如,事实上,连续显示的两个方框可以基本上同时执行,或者这些方框有时可以按照相反的顺序执行,这取决于所涉及的功能。还将注意到,框图和/或流程图的每个方框以及框图和/或流程图中的方框的组合可以由执行指定功能或动作的基于专用硬件的系统或者专用硬件和计算机指令的组合来实现。

如本领域技术人员将从先前的详细描述以及从附图和权利要求中认识到的,可以对本发明的优选实施方案进行修改和改变,而不脱离在以下权利要求中限定的本发明的范围。

技术分类

06120116336189