掌桥专利:专业的专利平台
掌桥专利
首页

通过测序平行分析单个细胞的RNA表达和靶向的酶切法片段化DNA

文献发布时间:2023-06-19 19:28:50



关于联邦资助研究的声明

本发明是在1U19 MH114831-02(由国家心理健康研究所(NIMH)授予)、U01MH121282(由NIMH授予)和R01AG066018(由国家老龄化研究所授予)的政府支持下完成的。政府对这项发明有一定的权利。

技术领域

本发明涉及联合分析单个细胞中基因表达和基因表达调节的方法。

背景技术

在多细胞生物中,几乎每种细胞类型都含有相同遗传物质的相同拷贝。然而,表观基因组,包括DNA甲基化和组蛋白修饰的状态,在细胞类型之间有很大的差异。表观基因组以多种方式在基因调控中发挥关键作用—通过对染色体的核结构进行组织,限制或促进转录因子进入DNA,保存过去转录活动的记忆,以及微调细胞中编码蛋白质的mRNA序列的丰度。对每种细胞类型的表观基因组进行全面的观察,对于描绘发育期间和病理条件下不同细胞谱系中的基因调控程序至关重要。然而,不同的组蛋白修饰可能在其细胞特异性和与细胞类型特异性基因表达的关系方面存在很大差异,从而使解决复杂组织中细胞异质性方面取得不同程度的成功。这使得整合来自不同实验的不同组蛋白标签的数据集非常具有挑战性或几乎不可能。此外,为了更好地理解基因调控机制,有必要评估来自相同细胞的转录谱以及染色质状态。因此,非常需要一种能够联合检测染色质状态和基因表达的单细胞方法。

发明内容

在一个方面,本发明提供了一种获得单核基因表达信息的方法,所述方法包括:

a、使一个或多个核透化;

b、使所述一个或多个核与(i)结合染色质相关蛋白或染色质修饰的抗体以及(ii)第一转座酶接触;

其中所述第一转座酶装载有包含第一标签的核酸,其中所述第一标签包含第一限制性酶切位点和选自第一组标签序列(barcode)的标签序列;

c、启动酶切法片段化(tagmentation)反应,产生包含第一标签的基因组DNA片段;

d、使用包含第二标签的引物反转录所述一个或多个核中的RNA,其中所述第二标签包含第二限制性酶切位点和所述第一标签的标签序列,从而产生包含所述第二标签的cDNA;

e、使所述一个或多个核与连接酶和包含选自第二组标签序列的第二标签序列的第三标签接触,从而产生包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA;

f、裂解所述一个或多个核;

g、将多核苷酸尾与DNA和cDNA融合,产生多核苷酸加尾DNA和cDNA;

h、扩增所述多核苷酸加尾DNA和cDNA,其中用于扩增所述DNA的引物之一包括第三限制性酶切位点,并且其中所述第三限制性酶切位点被核酸内切酶识别;

i、将扩增的多核苷酸加尾DNA和cDNA分成DNA文库和RNA文库;

j、对于DNA文库:

i用识别所述第三限制性酶切位点的限制性核酸内切酶切割所述扩增的多核苷酸加尾DNA;

ii使DNA末端与测序接头和连接酶接触,从而产生包含所述测序接头的扩增的多核苷酸加尾DNA;

iii用识别第二限制性酶切位点的酶切割扩增的多核苷酸加尾cDNA;k、对于RNA文库:

i.用识别第一限制性酶切位点的限制性酶切割扩增的多核苷酸加尾DNA;

ii.使扩增的多核苷酸加尾cDNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含测序接头的扩增的多核酸加尾cDNA;

l、对RNA文库和DNA文库中的分子进行测序;

m、使所述一个或多个核中的每一个的RNA文库和DNA文库相关。

在一个方面,提供了一种获得单核基因表达信息的方法,所述方法包括:

a、使一个或多个核透化;

b、使所述一个或多个核与(i)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触;

其中所述第一转座酶装载有包含第一标签的核酸,其中所述第一标签包含第一限制性酶切位点和选自第一组标签序列的标签序列;

c、启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

d、使用包含第二标签的引物反转录所述一个或多个核中的RNA,其中所述第二标签包含第二限制性酶切位点和所述第一标签的标签序列,从而产生包含所述第二标签的cDNA;

e、使所述一个或多个核与连接酶和包含选自第二组标签序列的第二标签序列的第三标签接触,从而产生包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA;

f、裂解所述一个或多个核;

g、将多核苷酸尾与DNA和cDNA融合,产生多核苷酸加尾DNA和cDNA;

h、扩增所述多核苷酸加尾DNA和cDNA,其中用于扩增所述cDNA的引物之一包括第三限制性酶切位点,并且其中所述第三限制性酶切位点被核酸内切酶识别;

i、将扩增的多核苷酸加尾DNA和cDNA分成DNA文库和RNA文库;

j、对于RNA文库:

i.用识别第三限制性酶切位点的限制性内切酶切割扩增的多核苷酸加尾cDNA;

ii.使所述cDNA末端与测序接头和连接酶接触,产生包含所述测序接头的扩增多核苷酸加尾cDNA;

iii.用识别第一限制性酶切位点的酶切割扩增的多核苷酸加尾DNA;

k、对于DNA文库:

i.用识别第二限制性酶切位点的限制性酶切割扩增的多核苷酸加尾cDNA;

ii.使扩增的多核苷酸加尾DNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含所述测序接头的扩增的多核酸加尾DNA;

l、对RNA文库和DNA文库中的分子进行测序;

m、使所述一个或多个核中的每一个的RNA文库和DNA文库相关联。

在一个方面,本发明提供了一种获得单核基因表达信息的方法,所述方法包括:

a、使一个或多个核透化;

b、使所述一个或多个核与(ii)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触;

其中所述第一转座酶装载有包含第一标签的核酸,其中所述第一标签包含选自第一组标签序列的第一标签序列;

c、启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

d、使用包含第二标签的引物反转录所述一个或多个核中的RNA,其中所述第二标签包含所述第一标签的标签序列,从而产生包含所述第二标签的cDNA;

其中所述第一标签还包括(i)适于进行点击化学的第一活性基团或(ii)第一亲和标签和/或其中所述第二标签还包括(i)适合于进行点击化学的第二活性基团或(ii)第二亲和标签;

e、使所述一个或多个核与连接酶和包含选自第二组标签序列的第二标签序列的第三标签接触,从而产生包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA;

f、裂解所述一个或多个核;

g、(I)使基因组DNA片段与固定化试剂接触

(i)与第一活性基团反应;或

(ii)与所述第一亲和标签结合;和

执行基因组DNA拉下实验(pull-down)以将基因组DNA与cDNA分离;和/或

(II)使所述cDNA与固定化试剂接触

(i)与第二活性基团反应;或

(ii)与所述第二亲和标签结合;并进行cDNA拉下实验以将基因组cDNA与DNA分离;

h、对于DNA文库:

1.使基因组DNA与包含测序接头的随机引物接触,产生多核苷酸加尾DNA;和

2.扩增多核苷酸加尾DNA;

i、对于RNA文库:

1.使所述cDNA与包含测序接头的随机引物接触,产生多核苷酸加尾cDNA;和

2.扩增多核苷酸加尾cDNA;

j、对RNA文库和DNA文库中的分子进行测序;

k、使所述一个或多个核中的每一个的RNA文库和DNA文库相关联。

在一个实施方案中,对于使一个或多个核与(i)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触的步骤:(i)首先使一个或者多个核与抗体接触,然后接触第一转座酶,其中第一转座酶与结合到抗体的结合部分连接;(ii)首先将所述抗体与连接到与所述抗体结合的结合部分的第一转座酶一起孵育;并且所述一个或多个核与结合到转座酶的抗体接触;或(iii)所述一个或多个核与共价连接至所述第一转座酶的抗体接触。

在一个实施方案中,在使一个或多个核与连接酶和包括选自第二组标签序列的第二标签序列的第三标签接触的步骤之后,该方法还包括使一个或者多个核和连接酶接触的步骤,该第四标签包括选自第三组标签序列的第三标签序列,产生包含第一、第三和第四标签的基因组DNA片段,并产生包含第二、第三和第四标签的cDNA。

在一些实施方案中,将一个或多个核与连接酶和包含附加标签序列的标签接触的步骤重复一次或多次。在一些实施方案中,将一个或多个核与连接酶和包含附加标签序列的标签接触的步骤重复2、3、4、5、6、7、8、9或10次。

在一个实施方案中,通过使DNA和cDNA与末端脱氧核苷酸转移酶(TdT)接触,多核苷酸尾与DNA和cDNA融合。在一个实施方案中,通过使DNA和cDNA与DNA连接酶和DNA或RNA寡核苷酸接触,将多核苷酸尾与DNA和cDNA融合。在一些实施方案中,DNA连接酶是T3、T4或T7DNA连接。在一个实施方案中,通过使DNA和cDNA与DNA聚合酶和随机引物接触,将多核苷酸尾与DNA和cDNA融合。在一个实施方案中,通过使DNA和cDNA与具有附着在DNA和cDNA的3’端的活性化学基团的DNA或RNA寡核苷酸接触,将多核苷酸尾与DNA和cDNA融合。在一些实施方案中,活性化学基团是叠氮化物基团或炔烃基团。

在一个方面,提供了一种获得单核基因表达信息的方法,该方法包括:

a、提供包含核的样品;

b、将所述样本分成包括两个或更多个子样本的第一组子样本;

c、使第一组子样本中的两个或多个子样本中的核透化;

d、使第一组子样品中的两个或多个子样品中的细胞核与(i)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触;

其中所述第一转座酶装载有包含第一标签的核酸,所述第一标签包含选自第一组标签序列的标签序列;

e、启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

f、使用包含第二标签的引物反转录第一组子样本中的两个或多个子样本中的一个或多个核中的RNA,其中第二标签包含第二限制性酶切位点和第一标签的标签序列,从而产生包含第二标签的cDNA;

g、汇集所述第一组子样本以生成第一子样本池;

h、将所述第一子样本池划分为两个或更多个子样本以生成第二组子样本;

i、使所述第二组子样本中的两个或更多个子样本中的每一个与连接酶和第三标签接触,所述第三标签包括选自第二组标签序列的标签序列,其中所述第三标签与所述基因组DNA和所述cDNA连接;

j、汇集所述第二组子样本以生成第二子样本池;

k、将所述第二子样本池划分为两个或更多个子样本以生成第三组子样本;l、使所述第三组子样品中的两个或更多个子样品中的每一个与连接酶和第四标签接触,所述第四标签包括选自第三组标签序列的标签序列,其中所述第二标签与所述基因组DNA和所述cDNA连接;

m、将所述两个或更多个子样本汇集在所述第三组子样本中;

n、裂解细胞核;

o、将多核苷酸尾与DNA和cDNA融合,产生多核苷酸加尾DNA和cDNA;

p、扩增所述多核苷酸加尾DNA和cDNA,其中用于扩增所述DNA的引物之一包括第三限制性酶切位点;

q、将扩增的多核苷酸加尾DNA和cDNA分成DNA文库和RNA文库;

r、对于DNA文库:

1、用识别第三限制性酶切位点的核酸内切酶切割扩增的多核苷酸加尾DNA;

2、使所述DNA末端与测序接头和连接酶接触,从而产生包含所述测序接头的扩增多核苷酸加尾DNA;

3、用识别第二限制性酶切位点的酶切割扩增的多核苷酸加尾cDNA;

s、对于RNA文库:

1、用识别第一限制性酶切位点的限制性酶切割扩增的多核苷酸加尾DNA;

2、使扩增的多核苷酸加尾cDNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含测序接头的扩增的多核酸加尾cDNA;

t、对RNA文库和DNA文库进行测序;

u、使所述一个或多个核中的每一个的RNA文库和DNA文库相关联。

在一个方面,提供了一种获得单核基因表达信息的方法,该方法包括:

a、提供包含核的样品;

b、将所述样本分成包括两个或更多个子样本的第一组子样本;

c、使第一组子样本中的两个或多个子样本中的核透化;

d、使第一组子样品中的两个或多个子样品中的细胞核与(i)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触;

其中所述第一转座酶装载有包含第一标签的核酸,所述第一标签包含选自第一组标签序列的标签序列;

e、启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

f、使用包含第二标签的引物反转录第一组子样本中的两个或多个子样本中的一个或多个核中的RNA,其中第二标签包含第二限制性酶切位点和第一标签的标签序列,从而产生包含第二标签的cDNA;

g、汇集所述第一组子样本以生成第一子样本池;

h、将所述第一子样本池划分为两个或更多个子样本以生成第二组子样本;

i、使所述第二组子样本中的两个或更多个子样本中的每一个与连接酶和第三标签接触,所述第三标签包括选自第二组标签序列的标签序列,其中所述第三标签与所述基因组DNA和所述cDNA连接;

j、汇集所述第二组子样本以生成第二子样本池;

k、将所述第二子样本池划分为两个或更多个子样本以生成第三组子样本;

l、使所述第三组子样品中的两个或更多个子样品中的每一个与连接酶和第四标签接触,所述第四标签包括选自第三组标签序列的标签序列,其中所述第二标签与所述基因组DNA和所述cDNA连接;

m、将所述两个或更多个子样本汇集在所述第三组子样本中;

n、裂解细胞核;

o、将多核苷酸尾与DNA和cDNA融合,产生多核苷酸加尾DNA和cDNA;

p、扩增所述多核苷酸加尾DNA和cDNA,其中用于扩增所述cDNA的引物之一包括第三限制性酶切位点;

q、将扩增的多核苷酸加尾DNA和cDNA分成DNA文库和RNA文库;

r、对于RNA文库:

1、用识别第三限制性酶切位点的限制性内切酶切割扩增的多核苷酸加尾cDNA;

2、使所述cDNA末端与测序接头和连接酶接触,产生包含所述测序接头的扩增多核苷酸加尾cDNA;

3、用识别第一限制性酶切位点的酶切割扩增的多核苷酸加尾DNA;

s、对于DNA文库:

1、用识别第二限制性酶切位点的限制性酶切割扩增的多核苷酸加尾cDNA;

2、使扩增的多核苷酸加尾DNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含测序接头的扩增的多核酸加尾DNA;

t、对RNA文库和DNA文库进行测序;

u、使所述一个或多个核中的每一个的RNA文库和DNA文库相关联。

在一些实施方案中,对于使第一组子样品中的两个或多个子样品中的核与(i)结合染色质相关蛋白或染色质修饰的抗体和(ii)第一转座酶接触的步骤:,其中所述第一转座酶与结合所述抗体的结合部分连接;(ii)首先将所述抗体与连接到与所述抗体结合的结合部分的第一转座酶一起孵育;并且两个或多个子样品中的一个或多个核与结合转座酶的抗体接触;(iii)两个或多个子样品中的一个或多个核与共价连接到第一转座酶的抗体接触。

在一些实施方案中,在汇集第三组子样本中的两个或多个子样本的步骤之后,该方法还包括重复汇集步骤、拆分、以及将所述子样品与连接酶和包括附加标签序列的标签接触的步骤一次或多次。在一些实施方案中,在汇集第三组子样本中的两个或更多个子样本的步骤之后,该方法还包括重复汇集;拆分;以及将所述子样品与连接酶和包括附加标签序列的标签接触的步骤2、3、4、5、6、7、8、9或10次。

在一些实施方案中,第三个限制性酶切位点被IIS型核酸内切酶识别。在一些实施方案中,IIS型内切酶选自FokI、AcuI、AsuHPI、BbvI、BpmI、BpuEI、BseMII、BseRI、BseXI、BsgI、BslFI、BsmFI、BsPCNI、BstV1I、BtgZI、EciI、Eco57I、FaqI、GsuI、HphI、MmeI、NmeAIII、SchI、TaqII、TspDTI、TspGWI。在一个实施方案中,IIS型核酸内切酶是FokI。

在一个实施方案中,通过使DNA和cDNA与末端脱氧核苷酸转移酶(TdT)接触,将多核苷酸尾与DNA和cDNA融合。在一个实施方案中,通过使DNA和cDNA与DNA连接酶和DNA或RNA寡核苷酸接触,将多核苷酸尾与DNA和cDNA融合。在一些实施方案中,DNA连接酶是T3、T4或T7 DNA连接。在一个实施方案中,通过使DNA和cDNA与DNA聚合酶和随机引物接触,将多核苷酸尾与DNA和cDNA融合。在一个实施方案中,通过使DNA和cDNA与具有附着在DNA和cDNA的3’端的活性化学基团的DNA或RNA寡核苷酸接触,将多核苷酸尾与DNA和cDNA融合。在一些实施方案中,所述活性化学基团是叠氮化物基团或炔烃基团。在一些实施方案中,活性化学基团是适于进行点击化学的活性基团。

在一个实施方案中,与第一转座酶连接的结合部分是蛋白A。

在一些实施方案中,染色质相关蛋白是组蛋白、转录因子、染色质重塑复合物、RNA聚合酶、DNA聚合酶或辅助蛋白。

在一些实施方案中,染色质修饰是组蛋白修饰、DNA修饰、RNA修饰、组蛋白变体或可被抗体(如R-环)识别的DNA结构。

在一个实施方案中,细胞核从哺乳动物获得。

附图说明

图1说明了配对标签工作流。细胞核首先用针对不同组蛋白标签的抗体染色;然后进行靶向酶切法片段化和反转录。两轮基于连接的组合标记能够标计数十万个单核。然后PCR扩增并分离所得DNA,以检测组蛋白修饰和基因表达。

图2说明了DNA和RNA文库的第二接头标签化。对于DNA文库,扩增的产物用IIS型限制酶FokI消化,然后使用粘性末端连接P5接头。对于RNA文库,通过酶切法片段化添加N5接头。

图3A、3B、3C和3D示出了顺序孵育方案。图3A.两种策略的示意图。顺序孵育:首先提取细胞核并用抗体染色过夜;在第2天,首先将细胞核洗涤三次并与pA-Tn5孵育1小时,然后第二次洗涤三次,然后启动酶切法片段化反应。预孵育:在制备细胞核期间,首先将pA-Tn5和抗体预孵育1h,然后将抗体-pA-Tn6复合物与细胞核孵育过夜;在第2天,将细胞核洗涤三次,然后启动酶切法片段化反应。图3B.示出了单个细胞每个核的原始测序读取片段(reads)数量和每个核的独特位点相应数量的散点图。示出了来自顺序孵育和预孵育实验的细胞。图3C.示出了连续孵育和预孵育实验中单个细胞峰值内的读取片段比例的小提琴图。图3D.示出了来自连续孵育和预孵育实验的代表性区域的聚集H3K27me3信号基因组浏览器视图。还示出了ENCODE H3K27me3 ChIP seq数据以供参考。

图4说明了分离DNA和RNA文库的一种方法。

具体实施方式

本发明提供了联合分析单细胞基因表达和基因表达调节的方法。基因表达调控的分析可以包括对参与基因表达调控(例如染色质相关蛋白与DNA序列的结合)的蛋白质的相互作用模式的分析,和/或可以包括对目标表观遗传染色质修饰(包括组蛋白或DNA修饰)的模式的分析。

在一个实施方案中,提供了一种高通量方法,包括:(1)用一种或多种蛋白A融合转座酶靶向酶切法片段化特定染色质区域,(2)利用基于连接的组合标记策略同时标记来自反转录(RT)的cDNA和来自靶向酶切法片段化的染色质DNA,以及(3)生成单独的测序文库以描述每个分子形态。

转座酶介导的酶切法片段化

本文提供了联合分析单个细胞或细胞群中基因表达和基因表达调节的方法。基因表达调控的分析可以包括对参与基因表达调控(例如染色质相关蛋白与DNA序列的结合)的蛋白质的相互作用模式的分析,和/或可以包括对目标表观遗传染色质修饰模式的分析。

如本文所用,染色质相关蛋白是可在染色质上的一个或多个位点发现的和/或可能以短暂方式与染色质相关的蛋白质。染色质相关因子的实例包括但不限于转录因子(例如,肿瘤抑制因子、癌基因、细胞周期调节因子、发育和/或分化因子、一般转录因子(TF))、DNA和RNA聚合酶、转录机制的组分、ATP依赖性染色质重塑物(例如,(P)BAF、MOT1、ISWI、INO80、CHD1)、染色质重塑蛋白(例如,组蛋白乙酰转移酶(HAT))复合物、组蛋白去乙酰化酶(HDAC))、组蛋白甲基化酶/去甲基化酶、SWI/SNF复合物、NURD)、DNA甲基转移酶(DNMT1、DNMT3A/B)、复制因子等。此类蛋白质可在细胞周期的特定阶段(例如,G1、S、G2、M期)、在某些环境线索(例如,生长和其他刺激信号、DNA损伤信号、细胞死亡信号)、转染和瞬时或稳定表达(例如,重组因子)或感染(例如,病毒因子)时与染色质(DNA、组蛋白)相互作用。染色质相关蛋白还包括组蛋白及其变体。组蛋白可以通过翻译后修饰在组蛋白尾进行修饰,改变它们与DNA和核蛋白的相互作用,并影响例如基因调节、DNA修复和染色体缩合。H3和H4组蛋白具有从核小体突出的长尾,可通过甲基化、乙酰化、磷酸化、泛素化、类泛素化(sumoylation)、瓜氨酸化和ADP核糖基化等方式进行共价修饰。组蛋白H2A和H2B的核心也可以被修饰。

在一些实施方案中,染色质相关因子与染色质DNA序列的结合是直接的。换句话说,染色质相关因子与染色质DNA直接接触,并与染色质DNA直接物理接触,这与DNA结合转录因子的情况相同。在其他实施方案中,目标染色质相关因子与染色质DNA序列的结合是间接的。换句话说,接触可以是间接的,例如通过复合物的成员接触。

在一些实施方案中,所公开的方法用于分析单个细胞(或细胞群)中转录因子与DNA序列的结合。如本文所用,转录因子是影响基因表达调节的蛋白质。特别是,转录因子调节RNA聚合酶的结合和转录的启动。转录因子在上游或下游结合,通过辅助或封阻RNA聚合酶结合来增强或抑制基因的转录。术语转录因子包括非活性转录因子和活化转录因子。示例性转录因子包括但不限于AAF、abl、ADA2、ADA-NF1、AF-1、AFP1、AhR、AIIN3、ALL-1、α-CBF、α-CP 1、α-CP2a、α-CP2b、αHo、αH2-αH3、Alx-4、aMEF-2、AML1、AML1a、AML1b、AML1c、AML1ΔN、AML2、AML3、AML3a、AML3b、AMY-1L、A-Myb、ANF、AP-1、AP-2αA、AP-2αB、AP-2β、AP-2γ、AP-3(1)、AP-3(2)、AP-4、AP-5、APC、AR、AREB6、Arnt、Arnt(774M型)、ARP-1、ATBF1-A、ATBF1-B、ATF、ATF-1、ATF-2、ATF-3、ATF-3δZIP、ATF-a、ATF-aδ、ATPF1、Bar1111、Barh12、Barxl、Barx2、Bc1-3、BCL-6、BD73、β-连环蛋白、Binl、B-Myb、BP1、BP2、brahma、BRCA1、Brn-3a、Brn-3b、Brn-4、BTEB、BTEB2、B-TFIID、C/EBPα、C/EBPβ、C/EBPδ、CACC结合因子、Cart-1、CBF(4)、CBF(5)、CBP、CCAAT结合因子、CCMT结合因子、CCF、CCG1、CCK-la、CCK-lb、CD28RC、cdk2、cdk9、Cdx-1、CDX2、Cdx-4、CFF、Chx10、CLIMI、CLIM2、CNBP、CoS、COUP、CPI、CPIA、CPIC、CP2、CPBP、CPE结合蛋白、CREB、CREB-2、CRE-BPI、CRE-BPa、CREMα、CRF、Crx、CSBP-1、CTCF、CTF、CTF-1、CTF-2、CTF-3、CTF-5、CTF-7、CUP、CUTL1、Cx、细胞周期蛋白A、细胞周期蛋白Tl、细胞周期蛋白T2、细胞周期蛋白T2a、细胞周期蛋白T2b、DAP、DAX1、DB1、DBF4、DBP、DbpA、DbpAv、DbpB、DDB、DDB-1、DDB-2、DEF、δCREB、δMax、DF-1、DF-2、DF-3、Dlx-1、Dlx-2、Dlx-3、DIx4(长异构体)、Dlx-4(短异构体、Dlx-5、Dlx-6、DP-1、DP-2、DSIF、DSIF-p14、DSIF-p160、DTF、DUX1、DUX2、DUX3、DUX4、E、El 2、E2F、E2F+E4、E2F+p107、E2F-1、E2F-2、E2F-3、E2F-4、E2F-5、E2F-6、E47、E4BP4、E4F、E4F1、E4TF2、EAR2、EBP-80、EC2、EF1、EF-C、EGR1、EGR2、EGR3、EIIaE-A、EIIaE-B、EIIaE-Cα、EIIaE-Cβ、EivF、EIf-1、EIk-1、Emx-1、Emx-2、Emx-2、En-1、En-2、ENH-结合蛋白、ENKTF-1、EPAS1、εFl、ER、Erg-1、Erg-2、ERR1、ERR2、ETF、Ets-1、Ets-1δVil、Ets-2、Evx-1、F2F、因子2、因子名称(Factorname)、FBP、f-EBP、FKBP59、FKHL18、FKHRL1P2、Fli-1、Fos、FOXB1、FOXCl、FOXC2、FOXD1、FOXD2、FOXD3、FOXD4、FOXE1、FOXE3、FOXF1、FOXF2、FOXG1a、FOXG1b、FOXG1c、FOXH1、FOXI1、FOXJ1a、FOXJ1b、FOXJ2(长异构体)、FOXJ2(短异构体)、FOXJ3、FOXKla、FOXKlb、FOXKlc、FOXL1、FOXMla、FOXMlb、FOXM1c、FOXN1、FOXN2、FOXN3、FOX01a、FOX01b、FOX02、FOX03a、FOX03b、FOX04、FOXP1、FOXP3、Fra-1、Fra-2、FTF、FTS、G因子、G6因子、GABP、GABP-α、GABP-βl、GABP-β2、GADD 153、GAF、γCMT、γCAC1、γCAC2、GATA-1、GATA-2、GATA-3、GATA-4、GATA-5、GATA-6、Gbx-1、Gbx-2、GCF、GCMa、GCNS、GF1、GLI、GLI3、GRα、GRβ、GRF-1、Gsc、Gscl、GT-IC、GT-IIA、GT-IIBα、GT-IIBβ、H1TF1、H1TF2、H2RIIBP、H4TF-1、H4TF-2、HAND1、HAND2、HB9、HDAC1、HDAC2、HDAC3、hDaxx、热诱导因子(heat-inducedfactor)、HEB、HEB1-p67、HEB1-p94、HEF-1B、HEF-1T、HEF-4C、HEN1、HEN2、Hesxl、Hex、HIF-1、HIF-lα、HIF-lβ、HiNF-A、HiNF-B、HINF-C、HINF-D、HiNF-D3、HiNF-E、HiNF-P、HIP1、HIV-EP2、Hlf、HLTF、HLTF(Met123)、HLX、HMBP、HMG I、HMG I(Y)、HMGY、HMGI-C、HNF-IA、HNF-IB、HNF-IC、HNF-3、HNF-3α、HNF-3β、HNF-3γ、HNF4、HNF-4α、HNF4αl、HNF-4α2、HNF-4α3、HNF-4α4、HNF4γ、HNF-6α、hnRNP K、HOX11、HOXAL HOXAIO、HOXAIO PL2、HOXA11、HOXA13、HOXA2、HOXA3、HOXA4、HOXAS、HOXA6、HOXA7、HOXA9A、HOXA9B、HOXB-1、HOXB13、HOXB2、HOXB3、HOXB4、HOXBS、HOXB6、HOXAS、HOXB7、HOXB8、HOXB9、HOXC10、HOXC11、HOXC12、HOXC13、HOXC4、HOXCS、HOXC6、HOXC8、HOXC9、HOXD10、HOXD11、HOXD12、HOXD13、HOXD3、HOXD4、HOXD8、HOXD9、Hp55、Hp65、HPX42B、HrpF、HSF、HSF1(长)、HSF1(短)、HSF2、hsp56、Hsp90、IBP-1、ICER-II、ICER-liγ、ICSBP、Idl、Idl H'、Id2、Id3、Id3/Heir-1、IF1、IgPE-1、IgPE-2、IgPE-3、IκB、IκB-α、IκB-β、IκBR、II-1RF、IL-6RE-BP、11-6RF、INSAF、IPF1、IRF-1、IRF-2、B、IRX2a、Irx-3、Irx-4、ISGF-1、ISGF-3、ISGF3α、ISGF-3γ、1st-1、ITF、ITF-1、ITF-2、JRF、Jun、JunB、JunD、κy因子、KBP-1、KER1、KER-1、Koxl、KRF-1、Ku自体抗体、KUP、LBP-1、LBP-la、LBX1、LCR-Fl、LEF-1、LEF-IB、LF-Al、LHX1、LHX2、LHX3a、LHX3b、LHXS、LHX6.1a、LHX6.1b、LIT-1、Lmol、Lmo2、LMX1A、LMX1B、L-Myl(长型)、L-Myl(短型)、L-My2、LSF、LXRα、LyF-1、Ly1-1、M因子、Madl、MASH-1、Maxl、Max2、MAZ、MAZ1、MB67、MBF1、MBF2、MBF3、MBP-1(1)、MBP-1(2)、MBP-2、MDBP、MEF-2、MEF-2B、MEF-2C(433AA型)、MEF-2C(465AA型)、MEF-2C(473M型)、MEF-2C/δ32(441AA型)、MEF-2D00、MEF-2D0B、MEF-2DA0、MEF-2DAO、MEF-2DAB、MEF-2DA'B、Meis-1、Meis-2a、Meis-2b、Meis-2c、Meis-2d、Meis-2e、Meis3、Meoxl、Meoxla、Meox2、MHox(K-2)、Mi、MIF-1、Miz-1、MM-1、MOP3、MR、Msx-1、Msx-2、MTB-Zf、MTF-1、mtTFl、Mxil、Myb、Myc、Myc 1、Myf-3、Myf-4、Myf-5、Myf-6、MyoD、MZF-1、NCI、NC2、NCX、NELF、NER1、Net、NF Ill-a、NF NF-1、NF-1A、NF-1B、NF-1X、NF-4FA、NF-4FB、NF-4FC、NF-A、NF-AB、NFAT-1、NF-AT3、NF-Atc、NF-Atp、NF-Atx、NfηA、NF-CLE0a、NF-CLE0b、NFδE3A、NFδE3B、NFδE3C、NFδE4A、NFδE4B、NFδE4C、Nfe、NF-E、NF-E2、NF-E2 p45、NF-E3、NFE-6、NF-Gma、NF-GMb、NF-IL-2A、NF-IL-2B、NF-jun、NF-κB、NF-κB(-样)、NF-κBl、NF-κB 1、前体、NF-κB2、NF-κB2(p49)、NF-κB2前体、NF-κEl、NF-κE2、NF-κE3、NF-MHCIIA、NF-MHCIIB、NF-muEl、NF-muE2、NF-muE3、NF-S、NF-X、NF-X1、NF-X2、NF-X3、NF-Xc、NF-YA、NF-Zc、NF-Zz、NHP-1、NHP-2、NHP3、NHP4、NKX2-5、NKX2B、NKX2C、NKX2G、NKX3A、NKX3Avl、NKX3Av2、NKX3Av3、NKX3Av4、NKX3B、NKX6A、Nmi、N-Myc、N-Oct-2α、N-Oct-2β、N-Oct-3、N-Oct-4、N-Oct-5a、N-Oct-Sb、NP-TCII、NR2E3、NR4A2、Nrfl、Nrf-1、Nrf2、NRF-2βl、NRF-2γl、NRL、NRSF 1型、NRSF 2型、NTF、02、OCA-B、Oct-1、Oct-2、Oct-2.1、Oct-2B、Oct-2C、Oct-4A、Oct4B、Oct-5、Oct-6、Octa因子、八聚体结合因子、oct-B2、oct-B3、Otxl、Otx2、OZF、p107、p130、p28效应分子(modulator)、p300、p38erg、p45、p49erg,-p53、p55、p55erg、p65δ、p67、Pax-1、Pax-2、Pax-3、Pax-3A、Pax-3B、Pax-4、Pax-5、Pax-6、Pax-6/Pd-5a、Pax-7、Pax-8、Pax-8a、Pax-8b、Pax-8c、Pax-8d、Pax-8e、Pax-8f、Pax-9、Pbx-la、Pbx-lb、Pbx-2、Pbx-3a、Pbx-3b、PC2、PC4、PCS、PEA3、PEBP2α、PEBP2β、Pit-1、PITX1、PITX2、PITX3、PKNOX1、PLZF、PO-B、Pontin52、PPARα、PPARβ、PPARγl、PPARγ2、PPUR、PR、PRA、pRb、PRD1-BF1、PRDI-BFc、Prop-1、PSE1、P-TEFb、PTF、PTFα、PTFβ、PTFδ、PTFγ、Pu盒结合因子、Pu box结合因子(B JA-B)、PU.1、PuF、Pur因子、R1、R2、RAR-αl、RAR-β、RAR-β2、RAR-γ、RAR-γl、RBP60、RBP-Jκ、Rel、RelA、RelB、RFX、RFX1、RFX2、RFX3、RFXS、RF-Y、RORαl、RORα2、RORα3、RORβ、RORγ、Rox、RPF1、RPGα、RREB-1、RSRFC4、RSRFC9、RVF、RXR-α、RXR-β、SAP-la、SAP1b、SF-1、SHOX2a、SHOX2b、SHOXa、SHOXb、SHP、SIII-p11O、SIII-p15、SIII-p18、SIM'、Six-1、Six-2、Six-3、Six-4、Six-5、Six-6、SMAD-1、SMAD-2、SMAD-3、SMAD-4、SMAD-5、SOX-11、SOX-12、Sox-4、Sox-5、SOX-9、Spl、Sp2、Sp3、Sp4、Sph因子、Spi-B、SPIN、SRCAP、SREBP-la、SREBP-lb、SREBP-lc、SREBP-2、SRE-ZBP、SRF、SRY、SRPL Staf-50、STATlα、STATlβ、STAT2、STAT3、STAT4、STAT6、T3R、T3R-αl、T3R-α2、T3R-β、TAF(I)110、TAF(I)48、TAF(I)63、TAF(II)100、TAF(II)125、TAF(II)135、TAF(II)170、TAF(II)18、TAF(II)20、TAF(II)250、TAF(II)250Δ、TAF(II)28、TAF(II)30、TAF(II)31、TAF(II)55、TAF(II)70-α、TAF(II)70-β、TAF(II)70-γ、TAF-I、TAF-II、TAF-L、Tal-1、Tal-lβ、Tat-2、TAR因子、TBP、TBX1A、TBX1B、TBX2、TBX4、TBXS(长异构体)、TBXS(短异构体)、TCF、TCF-1、TCF-1A、TCF-1B、TCF-1C、TCF-1D、TCF-1E、TCF-1F、TCF-1G、TCF-2α、TCF-3、TCF-4、TCF-4(K)、TCF-4B、TCF-4E、TCFβl、TEF-1、TEF-2、tel、TFE3、TFEB、TFIIA、TFIIA-α/β前体、TFIIA-α/β前体、TFIIA-γ、TFIIB、TFIID、TFIIE、TFIIE-α、TFIIE-β、TFIIF、TFIIF-α、TFIIF-β、TFIIH、TFIIH*、TFIIH-CAK、TFIIH-细胞周期蛋白H、TFIIH-ERCC2/CAK、TFIIH-MAT1、TFIIH-M015、TFIIH-p34、TFIIH-p44、TFIIH-p62、TFIIH-p80、TFIIH-p90、TFII-I、Tf-LF1、Tf-LF2、TGIF、TGIF2、TGT3、THRALTIF2、TLE1、TLX3、TMF、TR2、TR2-11、TR2-9、TR3、TR4、TRAP、TREB-1、TREB-2、TREB-3、TREFLTREF2、TRF(2)、TTF-1、TXRE BP、TxREF、UBF、UBP-1、UEF-1、UEF-2、UEF-3、UEF-4、USF1、USF2、USF2b、Vav、Vax-2、VDR、vHNF-1A、vHNF-1B、vHNF-1C、VITF、WSTF、WT1、WT1I、WT1 I-KTS、WT1 I-de12、WT1-KTS、WT1-de12、X2BP、XBP-1、XW-V、XX、YAF2、YB-1、YEBP、YY1、ZEB、ZFl、ZF2、ZFX、ZHX1、ZIC2、ZID、ZNF 174,诸如此类。

本文公开了分析单个细胞或细胞群中表观遗传染色质修饰模式的方法。在一些实施方案中,表观遗传染色质修饰是组蛋白修饰或DNA修饰。本文公开的方法靶向的组蛋白修饰包括但不限于H2A.X、H2A.Z、H2A.Zac、H2A.ZK4ac、H2A.ZK7ac、H2AK119ub、H2AK5ac、H2BK12ac、H2BK15ac、H2BK20ac、H2BK123ub、H2Bpan、H3.3、H3K14ac、H3K18ac、H3K18mel、H3K18me2、H3K23me2、H3K27ac、H3K27me1、H3K27me2、H3K27me3、H3K27me3S28p、H3K36me1、H3K36me2、H3K36me3、H3K4ac、H3K4me1、H3K4me2、H3K4me3、H3K4me3T6p、H3k4un、H3K56ac、H3K56me1、H3K64me3、H3K79ac、H3K79me1、H3K79me3、H3K9/14ac、H3K9ac、H3K9acS10p、H3K9me1、H3K9me2、H3K9me3、H3Kme3S10p、H3K9un、H3pan、H3R17me2、H3R17me2(asym)、H3R17me2(asym)K18ac、H3R2me2K4me2、H3T6pK9me3、H4K12ac、H4K 16ac、H4K2Oac、H4K2Omel、H4K2Ome2、H3R2me2、H4K2Ome3、H4K5,8,12ac、H4K5ac、H4K8ac、H4pan和H4S1p。

可使用本文公开的方法靶向的染色质相关蛋白的其他非限制性实例包括HDAC1、HDAC2、HDAC3、HIFlα、HP1、JARID1C、JMJ2a、JMJD6、KAP1、KAT2B、KDM6A、LSD1、MBD1、MBD1、MeCP2、MYH11、NCOR1、NF-E2、NFKB、NFYB、NRF 1、NRF2、OCT4、p300、p53、PARP1、PAX8、Pol II、Pol II S2p、PPARG、RbAp48、RBBP5、RFX-AP、RNF2、SAP30、SIN3A、Ski3、Ski8、SMAD1、SMAD2、SMYD3、Suz12、TAL1、TARDBP、TRP、TFIIF、THOC1、TIPS、TRRAP、Tyl、UHRF1、YY1、ZHX2、andZMYM3.AF9、AML1-ETO、BRD4、C/EBP、CBFb、CBX2、CBX8、CHD1、CHD7、CRISPR/Cas9、CTCF、CXXCl、DNMT3B、E2F6、ERR、ETO、EZH2、FOXA1、FOXA2、FOXMl、FUBP1、GR和GTF2E2。

在一个实施方案中,本文公开的方法包括将染色质相关蛋白或染色质修饰与特异性识别染色质相关蛋白质或染色质修饰的特异性结合剂接触。

在一个实施方案中,特异性结合剂是抗体或其抗原结合片段。多克隆或单克隆抗体和单克隆抗体片段,例如Fab、F(ab’)2和Fv片段,以及能够特异性结合染色质相关蛋白或染色质修饰的任何其他试剂可被生产。优选地,针对染色质相关蛋白或染色质修饰而产生的抗体特异性结合目标染色质相关蛋白质或染色质修饰。也就是说,这种抗体将识别并结合染色质相关蛋白或染色质修饰,而不会实质上识别或结合其他染色质相关蛋白质或染色质修饰。抗体对靶标特异性结合或目标受体多肽内化的测定可通过多种标准免疫测定方法中的任一种进行;例如,蛋白免疫印迹技术(Sambrook等人,1989,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Laboratories,Cold SpringHarbor,NY)。

在一些实施方案中,本文公开的方法包括使未交联的透化细胞与特异性结合剂接触。在一些实施方案中,本文公开的方法包括使交联的透化细胞与特异性结合剂接触。在一些实施方案中,接触在约4℃的温度下进行。使用完整的细胞或细胞核保留了天然染色质结构,所述结构在其他情况可能被碎片化和其他处理步骤改变。

在一些实施方案中,通过使细胞与渗透细胞的试剂(例如去污剂(例如Triton和/或NP-40或诸如洋地黄皂苷的另一种试剂))接触,使细胞和/或细胞核透化。

在一些实施方案中,细胞是真核细胞,来源于诸如酵母、昆虫、真菌、鸟类或哺乳动物。在一些实施方案中,哺乳动物细胞来源于人、灵长类动物、仓鼠、兔、啮齿类动物、牛、猪、羊、马、山羊、狗或猫,但可以使用任何其他哺乳动物细胞。

在一些实施方案中,特异性结合剂与转座酶连接,该转座酶任选地是非活性和可激活的,例如通过添加离子(例如诸如Mg

在一些实施方案中,转座酶是Tn5转座酶。在一些实施方案中,转座酶是超活性Tn5转座酶。在一些实施方案中,转座酶是MuA转座酶。可与本文提供的实施方案一起使用的转座系统的其他非限制性实例包括金黄色葡萄球菌(Staphylococcus aureus)Tn552(Colegio等人,J.Bacteriol,183:23848-2001;Kirby C等人,Mol.Microbiol,43:173-862002)、Tyl(Devine&Boeke,Nucleic Acids Res.,22:3765-721994和国际公开WO 95/23875)、转座子Tn7(Craig,N L,Science,271:1512996;Craig,L,Review in:CurrTopMicrobiol Immunol,204:27-481996),Tn/O和IS 10(KlecknerN等人,CurrTop MicrobiolImmonol,204:49-821996)、Mariner转座酶(Lampe D J,et al.,EMBO J.,15:5470-1996),Tel(Plastek R H,Curr.Topics Microbiol.Immunol.,204:125-431996)、P转座子(PElement)(Gloor,G B,Methods Mol。Biol,260:97-1142004)、Tn3(Ichikawa&Ohtsubo,JBiol.Chem.265:18829-321990)、细菌插入序列(Ohtsubo&Sekine,Curr.Top.Microbiol.Immunol.204:1-261996)、反转录病毒(Brown等人Proc NatlAcadSci USA,86:2525-91989)和酵母的反转录转座子(Boeke&Corces,Annu RevMicrobiol.43:403-341989)。更多的例子包括IS5、Tn10、Tn903、IS911和转座酶家族酶的工程化版本(Zhang等人,(2009)PLoS Genet.5:e1000689.Epub 2009年10月16日;Wilson C.等人(2007).Microbiol.Methods 71:332-5)和美国专利No.5925545;No.5,963,443;No.6,437,109;No.6,159,736;No.6,406,896;No.7,083,980;7,316,903;No.7,608,434;No.6,294,385;No.7,067,644;No.7,527,966;以及国际专利公开No.WO2012103545中所述的方法,其全部内容通过引用具体并入本文。

在一些实施方案中,转座酶装载有包含一个或多个标签的核酸。该标签可以包括有助于对所产生的片段DNA进行测序的序列,例如使用二代测序,例如配对末端测序和/或基于阵列的测序。标签可以包括核酸内切酶限制性酶切位点。标签可以包括用于识别特定样品或复制样品的标签序列。如本文所用,标签序列是具有特定序列的寡核苷酸(双链或单链)。标签可以包括接头(linker)序列。标签可以包括通用启动位点。包含通用启动位点有助于扩增产生的片段DNA,例如使用基于PCR的扩增。在一个实施方案中,引物序列可以与用于扩增的引物互补。在一个实施方案中,引物序列与用于测序的引物互补。标签可以为核酸提供一些功能性,并且可以包括亲和或报告部分。

在一些实施方案中,转座酶与第二结合剂连接,第二结合剂与特异性识别染色质相关蛋白或染色质修饰的特异性结合剂结合。

在一些实施方案中,特异性识别染色质相关蛋白或染色质修饰的特异性结合剂是抗体。在一些实施方案中,转座酶与第二抗体连接,该第二抗体与特异性识别染色质相关蛋白或染色质修饰的第一抗体结合。在一些实施方案中,转座酶与蛋白A或蛋白G连接,蛋白A或G与特异性识别染色质相关蛋白或染色质修饰的第一抗体结合。转座酶可与葡萄球菌蛋白A(pA)的全部或部分或葡萄球菌蛋白G(pG)的全部和部分或与pA和pG(pAG)两者融合。转座酶也可以与任何其他蛋白质或蛋白质部分(例如对抗体具有亲和力的pA或pG的衍生物)融合。在一个实施方案中,转座酶与pAG-MN融合。在pAG-MN中,pA部分包含葡萄球菌蛋白A的2个IgG结合域,即(Genbank条目AAA26676;来自金黄色葡萄球菌的蛋白A)(SEQ ID NO:1)的氨基酸186至327。还考虑保留活性的变体,例如与Genbank条目AAA26676的氨基酸186至327具有至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的序列。

SEQ ID NO:1(对应于Genbank条目AAA26676):

SLKDDPSQSANLLSEAKKLNESQAPKADNKFNKEQQNAFYEILHLPNLNEEQRNGFIQSLKDDPSQSANLLAEAKKLNDAQAPKADNKFNKEQQNAFYEILHLPNLTEEQRNGFIQSLKDDPSVSKEILAEAKKLNDAQAPK

本文提供了一种方法,包括使细胞核与特异性结合染色质相关蛋白或染色质修饰的第一抗体接触。本文提供了一种方法,包括使细胞核与特异性结合染色质相关蛋白或染色质修饰的第一抗体接触。

在一些实施方案中,在细胞与结合剂/转座酶复合物接触之前,特异性结合剂和转座酶相互预孵育。在一些实施方案中,结合染色质相关因子或染色质修饰的特异性结合剂是抗体,其中所述抗体与连接到结合所述抗体的结合部分的转座酶预孵育;随后一个或多个核与结合转座酶的抗体接触。

本文提供了一种方法,包括使细胞核与特异性结合染色质相关蛋白或染色质修饰的第一抗体接触,使细胞核与结合第一抗体的第二抗体接触,以及使细胞核与连接到结合第一抗体第三抗体的转座酶接触。

在一些实施方案中,细胞核与一种以上的转座酶接触。

在一个方面,本发明提供了一种方法,包括:

(1)使一个或多个核透化;

(2)(i)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触;以及使所述一个或多个核与连接到结合所述抗体的结合部分的转座酶接触;(ii)将与染色质相关蛋白或染色质修饰结合的抗体与与抗体结合的结合部分连接的转座酶孵育;并使所述一个或多个核与结合到转座酶的抗体接触;或(iii)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触,其中所述抗体与转座酶共价连接;

其中所述转座酶装载有包含标签的核酸;和

(3)启动酶切法片段化反应,产生包含所述标签的基因组DNA片段。

在一些实施方案中,一个或多个核与一种以上结合染色质相关蛋白或染色质修饰的抗体接触。在一些实施方案中,转座酶装载有包含标签的核酸,其中所述标签包含核酸,所述核酸包含标签序列和/或核酸内切酶限制性酶切位点。在一些实施方案中,将一个或多个核与一个以上转座酶接触。在一些实施方案中,所述一个或多个核与一种或多种转座酶接触,其中每个转座酶装载有包含不同标签的核酸。在一些实施方案中,与转座酶连接的结合部分是蛋白A。

反转录

在一个方面,本发明提供了一种方法,包括:

(1)使一个或多个核透化;

(2)使用包含标签的引物在一个或多个核中反转录RNA,从而产生包含标签的cDNA。

在一些实施方案中,所述标签包括标签序列和/或核酸内切酶限制性酶切位点标签。在一些实施方案中,所述标签包括有助于对所产生的片段DNA进行测序的序列、接头序列、通用启动位点或使反转录产物具备某些功能的另一部分,例如亲和标签或报告部分。

可以使用任何适合反转录的酶。

在一个方面,提供了一种方法,包括:

(1)使一个或多个核透化;

(2)(i)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触;以及使所述一个或多个核与连接到结合所述抗体的结合部分的转座酶接触;(ii)将与染色质相关蛋白或染色质修饰结合的抗体与与抗体结合的结合部分连接的转座酶孵育;并使所述一个或多个核与结合到转座酶的抗体接触;或(iii)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触,其中所述抗体与转座酶共价连接;

其中所述转座酶装载有包含第一标签的核酸;和

(3)启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;和

(4)使用包含第二标签的引物在一个或多个核中反转录RNA,产生包含第二标签的cDNA。

在一些实施方案中,一个或多个核与一种以上结合染色质相关蛋白或染色质修饰的抗体接触。在一个实施方案中,第一和第二标签包括相同的标签序列。在一个实施方案中,第一标签包括第一核酸内切酶限制性酶切位点,第二标签包括第二核酸内切酶酶限制性酶切位点。在一个实施方案中,第一和第二标签包括相同的标签序列,第一标签包括第一核酸内切酶限制性酶切位点,第二标签包含第二核酸内切酶酶限制性酶切位点。在一些实施方案中,与转座酶连接的结合部分是蛋白质A。在一个实施方案中,在反转录反应之前进行酶切法片段化反应。在一个实施方案中,酶切法片段化反应在反转录反应之后进行。在一个实施方案中,酶切法片段化反应和反转录反应同时进行。

在一个实施方案中,提供了一种方法,包括:

(1)使一个或多个核透化;

(2)(i)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触;并使所述一个或多个核与连接到蛋白A的转座酶接触;(ii)将结合染色质相关因子或染色质修饰的抗体与连接蛋白A的转座酶孵育;并使所述一个或多个核与结合到转座酶的抗体接触;或(iii)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触,其中所述抗体与转座酶共价连接;

其中所述转座酶装载有核酸,所述核酸包含包含标签序列和第一限制性酶切位点的第一标签;和(3)启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;和(4)使用包含包含标签序列的第二标签和第二限制性酶切位点的引物在一个或多个核中反转录RNA,从而产生包含第二标签的cDNA。

本发明提供了一种方法,包括提供包含细胞核的样品并将样品分成两个或多个子样品,对于两个或更多个子样品中的每一个,执行包括以下步骤的方法:

(1)使核透化;

(2)(i)使核与结合染色质相关蛋白或染色质修饰的抗体接触;并使所述核与连接到结合所述抗体的结合部分的转座酶接触;(ii)将与染色质相关蛋白或染色质修饰结合的抗体与与抗体结合的结合部分连接的转座酶孵育;并使所述一个或多个核与结合到转座酶的抗体接触;或(iii)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触,其中所述抗体与转座酶共价连接;

其中所述转座酶装载有包含包含标签序列的第一标签的核酸;和

(3)启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;和

(4)使用包含包含第一标签的标签序列的第二标签的引物在细胞核中反转录RNA,从而产生包含第二标签的cDNA。

基于连接的组合标记

在实施方案中,对包含包含第一标签的基因组DNA片段和包含第二标签的cDNA的细胞核进行额外的标记。在一些实施方案中,将第三标签连接到包含第一标签的基因组DNA片段和包含第二标签的cDNA。在一些实施方案中,第三标签包括标签序列和/或核酸内切酶限制性酶切位点。在一些实施方案中,将第四标签连接到包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA。在一些实施方案中,第四标签接头包括标签序列和/或核酸内切酶限制性酶切位点。额外的标签可以连接到包含第一、第三和第四标签的所得基因组DNA片段上,以及连接到包含第二、第三、和第四标签的cDNA上。

在一个方面,本发明提供了一种方法,包括:

(1)提供包含基因组DNA片段的细胞核以及cDNA,所述基因组DNA片段包含第一标签,所述第一标签包含标签序列,所述cDNA包含第二标签,所述第二标签包含所述第一标签的标签序列;

(2)使所述核与连接酶和包含第二标签序列的第三标签接触,从而产生包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA;以及任选地

(3)重复步骤2一次或多次以添加基因组DNA和cDNA的附加标签。

本发明提供了一种方法,所述方法包括提供包含细胞核的样品并将样品分成两个或多个子样品,其中每个子样品进行标签化和反转录,并且其中每个子样本的细胞核中每个子样品的所得基因组DNA和cDNA包含选自第一组标签序列的相同标签序列,但是其中用于不同子样本的标签序列是不同的(第一轮标记)。然后可以将不同的子样本合并并再次分成两个或多个子样本,其中两个或更多个子样本中的每一个与连接酶和接头接触,所述接头包括选自第二组标签序列的标签序列,以将接头连接到每个子样本中的基因组DNA和cDNA(第二轮标记)。然后,可以再次汇集不同的子样本并将其再次分成两个或多个子样本,其中两个或更多个子样本中的每一个与连接酶和接头接触,所述接头包括选自第三组标签序列的不同标签序列,以将接头连接到每个子样本中的基因组DNA和cDNA(第三轮标记)。这个过程可以重复进行,以允许进行更多轮的标记。

本发明提供了一种方法,包括:

(1)提供包含核的样品;

(2)将所述样本分成包括两个或更多个子样本的第一组子样本;

(3)使第一组子样本中的两个或多个子样本中的核透化;

(4)(i)使第一组子样品中的两个或多个子样品中的细胞核与结合染色质相关蛋白或染色质修饰的抗体接触;以及使第一组子样品中的两个或更多个子样品中的每一个与连接到结合抗体的结合部分的转座酶接触;(ii)将与染色质相关蛋白或染色质修饰结合的抗体与与抗体结合的结合部分连接的转座酶孵育;并使所述一个或多个核与结合到转座酶的抗体接触;或(iii)使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触,其中所述抗体与转座酶共价连接;

其中所述转座酶装载有包含第一标签的核酸,所述第一标签包含选自第一组标签序列的标签序列;

(5)启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

(6)使用包含第二标签的引物在细胞核中反转录RNA,所述第二标签包含第一标签的标签序列,从而产生包含第二标签的cDNA;

(7)汇集所述第一组子样本以生成第一子样本池;

(8)将所述第一子样本池划分为两个或更多个子样本以生成第二组子样本;

(9)使所述第二组子样本中的两个或更多个子样本中的每一个与连接酶和标签接触,所述连接酶或标签包括选自第二组标签序列的标签序列,其中所述标签与所述基因组DNA和所述cDNA连接;

(10)汇集所述第二组子样本以生成第二子样本池;

(11)将所述第二子样本池划分为两个或更多个子样本以生成第三组子样本;

(12)使所述第三组子样本中的两个或更多个子样本中的每一个与连接酶和标签接触,所述连接酶或标签包括选自第三组标签序列的标签序列,其中所述标签与所述基因组DNA和所述cDNA连接;

(13)可选地用第四组标签序列重复步骤(10)–(12)。

在一些实施方案中,汇集子样本、分割成新的子样本以及用连接酶和包含附加标签序列的标签接触新的子样品的步骤重复一次或多次。

核裂解

在一些实施方案中,在细胞核中包含的基因组DNA和cDNA(通过RNA反转录获得)经历一轮或多轮标记之后,细胞核被裂解,释放DNA和cDNA。可以合并多个细胞的DNA和cDNA以生成DNA/cDNA池。

标记DNA/cDNA的预扩增

在一些实施方案中,用末端脱氧核苷酸转移酶(TdT)对DNA/cDNA池中的DNA和cDNA进行多核苷酸加尾,使在其3’端添加一个同聚序列,然后可以用作扩增的锚。

在一个实施方案中,通过使DNA和cDNA与DNA连接酶和DNA或RNA寡核苷酸接触,对DNA/cDNA池中的DNA和cDNA进行多核苷酸加尾。在一些实施方案中,DNA连接酶是T3、T4或T7DNA连接。在一个实施方案中,通过使DNA和cDNA与DNA聚合酶和随机引物接触,对DNA/cDNA池中的DNA和cDNA进行多核苷酸加尾。在一个实施方案中,通过使DNA和cDNA与具有附着在DNA和cDNA的3’端的活性化学基团的DNA或RNA寡核苷酸接触,使DNA/cDNA池中的DNA和cDNA进行多核苷酸加尾。在一些实施方案中,活性化学基团是叠氮化物基团或炔烃基团。

在一些实施方案中,通过PCR预扩增多核苷酸加尾DNA和cDNA。在一些实施方案中,用于扩增多核苷酸加尾DNA的引物中的至少一个包含IIS型核酸内切酶的限制性酶切位点。

IIS型限制性酶是一种识别不对称DNA序列的酶,并在其识别序列之外的特定距离处切割,通常在1至20个核苷酸内。与本文公开的组合物和方法相容的IIS型限制性酶的实例包括但不限于FokI、AcuI、AsuHPI、BbvI、BpmI、BpuEI、BseMII、BseRI、BseXI、BsgI、BslFI、BsmFI、BsPCNI、BstV1I、BtgZI、EciI、Eco57I、FaqI、GsuI、HphI、MmeI、NmeAII、SchI、TaqII、TspDTI、TspGWI。

单独的DNA和RNA测序文库的产生

在一些实施方案中,包含多核苷酸加尾DNA和cDNA的池用于生成两个单独的文库,即DNA和RNA文库。如本文所用,术语“RNA文库”是指通过反转录细胞核中存在的RNA(并任选地扩增和进一步修饰所得cDNA)而制备的cDNA分子文库。

可以使用各种方法从包含多核苷酸加尾DNA和cDNA的池中生成DNA和RNA文库。

在一个方面,提供了一种从包含多核苷酸加尾DNA和cDNA的池中生成DNA和RNA文库的方法,其中所述基因组DNA与包含第一内切酶限制性酶切位点的标签连接,所述cDNA与包含第二内切酶限制酶切位点的标签连接。包含多核苷酸加尾DNA和cDNA的池可分为两批,其中(i)用第一核酸内切酶消化第一批,在第一核酸内切酶限制性酶切位点切割扩增的多核苷酸加尾DNA的,生成RNA文库,并且(ii)用第二核酸内切酶消化第二批,在第二内切酶限制性酶切位点切割扩增的多核苷酸加尾cDNA,生成DNA文库。

在一个方面,本发明提供了一种从包含多核苷酸加尾DNA和cDNA的池中生成DNA和RNA文库的方法,其中所述基因组DNA与包含第一内切酶限制性酶切位点的标签连接,所述cDNA与包含第二内切酶限制性酶切位点的标签连接。包含多核苷酸加尾DNA和cDNA的池可分为两批。

在一个实施方案中,对第一批进行以下步骤:(a)用识别第一限制性酶切位点的第一限制性酶切割扩增的多核苷酸加尾DNA;和(b)使扩增的多核苷酸加尾cDNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含测序接头的扩增的多核酸加尾cDNA;生成RNA文库。

在一个实施方案中,用于扩增基因组DNA的引物之一包含第三核酸内切酶的限制性酶切位点,从而将第三限制性酶切位点引入扩增的多核苷酸加尾DNA中。在一个实施方案中,对第二批进行以下步骤:(a)用在第二核酸内切酶限制性酶切位点切割的第二内切酶切割扩增的多核苷酸加尾cDNA;(b)用识别第三限制性酶切位点的第三内切酶切割扩增的多核苷酸加尾DNA;和(c)使所述DNA末端与测序接头和连接酶接触,从而产生包含所述测序接头的扩增多核苷酸加尾DNA;生成DNA文库。

在一个实施方案中,用于扩增基因组DNA的引物之一包含IIS型核酸内切酶的限制性酶切位点,从而将第三限制性酶切位点引入扩增的多核苷酸加尾DNA中。在一个实施方案中,对第二批进行以下步骤:(a)用在第二核酸内切酶限制性酶切位点切割的第二内切酶切割扩增的多核苷酸加尾cDNA;(b)用识别所述第三限制性酶切位点的IIS型内切酶的限制性内切酶切割所述扩增的多核苷酸加尾DNA,其中所述IIS型核酸内切酶产生粘性DNA末端;和(c)使粘性DNA末端与测序接头和连接酶接触,产生包含测序接头的扩增多核苷酸加尾DNA;生成DNA文库。

在一个方面,提供了一种从包含多核苷酸加尾DNA和cDNA的池中生成DNA和RNA文库的方法,其中基因组DNA连接到包含第一核酸内切酶限制性酶切位点的标签,并且cDNA连接到包含第二内切核酸内切酶限制性酶切位点的标签。包含多核苷酸加尾DNA和cDNA的池可分为两批。

在一个实施方案中,用于扩增cDNA的引物之一包含第三核酸内切酶的限制性酶切位点,从而将第三限制性酶切位点引入扩增的多核苷酸加尾cDNA中。在一个实施方案中,第一批进行以下步骤:(a)用识别第一限制性酶切位点的第一限制性酶切割扩增的多核苷酸加尾DNA;(b)用识别第三限制性酶切位点的第三内切酶切割扩增的多核苷酸加尾cDNA;和(c)使所述cDNA末端与测序接头和连接酶接触,产生包含所述测序接头的扩增多核苷酸加尾cDNA;生成RNA文库。

在一个实施方案中,用于扩增cDNA的引物之一包含IIS型核酸内切酶的限制性酶切位点,从而将第三限制性酶切位点引入扩增的多核苷酸加尾cDNA中。在一个实施方案中,第一批进行以下步骤:(a)用识别第一限制性酶切位点的第一限制性酶切割扩增的多核苷酸加尾DNA;(b)用识别所述第三限制性酶切位点的IIS型内切酶的限制性内切酶切割所述扩增的多核苷酸加尾cDNA,生成RNA文库,其中所述IIS型核酸内切酶产生粘性cDNA末端;和(c)使粘性cDNA末端与测序接头和连接酶接触,产生包含测序接头的扩增多核苷酸加尾cDNA;生成DNA文库。

在一个实施方案中,对第二批进行以下步骤:(a)用在第二个核酸内切酶限制性酶切位点切割的第二个内切酶切割扩增的多核苷酸加尾cDNA;和(b)使扩增的多核苷酸加尾DNA与负载有包含测序接头的核酸的第二转座酶接触,并启动酶切法片段化反应,从而产生包含测序接头的扩增的多核酸加尾DNA;生成DNA文库。

在一个方面,提供了一种使用点击化学从包含多核苷酸加尾DNA和cDNA的池中生成DNA和RNA文库的方法。如本文所使用的,点击化学是指通常用于生物偶联的一类生物相容性小分子反应,允许选择的底物与特定生物分子连接。

在一些实施方案中,该方法包括:

a、使所述一个或多个核与结合染色质相关蛋白或染色质修饰的抗体接触;和第一转座酶;

其中所述第一转座酶装载有包含第一标签的核酸,其中所述第一标签包含选自第一组标签序列的第一标签序列;

b、启动酶切法片段化反应,产生包含第一标签的基因组DNA片段;

c、使用包含第二标签的引物反转录所述一个或多个核中的RNA,其中所述第二标签包含所述第一标签的标签序列,从而产生包含所述第二标签的cDNA;

其中所述第一标签还包括(i)适于进行点击化学的第一活性基团或(ii)第一亲和标签和/或其中所述第二标签还包括:(i)适合于进行点击化学的第二活性基团或(iii)第二亲和标签;

d、使所述一个或多个核与连接酶和包含选自第二组标签序列的第二标签序列的第三标签接触,从而产生包含第一标签和第三标签的基因组DNA片段以及包含第二标签和第三标签的cDNA;

e、裂解所述一个或多个核;

f、(I)使基因组DNA片段与固定化试剂接触

(i)与第一活性基团反应;或

(ii)与所述第一亲和标签结合;和

执行基因组DNA拉下实验以将基因组DNA与cDNA分离;

和/或

(II)使所述cDNA与固定化试剂接触

(i)与第二活性基团反应;或

(ii)与所述第二亲和标签结合;并进行cDNA拉下实验以将基因组cDNA与DNA分离;

g、对于DNA文库:将基因组DNA与包含测序接头的随机引物接触,产生多核苷酸加尾DNA;并扩增所述多核苷酸加尾DNA;

h、对于RNA文库:将固定化的cDNA与包含测序接头的随机引物接触,产生多核苷酸加尾cDNA;并扩增所述多核苷酸加尾cDNA;

i、对RNA文库和DNA文库中的分子进行测序;

j、使所述一个或多个核中的每一个的RNA文库和DNA文库相关联。

在一个实施方案中,只有DNA用适合进行点击化学的活性基团或(ii)亲和标签标记。在一个实施方案中,仅cDNA用适于进行点击化学的活性基团或(ii)亲和标签标记。在一些实施方案中,DNA和cDNA都用(i)适于进行点击化学的活性基团或(ii)亲和标签标记,其中DNA和cDNA没有用适于进行点击化学的相同活性基团或亲和标签标记。

在一些实施方案中,用亲和标签标记DNA,用适合进行点击化学的活性基团标签cDNA。在一些实施方案中,用亲和标签标记cDNA,用适于进行点击化学的活性基团标记DNA。在一些实施方案中,用生物素标记DNA或cDNA,并且结合生物素的固定化试剂是链霉亲和素。在一些实施方案中,用叠氮化物标记DNA或cDNA,并且与叠氮化物反应的固定化试剂是DBCO。

可以使用生物素/链霉亲和素以外的配对亲和标签/固定化结合剂。可以使用叠氮化物/DBCO以外的点击化学对。

本领域技术人员可识别上述方法的变体。例如,在一些实施方案中,例如使用生物素或叠氮化物Tn5接头标记DNA分子。标记的DNA拉下实验之后可以进行文库制备和测序。上清液中剩余的cDNA分子同样可用于文库制备和测序。

在一些实施方案中,例如使用生物素或叠氮化物标记的反转录引物标记cDNA分子。标记的cDNA拉下实验之后可以进行文库制备和测序。上清液中残留的DNA分子同样可用于文库制备和测序。

图4示出了分离DNA和RNA文库的方法的非限制性示例。

高通量方法

在某些实施方案中,所公开的方法允许以高通量方式进行样品处理。例如,可以并行分析2、3、4、5、6、7、8、9、10、50、100、200、500、750、1000或更多染色质相关蛋白和/或染色质修饰。在一个实施方案中,可使用例如96孔板一次处理多达96个样品。在其他实施方案中,可以使用例如6孔板、12孔板、32孔板、384孔板或1536孔板处理更少或更多的样品。在一些实施方案中,所提供的方法可以在管中进行,例如普通的0.5ml、1.5ml或2.0ml大小的管。这些管可以排列在管架、浮子或其他保持装置中。

本发明的方法可用于联合分析单个细胞或细胞群中基因表达和基因表达的调节。在优选的实施方案中,所述方法用于联合分析基因表达的调节和单个细胞水平上的基因表达。

应用

本文公开的方法可用于分析不同细胞类型的表观基因组,这对于描绘发育期间和病理条件下不同细胞谱系中的基因调控程序至关重要。此外,通过同时评估来自相同细胞的转录谱和染色质状态,本文公开的方法提供了对基因调节机制的更好理解。例如,本文公开的方法可用于识别不同细胞类型中受不同表观遗传调控机制影响的不同基因组,并提供对不同组织中基因调控过程的见解。本文公开的方法也可用于组蛋白修饰的全基因组谱分析,其不仅可揭示转录调控元件的位置和活性状态,还可揭示发育和疾病病理过程中涉及细胞类型特异性基因表达的调控机制。

通过基因表达和基因表达调控的联合分析,本文公开的方法可用于提供“基因调控/基因表达谱”,该表达谱提供关于目标核酸与染色质相关蛋白和/或某些组蛋白/DNA修饰以及相关基因表达谱的相互作用的信息。基因调节/基因表达谱特别适合于诊断和/或监测疾病状态,例如生物体(例如植物或动物受试者(例如哺乳动物受试者、例如人类受试者))中的疾病状态。某些疾病状态可在体内引起和/或表征蛋白质和/或核酸与染色质DNA的差异结合。例如,某些相互作用可能发生在患病细胞中,但不发生在正常细胞中。在其他例子中,某些相互作用可能发生在正常细胞中,但不发生在患病细胞中。因此,本发明提供了将基因调节/基因表达谱与疾病状态(例如癌症)或感染(例如病毒或细菌感染)相关联的方法。应理解,与疾病状态的相关性可用于任何生物体,包括但不限于植物和动物,如人类。由于具有类似的“指纹”,与疾病相关的基因调控/基因表达谱可以用作“指纹”来识别和/或诊断细胞中的疾病,例如识别特定蛋白质和/或核酸作为潜在的诊断和/或治疗靶标。此外,基因调节/基因表达谱可用于监测疾病状态(例如监测对治疗的反应、疾病进展)和/或为受试者做出治疗决定。

获得基因调节/基因表达谱的能力允许诊断疾病状态,例如通过将样本中存在的基因调节/表达谱与与特定疾病状态相关的基因表达谱进行比较,其中表达谱的相似性指示特定疾病状态。因此,本文提供了基于与疾病状态(例如癌症)或感染(例如病毒或细菌感染)相关的基因调节/基因表达谱来诊断疾病状态的方法。应理解,可以对任何生物体(包括但不限于植物和动物,如人类)进行疾病状态诊断。

本文还提供了将环境应激或状态与基因调节/基因表达谱相关联的方法,例如,整个生物体或样品,例如细胞样品,例如,细胞培养物,可以暴露于环境应激,例如但不限于热休克、渗透压、缺氧、寒冷、氧化应激、辐射、饥饿、化学物质(例如治疗剂或潜在治疗剂)等。在施加应激之后,可以对代表性样品进行分析,例如在不同的时间点进行分析,并与对照(例如来自生物体或细胞的样品,例如来自有机体的细胞,或标准值)进行比较。

本文还提供了用于筛选调节相互作用谱的试剂库的方法,例如,将基因调节/基因表达谱从异常(例如与疾病状态相关)改变为指示无疾病状态的试剂。例如使用高通量方法,通过将细胞、组织或甚至整个动物暴露于化学库的不同成员,并执行本文所述的方法,可以在相对短的时间内,同时筛选化学库中的不同成员对相互作用谱的影响。

应当理解,本发明不限于所描述的特定方法或方案,因为这些方法或方案可能有所不同。与本文描述的方法和材料类似或等效的任何方法和材料都可以用于本发明实施方案的实践或测试。还应当理解,本说明书中的本发明的公开包括这些特定特征的所有可能的组合。例如,在本发明的特定方面或实施方案或特定权利要求的上下文中公开特定特征的情况下,该特征也可以在可能的程度上与本发明的其他特定方面和实施方案结合和/或在本发明中使用,并且通常是在本发明中公开。

所有引用的专利和申请通过引用全部并入本文。

为了更好地理解本发明,给出了以下具体实施方案的示例。不应理解为以下实例是用来限制或限定本发明的整个范围的。

实施例

实施例1

方法

细胞培养

HeLa S3(人,ATCC CCL-2.2)细胞按照标准程序在37℃和5%CO

生物样本的处理

雄性C57BL/6J小鼠在8周龄时从Jackson实验室购买,并在解剖前在Salk动物屏障(barrier)设施中进行12小时的黑暗光循环,随意进食4周。额叶皮层和海马被解剖并在干冰中快速冷冻。所有方案均由Salk研究所的机构动物护理和使用委员会(IACUC)批准。

通过用蛋白酶/RNA酶抑制剂混合物(DBI:0.25M蔗糖、25mM KCl、5mM MgCl

接头退火

为了制备DNA标记的板(第2和3轮标记),将6μL每个标记的寡核苷酸(100μM)分配到两个96孔板中。然后将44微升接头-R02或接头-R03(12.5μM,见表1)添加到两个板的每个孔中。将板密封并在热循环机中退火,程序如下:95℃5min,以-0.1℃/s的斜率缓慢冷却至20℃(原料板)。然后将储备溶液板分成新的96孔板,每个孔的工作板包含10μL的标记的寡核苷酸,准备进行连接反应。

为了制备标记的RT引物(RNA标签序列R01),将12.5μL RNA_RE(#01至#12,见表3)移入12个管(最终100μM)中,并与12.5μL RNA_NRE(#01到#12,与RNA_RE匹配,见表3,最终100μM)和75μL H

为了制备用于DNA文库第二次接头标记的P5接头混合物,将P5 FokI与P5c NNDC-FokI混合,将P5H-FokI和P5Hc NNDC-FokI混合(两者的最终浓度为50μM,见表1)。然后在热循环器中按照以下程序对低聚混合物进行退火:95℃5min,以-0.1℃/s的斜率缓慢冷却至20℃。然后将退火的P5复合物和P5H复合物以1:3的比例在冰上混合,并在-20℃下储存。

表1配对标签引物序列。ddC=双脱氧胞嘧啶修饰;*=硫代磷酸酯键修饰。

转座子复合物的组装

为了制备标记的转座子,将标记的DNA接头寡核苷酸(DNA标签序列R01,DNA_#01_RE至DNA_#12_RE,见表2)与pMENT寡核苷酸(见表1)在12个试管中混合,最终浓度为50μM。然后在热循环器中按照以下程序对低聚混合物进行退火:95℃5min,以-0.1℃/s的斜率缓慢冷却至20℃。然后将1微升退火转座子与6μL空载蛋白A-Tn5(0.5mg/mL)混合,短暂涡旋并快速旋转。将混合物在室温下孵育30min,然后在4℃下再孵育10min。转座子复合物可在-20℃下储存长达6个月。

为了制备Tn5接头序列A,将25μL接头序列A(100μM)与25μLpMENT

(100μM)混合。将混合物在95℃下加热5min,然后以0.1℃/s的速度缓慢冷却至20℃。将1μL退火转座子DNA与6μL空载Tn5(0.5mg/mL)混合,短暂涡旋并快速旋转。将混合物在室温下孵育30min,然后在4℃下再孵育10min。将混合物用稀释缓冲液(10mM Tris-HCl pH7.5、100mM NaCl、50%乙二醇、1mM DTT)稀释10倍,并在-20℃下储存。

表2标签序列DNA接头寡核苷酸。NotI(GCGGCCGC)的识别位点有下划线。

/>

抗体染色和靶向酶切法片段化

为了用抗体孵育细胞核,将360万个渗透化的细胞核等分到12个最大回收管(每管30万个细胞核)中,以1000g离心10min,并重悬于50μL完全缓冲液(20mM HEPES pH 7.5、150mM NaCl、0.5mM亚精胺、1X蛋白酶抑制剂混合物0.5U/μL SUPERase IN(RNA酶抑制剂)、0.5U/μL RNA酶OUT(核糖核酸酶抑制剂)、0.01%IGEPAL-CA-630、0.01%Digitonin和2mMEDTA)。加入抗体(每管2μg),将混合物在4℃下旋转过夜。抗体:H3K4me1、H3K27ac、H3K27me3、H3K9me3。为了清洗未结合的抗体,将细胞核在600g、4℃下旋转10min,重悬于50μL完全缓冲液中,重复1-2次。再次在600g、4℃下旋转细胞核10min,并将其重悬于50μL 1号培养基缓冲液(20mM HEPES pH 7.5、300mM NaCl、0.5mM亚精胺、1X蛋白酶抑制剂混合物、0.5U/μL SUPERase IN、0.5U/μLRNA酶OUT、0.01%IGEPAL CA-630、0.01%洋地黄皂苷和2mMEDTA)中。然后加入标记的蛋白A-Tn5(#01-#12,每管1μL 0.5mg/mL),混合物在室温下旋转60min。每管接收装载有不同标记的蛋白A-Tn5(包括NotI的限制性酶切位点,#1轮标记,见表2)。然后将细胞核在300g、4℃下旋转10min,然后重悬于50μL缓冲液#2(20mM HEPES pH7.5、300mM NaCl、0.5mM亚精胺、1X蛋白酶抑制剂鸡尾酒、0.5U/μL SUPERase in、0.5U/μLRNA酶OUT、0.01%IGEPAL CA-630和0.01%Digitonin)中,再重复两次。

通过添加2μL 250mM MgCl

反转录

将核颗粒重悬于12管20μL RT缓冲液中(1X缓冲液RT、0.5mM dNTP、0.5U/μLSUPERase IN、0.5U/μL RNA酶OUT、2.5μM标记的T15引物和2.5μM标记的N6引物(包含SbfI的限制性酶切位点,第1轮标记,见表3)和1U/μL Maxima Reverse H minus反转录酶)。反转录在热循环仪中进行,程序如下(步骤1:50℃10min;步骤2:8℃12s,15℃45s,20℃45s,30℃30s,42℃2min,50℃5min后,再执行第2步2次;步骤3:50℃10min并保持在12℃)。反应后,将细胞核转移并合并到1.5mL最大回收管(冰上)中,用PBS中的5%BSA预洗,并在冰上冷却2min,4.8μL 5%Triton-X100。然后在1000g、4℃下旋转细胞核10min,然后立即进行基于连接的组合标记。

表3标记的T15引物和标记的N6引物。SbfI(CCTGCGG)的识别位点带有下划线。

/>

基于连接的组合标记

将核重悬并混合在1mL 1X NE缓冲液3.1中,然后转移至连接混合物(2262μL H

然后收集细胞核并在1000g、4℃或10℃下旋转10min。

然后在标签序列板R03中进行第二轮连接,类似于第一轮连接,不同之处在于连接反应30min后,加入终止溶液(264μL 100μM R04终止寡聚物(见表1)、250μL 0.5M EDTA和236μL超纯H

将所有细胞核合并在15mL管中(用0.5%BSA预洗),并在1000g、10℃下旋转10min。丢弃上清液。用冷PBS洗涤细胞核一次,并在1000g、10℃下旋转10min,然后重悬于200μL-1mL冷PBS(最佳浓度1000细胞/μL)中。样本准备好进行裂解和DNA提纯。

核裂解

通常,在进行基于连接的标记后,可回收100000至300000个核。然后将核重悬于PBS中,计数并等分到含有2千至5千个核或2千至4千个核的子库中(最佳每管约2500核)。游离核可在-80℃下储存长达6个月。

用PBS将子库稀释至35μL。然后加入5μL 4M NaCl、5μL 10%SDS和5μL 10mg/mL蛋白酶K,并在850r.p.m.、55℃下裂解细胞核2小时或在ThermoMixer中过夜。将裂解溶液冷却至室温,然后用1X顺磁性SPRI珠纯化,并在12.5μLH

TdT加尾和标记的DNA/cDNA预扩增

cDNA的多核苷酸加尾和末端脱氧核苷酸转移酶(TdT)使得在其3′端添加一个同聚序列,然后可以用作扩增的锚。将1.5μL 10X TdT缓冲液、0.5μL1mM dCTP加入12.5μL纯化DNA/cDNA混合物中,在95℃下变性5min,然后在冰上快速冷冻5min。加入1μLTdT,在37℃下孵育30min,随后在75℃下热失活20min。加入Anchor Mix(6μL 5X KAPA缓冲液、0.6μL 10mMdNTP、0.6μM 10μMAnchor FokI GSH Oligo(见表1)和0.6μLKAPA高保真热启动聚合酶,并在热循环仪中按以下程序进行线性扩增(步骤1:95或98℃3min;步骤2:95或98℃15s,47℃60s,68℃2min,47℃60s,68℃2min,重复步骤215次;步骤3:72℃10min并保持在12℃)。

然后加入预扩增混合物(4μL 5X KAPA缓冲液、0.5μL 10mM dNTP、2μL10μM引物PA-F和PA-R(见表1)、0.5μL KAPA高保真热启动聚合酶,并在热循环器中使用以下程序进行预扩增(步骤1:98℃3min;步骤2:98℃20s,65℃20s,72℃2.5min,重复步骤2额外9-10次;步骤3:72℃2min并保持在12℃)。用顺磁性SPRI珠双尺寸筛选(10μL+37.5μL,0.2X+0.75X)纯化扩增产物,并在35μL H

核酸内切酶消化和第二接头的标记

在酶切法片段化和RT期间,将SbfI限制性酶切位点引入RNA文库,将NotI限制性酶切位点引入DNA文库。DNA文库通过用SbfI消化RNA文库而产生。RNA文库是通过用NotI消化DNA文库而产生的。

17μL纯化的扩增产物分别转移到两个试管中,用于DNA和RNA文库构建。向DNA管中加入2.5μL 10X Cutsmart缓冲液、1μL SbfI HF和1μL FokI以及3.5μLH

对于DNA部分,添加2μL 10X T4 DNA连接酶缓冲液、2μL P5接头混合物、4μL H

对于RNA部分,添加10.5μL 2X TB和0.5μL 0.05mg/mLTn5接头A,并在ThermoMixer中在550r.p.m.、37℃下进行酶切法片段化反应30min,然后使用QIAquick PCR纯化试剂盒进行清理,并在30μL 0.1X洗脱缓冲液中进行洗脱。

索引(indexing)PCR和测序

通过混合30μL纯化的P5标签产物、10μL 5X Q5缓冲液、1μL 10mM dNTP、0.5μL 50μM P5通用DNA引物或N5 RNA引物、2.5μL 10μM P7引物(见表1)、5μLH

所用DNA文库的PCR程序为:步骤1:98℃x 3min;步骤2:98℃x10s,63℃×30s,72℃×1min;步骤2重复8个循环;第3步:72℃×1min;步骤4:保持在12℃。

所用RNA文库的PCR程序为:步骤1:72℃5min,98℃30s;步骤2:98℃10s,63℃30s,72℃1min并重复步骤2额外8-13次,以达到10nM浓度;步骤3:72℃1min;步骤4:保持在12℃。

使用0.9X(45μL)SPRI珠进行文库清理。纯化的文库可在-20℃或-80℃下保存长达6个月。

测序

在商业测序平台上,包括例如NextSeq 550、NextSeq1000/2000、NovaSeq6000或HiSeq 2500/4000平台上,使用标准Illumina测序引物对最终文库进行多重化(multiplexed)和测序。根据制造商的说明,以推荐的浓度加载文库。Read1和Read2分别建议至少50个和100个测序循环。例如:在NextSeq500平台上使用PE 50(或53)+7+100个循环(Read1+Index 1+Read2),使用150个循环测序试剂盒,或在NovaSeq 6000平台上使用PE100+7+100循环,使用200个循环测序试剂盒。

数据分析程序

配对标签数据的预处理

初始配对标签数据处理包括(a)从Read2中提取标签序列,(b)将标签序列组合分配给细胞标签序列参考(将标签序列序列分配给12个样本管和2轮96孔的ID),(c)将所分配的读取片段比对到参考基因组,以及(d)生成细胞到特征矩阵以用于下游分析。

初始配对标签数据处理期间的以下指标可用于质量控制。对于步骤2(a),通常>85%和>75%的DNA和RNA读取片段将具有完全连接的标签序列。对于步骤2(b),>85%的DNA和RNA读取片段可以唯一地分配给一个细胞标签序列,不超过1个错配。对于步骤2(c),通常>85%的指定读取序列可以比对到参考基因组;根据靶向的组蛋白标签,60%至>95%的指定DNA读取片段可以比对到参考基因组。

通过Read2读取细胞标签序列和接头序列。BC#1、BC#2和BC#3的第一个碱基应位于Read2的第84-87、47-50和10-13个碱基内。通过匹配与细胞标签序列相邻的接头序列来识别标签序列的位置。,通过将读取序列(Read1的读取序列和UMI[Read2序列的前10个bp])和质量值连接到第1行,并将第三轮标签序列以及质量值连接到第2行和第4行,将每个库的Read1和Read2配对,以产生一个单独的新FASTQ文件。使用所有可能的细胞标签序列组合(96*96*12)生成bowtie参考索引。组合的FASTQ文件包含标签序列,然后使用bowtie(Langmead&Salzberg,Nat Methods 9,357-359)将其比对到细胞标签序列参考,参数为-v1-m 1--norc(读取时有1个以上的标签序列不匹配,并且可以分配给1个以上细胞)。然后,通过将(SAM文件的)RNAME添加到第1行,并将原始Read1序列和质量值从(SAM文件)QNAME提取到最终FASTQ文件的第2行和第4行,将生成的SAM文件转换为最终FASTQ文件。从3'的DNA和RNA文库中去除NextEra接头序列,Poly-dT序列进一步从3'RNA文库中去除,低质量读取片段(L=30,Q=30)被排除在外以供进一步分析。

配对标签数据分析

冲突率(collision rate)评估:基于细胞标签序列(BC#1=06或12)提取种类混合试验的读取片段,并使用STAR版本2.6.0a(Dobin&Gingeras,Curr ProtocBioinformations 51,111411-19)与组合参考基因组(人类的GRCh37和小鼠的GRCm38)比对到参考基因组。根据比对位置、细胞标签序列、PCR索引和UMI去除重复。为了评估冲突率,将比对到一个种类的UMI小于80%的细胞核分类为混合细胞。

读取片段比对:清洁的读取片段首先被比对到小鼠GRCm38基因组参考基因组,RNA为STAR(版本:2.6.0a),DNA为bowtie2。H3K4me1、H3K27ac和H3K27me3的比对DNA读取片段通过比对质量进一步过滤(MAPK>10)。根据比对位置、细胞标签序列、PCR索引和UMI去除重复。BC#1用于鉴定样品来源。从进一步分析中去除低覆盖率细胞核(<1000个转录物和<500个独特DNA读取片段)。在生成细胞计数矩阵之前,无论细胞标签序列、PCR索引和UMI如何,通过去除高堆积(high-pileup)位置(截止值=10)来进一步过滤DNAbam文件。

配对标签谱的聚类:RNA比对文件被转换成以细胞为列、基因为行的矩阵。DNA比对文件被转换成矩阵,其中细胞作为列。去除DNA和RNA矩阵中少于200个特征的细胞。通过去除5%最高覆盖箱(bin)进一步过滤DNA矩阵。使用Seurat包(Stuart et al.Cell 1771888-1902,e1821(2019))进行基于RNA谱的单细胞聚类。简言之,通过PCA对细胞到基因计数进行标准化,并选择可变基因进行降维,用harmony进行校正批次效应(Korsunsky等人,NatMethods 161289-1296),用UMAP可视化并用Louvain算法聚类。具有来自多种主要细胞类型的标签基因高表达水平的细胞组被认为是双重的,并被排除在进一步分析之外。使用Seurat包进行配对标签RNA谱和已发表的scRNA-seq数据集(Zeisel等人Cell 174999-1014,e1022)的共嵌入(co-embed)。为了比较不同研究的聚类结果,根据来自配对标签数据集(A)、来自Zeisel Cell,2018

为了可视化单细胞DNA图谱,通过snapATAC(Fang等人,bioRxiv,615179(2019))将细胞对窗口(cell-to-bin)(5kbp的窗口大小)矩阵转换为细胞对细胞(cell-to-cell)相似性Jaccard矩阵,然后通过PCA进行降维、用harmony进行批次效应校正和UMAP可视化。为了比较基于RNA和DNA的分析的聚类结果,根据具有来自RNA聚类(R)和DNA聚类(D)的标签的细胞数量计算Jaccard重叠系数(J):

启动子和CRE模块的分类

为了根据启动子的表观遗传状态对基因进行分类,基于基于转录组的聚类,从聚集的分析总结了启动子的基因表达(RPKM)和读取片段密度(CPM)。在至少一个聚类中,RPKM>1的表达基因和CPM>1的启动子基因被保留用于分析。首先根据4个组蛋白标签(K=4)的读取片段密度通过K-means聚类对基因进行分组。然后根据基因表达对每组进行二次K-means聚类,得到7个启动子组。

为了将CRE分为不同的组,首先,cCRE列表来自CEMBA(Li等人,bioRxiv,2020.2005.2010.087585(2020)),并扩展了1000bp(双向500bp)。排除了cCRE与启动子区的重叠(TSS的-1500bp至+500bp),以便进一步分析。然后,根据基于转录组的聚类,从聚集分布中总结出四个组蛋白标签的CRE读取片段密度。保留至少一个聚类或一个组蛋白图谱中CPM>1的cCRE进行分析。启动子首先根据4个组蛋白标签(K=4)的读取片段密度通过K-means聚类进行分组。然后根据H3K27ac读取片段密度对各组进行二次K-means聚类,得到8个CRE组。

基序富集和基因本体分析

每种细胞类型的基序富集:使用ChromVAR(Schep等人,Nat Methods14975-978(2017))对每种细胞进行基序富集和组蛋白修饰。简言之,比对的读取片段被转换为四个组蛋白谱的细胞到窗口矩阵,窗口大小为1000bp。通过基于转录组的聚类,从相同组的所有细胞中总结每个窗口的读取片段。计算GC偏好性和背景峰,然后使用ChromVAR的computeDeviations函数计算每种细胞类型的基序富集分数。

每个CRE模块的基序富集:使用Homer(v4.11,Heinz等人,Mol Cell38576-589(2010))分析每个CRE组件的基序富集。对元件中心周围+/-200bp的区域进行从头和已知基序富集分析。总峰列表被用作各组cCRE的基序富集分析的背景。

基因本体富集:使用Homer(v4.11)使用默认参数执行基因本体注释。使用基因集文库“生物学过程”。列表中总基因超过500个的GO条目被排除在“靠前富集GO条目”之外。

将CRE与假定靶基因连接

为了预测活性和抑制性cCRE的假定靶基因,首先用cicero(Pliner等人,Mol Cell71858-871,e858,(2018))使用默认参数通过计算启动子区(-1500bp至+500bp)与cCRE之间的H3K4me1读取片段的共占(co-occupancy)率来识别候选CRE基因对。共可及性(co-accessibility)>0.1的cCRE基因对用于进一步分析。

为了鉴定功能性cCRE基因对,然后计算H3K27ac(对于活性对)或H3K27me3(对于抑制对)之间的斯皮尔曼相关系数,cCRE(CPM)的读取片段密度和基于转录组聚类的聚类中相应连接基因(RPKM)的基因表达。为了估计背景噪声水平,对每个读取片段的细胞ID进行随机排序(shuffled),并计算相应的斯皮尔曼相关系数。假阳性检测率是基于在不同截止条件下从随机排序组中检测到的对的比例来估计的。最后,FDR<0.05的截止值用于识别活性和抑制性cCRE基因对。

外部数据集

CEMBA数据集可从NEMO(https://nemoanalytics.org)获得登录号为RRID SCR_016152。

ENCODE(https://www.encodeproject.org/)下载的数据集的登录号为:H3K4me1(ENCSR000APW)、H3K27ac(ENCSR000 AOC)、H3K27me3(ENCSR1000DTY)、H3K9me3(ENCSR00AQO)、DNase seq(ENCSR959ZXU)。

其他外部数据集从NCBI基因表达综合数据库(GEO)下载(http://www.ncbi.nlm.nih.gov/geo/),登录号为:SPLiT seq(GSE110823)、CoBATCH(GSE129335)、itChIP(GSE109762)和HT scChIP seq(GSE117309)。

10X scRNA-seq数据集从10X基因组学网站(https://www.10xgenomics.com/)下载.

结果

本文公开了一种称为配对标签(通过测序对单个细胞的RNA表达和来自靶向酶切法片段化的DNA进行平行分析)的方法。首先,用靶向特定组蛋白修饰的抗体孵育透化的细胞核。然后,将细胞核与蛋白A融合的Tn5孵育,Tn5装载有包括标签序列和NotI限制性酶切位点的接头。蛋白A允许Tn5靶向目标染色质位点(图1)。反应在12个不同的孔中进行,每个孔都有一个孔特异性的DNA标签序列,包括在转座酶接头和RT引物中,以标记不同的样品或复制品(第一轮标记)。启动酶切法片段化,产生包含第一个标签序列和NotI限制性酶切位点的DNA片段。然后,使用包含相同标签序列和SbfI限制性酶切位点的引物进行反转录(RT),得到包含与位于相同细胞内的DNA片段以及SbfI位点相同标签序列的cDNA分子。在这一点上,核酸仍然是完整的,并且包含分别标记有12个标签序列之一的DNA和cDNA。

接下来,通过在96孔板中将孔特异性DNA标签序列依次连接到染色质DNA片段和RTcDNA的5'端,使用基于连接的组合标记策略将第二轮和第三轮DNA标签序列引入细胞核。首先,将来自第1轮的12个样本合并并添加到包含96个不同标签序列(第二轮的标签序列)的96孔板中。将样品合并并添加到包含96个不同标签序列(第三轮的标签序列)的第二个96孔板中。最后,将标记的细胞核分为子库并裂解,纯化染色质DNA和cDNA。

使用“扩增和拆分”策略制备DNA和RNA文库进行测序(见图1和图2)。分离的DNA和cDNA用末端脱氧核苷酸转移酶(TdT)进行多核苷酸加尾,使其3′端添加一个同聚序列,然后用作扩增模板。用于扩增多核苷酸加尾DNA的引物包含FokI的限制性酶切位点。

为了获得RNA文库,用NotI消化DNA和cDNA池。使用与第二测序接头结合的Tn5转座酶来添加第二测序接头。

来自靶向酶切法片段化的DNA的片段大小比来自RT的cDNA的片段大小短,如果使用Tn5标签来添加第二个接头,这将导致较低的文库产量。因此,为了获得DNA文库,用FokI和SbfI消化DNA和cDNA池。FokI是一种IIS型核酸内切酶,产生了一个缺口,然后通过连接引入第二个测序接头。

为了衡量配对标签的效率,将约10000个HeLa细胞分别与H3K4me1、H3K27ac、H3K27me3和H3K9me3的抗体接触。将每种组蛋白修饰的聚集谱与该细胞系的已发表的ChIP-seq数据集进行比较(Thurman等人,Nature 489,75-82(2012))。配对标签实验的富集区与已发表的ChIP-seq数据集中所有四个组蛋白标签的富集区非常重合(H3K4me1为65.9%,H3K27ac为65.7%,H3K27me3为59.6%,H3K9me3为64.0%)。每个组蛋白标签的全基因组分布也与公布的数据集有很好的相关性(不同组蛋白标签之间的皮尔逊相关系数为0.70-0.86)。从配对标签测量的基因表达水平与来自同一细胞系的内部生成的细胞核RNA seq高度相关(皮尔逊相关系数0.96)。这些数据证实,配对标签可以提供与来自体细胞样本的ChIP-seq和RNA-seq类似的染色质和转录组信息。

通过配对标签对小鼠皮层和海马中的组蛋白标签和转录组进行单细胞共分析

为了证明配对标签在异质组织分析中的效用,将该方法应用于从成年小鼠新鲜采集的额叶皮层和海马组织,重点关注上述四个组蛋白标签。平行生成的共同的的单细胞配对标签DNA谱和普通谱(bulkprofile)对于不同的组蛋白标签显示出极好的一致性(皮尔逊相关系数0.72-0.96)。配对标签生成的数据集具有较高的比对率:>95%的H3K4me1和H3K27ac读取片段、约72%的H3K27me3读取片段、以及>85%的H3K9me3和RNA读取片段可以比对到参考基因组。为了估计配对标签数据集的库复杂性,将一部分代表性细胞核测序直至接近饱和(约80%的PCR重复率)。根据人类/小鼠混合样本的估计,由于随机标签序列冲突产生的配对标签配置文件小于5%。对于DNA图谱,每个核可回收多达20000个独特位点(对于额叶皮层和海马,每个核的中位数分别为H3K4me1:19332和17357,H3K27ac:4460和4543,H3K27me3:2565和2499,H3K9me3:16404和18497),对于RNA图谱,每个细胞核可回收多达15000个UMI(额叶皮层和海马的中位数分别为14295和8185个UMI,分别对应2400和1855个基因配对标签的策略降低了在测量多种分子类型的过程中丢失材料的风险,并提供了具有可比文库复杂性的DNA和RNA数据集,作为独立的高通量scChIP-seq和scRNA-seq分析。

成年小鼠皮层和海马细胞类型的表观基因组图

接下来,共对约65000个细胞核进行了中等深度测序(重复率:约40-60%)。在过滤出具有低序列覆盖率或由于潜在的二联体(参见上述方法)的核之后,对于不同的组蛋白标签或大脑区域,每个核有941-7477个独特的DNA位点(中位数,H3K4me1:6073和5799,H3K27ac:442和1949,H3K27me3:941和942,H3K9me3:6765和7477,分别用于额叶皮层和海马),以及每个核5698和4039个RNAUMI(每个核平均1290和992个基因)。使用Seurat软件包,根据其转录组分布,将这些细胞核分为22个细胞组。首先通过主成分分析(PCA)选择可变基因进行降维,然后是统一流形逼近和投影(UMAP)和基于图的Louvain聚类。基于标签基因表达,将22个细胞组分为7种皮质神经元类型(Snap25+、Satb2+、Gad1-)、4种海马神经元类型(Snap25+、Slc17a7+或Prox1+)、3种抑制性神经元类型(Gad1/Gad2+)和8种非神经元细胞类型(Snap25-),内皮细胞和脉络丛:所有簇的每个生物复制的相同部分。还将配对标签转录组谱与先前发表的来自相同大脑区域的scRNA-seq数据集(参考数据集,Zeisel等人Cell174999-1014,e1022(2018))进行了比较并且发现了极好的一致性。具体地,22个聚类中的16个可以从参考数据集中唯一地分配给对应的聚类(或几个密切相关的子聚类)。这里的一些子聚类与参考数据集的多个子聚类匹配,其中包括:我们数据集中的CA1和亚基聚类分为两个CA1神经元组(TEGLU21,23),2个OGC细胞聚类与少突胶质细胞组(MFOL,MOL)匹配,2个ASC细胞聚类与参考集的两个星形胶质细胞组比对(ACNT1,2)。

使用SnapATAC包,基于不同组蛋白标签的DNA谱,对配对标签谱进行聚类(Fang等人,bioRxiv,615179(2019))。将细胞对窗口DNA矩阵转换为细胞对细胞Jaccard相似矩阵,然后使用PCA和基于图的聚类进行降维。对于基于H3K4me1和H3K27ac的聚类,分别显示了18个和16个聚类。15组基于H3K4me1的聚类和14组基于H3K27ac的聚类与来自RNA的聚类匹配良好。基于H3K4me1和H3K27ac的聚类中的两个皮质神经元簇(L4和L5)与基于RNA的聚类的L4、L5a和L5组相匹配;基于H3K4me1的聚类中的Subiculum组分为基于RNA的聚类的CA1、Subiculm和CA2/3组。对于基于H3K27me3的聚类,所有皮层兴奋性神经元形成了一个与所有其他细胞组不同的单个聚类。对于H3K9me3,只有主要的非神经元细胞类型可以被分离,而所有的神经元细胞类型被分组为单个聚类。这些结果表明,基于配对测序谱的细胞聚类取决于所使用的组蛋白标签,而抑制性组蛋白标签不能分辨细胞类型以及活性组蛋白标签。

基于不同组蛋白标签的细胞聚类的不一致性单独表明,使用转录组谱构建细胞类型特异性表观基因组图很重要。根据配对标签数据集的转录组信息,在22种小鼠脑细胞类型中的每一种中生成了基因表达谱和组蛋白修饰的全基因组图谱。

不同脑细胞类型的基因启动子处染色质状态和基因表达的综合分析

为了研究染色质状态与细胞类型特异性基因表达之间的关系,聚合了脑细胞类型中基因启动子区域(-1500bp至+500bp)的每个组蛋白修饰的配对标签信号。对于该分析,主要检查了所有五种模式的18个细胞组,这些细胞组具有至少50个细胞和至少50000个组合的独特读取片段。总共保留了17398个具有足够转录水平(RPKM>1)或启动子占有率(至少一个细胞组中组蛋白标签的CPM>1)的基因(GENCODE GRCm38.p6)用于后续分析。使用K-means聚类,将这些基因启动子分为具有组蛋白修饰的不同组合的七组:I类启动子似乎被H3K9me3抑制(占所有测试基因的13.1%),II-a和II-b类启动子与多梳抑制组蛋白标签H3K27me3相关(占所有被测试基因的9.2%),其余四组与活性组蛋白标签H3K4me1和H3K27ac的可变水平相关(占所有测试基因的77.6%)。I类和II类基因的表达水平与抑制性组蛋白标签H3K9Kme3或H3K27me3负相关,而III类基因表达水平与启动子区域的活性组蛋白标签H4K4me1和H3K27ac正相关。

进行了基因本体(GO)分析,发现了各组基因的不同功能类别。例如,I类中的基因在感觉相关通路方面高度富集,包括嗅觉受体(OR)基因(Olfr,检测到730个中的647个)和犁鼻(Vmnr,检测到201个中的189个)受体基因。在嗅觉感觉神经元的OR选择过程中,OR基因先前被显示以组成性异染色质标记以高度动态模式为特征。数据表明,异染色质也使额叶皮层和海马中的OR基因沉默。H3K27me3被抑制的基因可进一步分为两组:II-a类基因在所有细胞簇中被抑制,II-b类基因以更受限制的方式被抑制。GO分析显示,II-a组基因在涉及一般发育过程(如模式指定过程和胚胎器官发育)的条目中富集,而II-b组基因在包括上皮形态发生的条目中富集。II-b中的基因包括那些在神经胶质细胞分化中具有功能的基因,如Sox10和Notch1。III-a组的基因以所有细胞类型中启动子处的活性染色质状态为特征(占III类基因的10.4%),而III-b组的基因在所有神经元细胞类型中表达(占III级基因的5.9%),III-c组的基因在神经胶质表达(占III型基因的31.0%)。III-d组基因(52.6%的III类基因)以细胞类型特异性方式以活性染色质状态为特征,具有相应的细胞类型特异表达模式。这些基因在GO条目中富集了更具体的细胞过程:例如,海马神经元表达的基因富集了学习或记忆,小胶质细胞表达的基因则富集了炎症反应。这些结果证明了H3K27me3在发育过程中定义主要类型的关键作用,以及H3K27ac对小鼠大脑中不同亚细胞类型的不同表达模式的贡献。

跨脑细胞类型远端元件染色质状态的综合分析

顺式调节元件(CRE)以高度的细胞类型特异性染色质状态为特征,并与细胞类型特异基因表达密切相关。最近,对成年小鼠大脑染色质可及性的综合分析确定了491818个候选CRE(cCRE)(Li等人,bioRxiv,2020.2005.2010.087585(2020))。发现来自该列表的286168(58.2%)个远端CRE在至少一个细胞组和一个或多个组蛋白标签中显示出足够水平的配对标签信号(CPM>1,距离转录起始位点TSS上游超过1500bp,下游超过500bp)。为了表征这些候选CRE在不同脑细胞类型中的染色质状态,对上述18个细胞聚类中的每个细胞聚类中不同组蛋白标签的聚合配对标签信号进行K-means聚类。这些候选CRE分为8组:两个在所有细胞聚类(eI-a类,占所有CRE的16.3%)中或选择性地在神经元细胞(eI-b类,占全部CRE的4.9%)中以H3K9me3为特征,两个(eII-a,5.5%和eII-b,占所有CRE的3.1%)主要在所有神经元细胞聚类中或以更有限的方式(eII-b元件)以H3K27me3为特征。其余四个组(eIII-a至eIII-d类)通过不同细胞聚类中可变水平的H3K4me1和H3K27ac修饰为特征。与启动子组类似,在一个或几个细胞组中以H3K27ac为特征的cCRE亚类包含最大的部分(eIII-d类,占所有CRE的37.1%)。具有不同组蛋白修饰的cCRE在基因组中的分布不同。例如,以H3K9me3为特征的cCRE优先位于基因间区域(eI-a和eI-b),而H3K4me1和H3K27ac水平相对不变的cCREs倾向于位于基因区域(eIII-a)。CpG岛(CGI)区eII-b类cCRE显著富集(5.4%,p<2.2×10-16),eII-a类cCRE富集程度较低(2.0%,p=0.002)。两个以H3K9me3为特征的组的CGI区缺失(0.16%和0.12%,p<2.2×10-16)。对于活性cCRE组,eIII-a类cCRE显示出CGI区域的最高富集度(14.1%,p<2.2×10-16),而其他eIII-cCRE亚类则没有。

为了识别作用于上述cCRE类的潜在转录因子,使用JASPAR数据库进行基序富集分析(Khan等人,NucleicAcids Res 46,D260-D266(2018)。异染色质eI-a组富含EVX1基序,EVX1是胚胎发生过程中的转录抑制因子;eI-b类cCRE还富集了一种众所周知的抑制因子MAFG的基序,其在中枢神经系统中表达,这种调节因子的失调可导致神经元变性表型。这两个多梳抑制的cCRE组都富集了LHX基序,然而,基因组区域富集注释工具(GREAT)分析揭示了它们的不同GO条目:eII-a组强烈富集了一般细胞过程,如条目:RNA聚合酶II启动子的转录,而eII-b类cCRE对于包括感觉器官发育在内的发育过程富集。在所有聚类中具有动态H3K27ac的eIII-d组富含CTCF基序,支持增强子启动子环在调节多种细胞类型的基因表达中的作用。对已知TF基序的富集分析,随后进行K-means聚类,也揭示了不同的模块。eII-a组富含LHX、Nanog和Isl1等基序。eIII-b泛神经元组富含MEF2和NEUROD等神经源性因子。泛胶质细胞组(eIII-c)富含FOX、SOX和ETV家族转录因子识别的基序,后两者也富含eIII-d中的少突胶质细胞或小胶质细胞特异性组。eIII-d中的异染色质eI-a组和抑制性神经元组富含Ascl1基序。Ascl1可以作为靶向封闭染色质的先驱因子,激活神经源基因表达程序,并诱导GABA能神经元的产生。

不同脑细胞类型的染色质状态和转录组的联合图谱为推断每个细胞谱系的潜在调节因子提供了极好的机会。使用ChromVAR计算每个细胞组中识别的cCRE中的TF基序丰度,并将其与相应TF基因的表达水平进行比较。超过一半的TF(65%)显示出基因表达水平与细胞类型cCRE中相应基序富集之间的正相关,包括51个对H3K4me1和H3K27ac表现出显著一致性(FDR<0.1)的高置信度TF。例如,排名最高的TF之一Fli1局限在小胶质细胞和内皮细胞中。Fli1已知能激活趋化因子以介导内皮细胞的炎症反应,最近发现Fli1在与阿尔茨海默病相关的协调基因表达模块中。其他排名较高的TF包括Sox9/10、Mef2c和Neurod2等,已知它们在神经系统的发育中起着关键作用。

染色质状态和基因表达的综合分析将远端候选CRE连接到假定的靶基因

远端调节元件,包括增强子和沉默子,在发育过程中或响应刺激时控制细胞类型特异性转录程序。基于成像的工具和染色体构象捕获技术已被广泛用于阐明启动子和远端CRE之间的相互作用。来自同一细胞的表观遗传和转录状态提供了一个极好的机会,将活性和抑制性cCRE连接到其假定的靶基因。使用Cicero,基于所有细胞中cCRE和TSS近端区域(-1500bp至+500bp)之间H3K4me1读取片段的共占,确定了第一个假定的启动子CRE对。然后,计算假定靶基因的基因表达水平和细胞聚类中cCRE的组蛋白标记水平之间的配对斯皮尔曼相关系数(SCC)。

确定了32252对候选CRE基因对,其中远端cCRE的H3K27ac水平与基因表达呈正相关,15199对候选CRE基因,其中cCRE中的H3K27me3水平与连接基因的表达呈负相关(FDR<0.05)。活性和抑制性cCRE的发现为这些脑细胞类型的基因调节机制提供了更多的见解。显著比例的阳性cCRE基因对与阴性cCRE的基因对相同(观察到的p<2.2×10

接下来,基于预测的配对,将不同组的CRE与假定的靶基因连接。有趣的是,靶基因倾向于与CRE相似:例如,eII-a和eII-b类cCRE的靶基因在II-a和II-b类基因的启动子中强烈富集。这些基因在发育过程中的功能富集。然后,将cCRE的染色质状态与假定靶基因的启动子进行比较:cCRE和来自活性对的启动子在H3K27ac水平上表现出更高的一致性,但在抑制对上则没有;另一方面,H3K27me3水平的较高一致性仅在抑制对中观察到。这些结果支持了远端调控元件与其目标基因的启动子区域共享类似组蛋白修饰状态的假设。

然后,根据H3K27-甲基化和乙酰化状态,对具有关联基因的候选CRE进行分组。神经元特异性cCRE组的靶基因在包括突触传递的调节的GO条目中富集,与胶质细胞cCRE群相关的基因在包括胶质发生、上皮形态发生和神经元投射形态发生等条目中富集,只有一小部分显示H3K27me3的强聚类特异性富集和基因表达的一致缺失(M12-M14)。其中一种转录因子Sox11对胚胎和成年神经发生都至关重要,其基序在内皮细胞中显示出强烈的H3K27me3特征(M14)。SOX11在几种实体瘤中过表达,并显示在侵袭性套细胞淋巴瘤衍生的细胞系中促进内皮细胞增殖和血管生成。以H3K27me3为特征的CRE的抑制功能可能限制内皮细胞中Sox11靶的表达水平,以维持适当的细胞增殖。

实施例2

不先用结合染色质相关蛋白或染色质修饰的抗体孵育细胞核,然后用pA-Tn5孵育细胞核(图3A,顺序孵育方案),而是预孵育pA-Tn 5和抗体,然后将细胞核与Tn5/抗体复合物接触(图3A、预孵育方案。与序贯的技术相比,使用预孵育技术获得的数据质量没有损失(图3B-D)。

序列表

<110> 路德维希癌症研究所有限公司

<120> 通过测序平行分析单个细胞的RNA表达和靶向的酶切法片段化DNA

<130> 084276.00295

<150> 63/042,761

<151> 2020-06-23

<160> 53

<170> PatentIn version 3.5

<210> 1

<211> 142

<212> PRT

<213> 金黄色葡萄球菌

<400> 1

Ser Leu Lys Asp Asp Pro Ser Gln Ser Ala Asn Leu Leu Ser Glu Ala

1 5 1015

Lys Lys Leu Asn Glu Ser Gln Ala Pro Lys Ala Asp Asn Lys Phe Asn

202530

Lys Glu Gln Gln Asn Ala Phe Tyr Glu Ile Leu His Leu Pro Asn Leu

354045

Asn Glu Glu Gln Arg Asn Gly Phe Ile Gln Ser Leu Lys Asp Asp Pro

505560

Ser Gln Ser Ala Asn Leu Leu Ala Glu Ala Lys Lys Leu Asn Asp Ala

65707580

Gln Ala Pro Lys Ala Asp Asn Lys Phe Asn Lys Glu Gln Gln Asn Ala

859095

Phe Tyr Glu Ile Leu His Leu Pro Asn Leu Thr Glu Glu Gln Arg Asn

100 105 110

Gly Phe Ile Gln Ser Leu Lys Asp Asp Pro Ser Val Ser Lys Glu Ile

115 120 125

Leu Ala Glu Ala Lys Lys Leu Asn Asp Ala Gln Ala Pro Lys

130 135 140

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> pMENTs

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5 Phos

<220>

<221> misc_feature

<222> (20)..(20)

<223> 二脱氧胞嘧啶

<400> 2

ctgtctctta tacacatctc 20

<210> 3

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 接头A

<400> 3

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 4

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 接头-R02

<400> 4

cgaatgctct ggcctctcaa gcacgtggat 30

<210> 5

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 封阻序列-R02

<400> 5

atccacgtgc ttgagaggcc agagcattcg 30

<210> 6

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 接头-R03

<400> 6

ggtctgagtt cgcaccgaaa catcggccac 30

<210> 7

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 淬灭序列-R03

<400> 7

gtggccgatg tttcggtgcg aactcagacc 30

<210> 8

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 锚-FokI-GH

<220>

<221> misc_feature

<222> (41)..(42)

<223> 硫代磷酸酯键修饰

<400> 8

aagcagtggt atcaacgcag agtgaaggat gtgggggggg gh 42

<210> 9

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> P5-FokI

<400> 9

acactctttc cctacacgac gctcttccga tct 33

<210> 10

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> P5c-NNDC-FokI

<220>

<221> 5Phos

<222> (1)..(1)

<220>

<221> misc_feature

<222> (1)..(2)

<223> n是a、c、g或t

<400> 10

nndcagatcg gaagagcgtc gtgtagggaa agagtg 36

<210> 11

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> P5H-FokI

<400> 11

acactctttc cctacacgac gctcttccga tcth 34

<210> 12

<211> 37

<212> DNA

<213> 人工序列

<220>

<223> P5Hc-NNDC-FokI

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (2)..(2)

<223> n是a、c、g或t

<400> 12

nndcdagatc ggaagagcgt cgtgtaggga aagagtg 37

<210> 13

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> PA-F

<400> 13

cagacgtgtg ctcttccgat ct 22

<210> 14

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> PA-R

<400> 14

aagcagtggt atcaacgcag agt 23

<210> 15

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> N5XX

<220>

<221> misc_feature

<222> (30)..(37)

<223> n是a、c、g或t

<400> 15

aatgatacgg cgaccaccga gatctacacn nnnnnnntcg tcggcagcgt c 51

<210> 16

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> P7XX

<220>

<221> misc_feature

<222> (25)..(30)

<223> n是a、c、g或t

<400> 16

caagcagaag acggcatacg agatnnnnnn gtgactggag ttcagacgtg tgctcttccg 60

atc 63

<210> 17

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 通用P5

<220>

<221> misc_feature

<222> (57)..(58)

<223> 硫代磷酸酯键修饰

<400> 17

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 18

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#01_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 18

aggccagagc attcgacatc gcggccgcag atgtgtataa gagacag 47

<210> 19

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#02_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 19

aggccagagc attcgaatga gcggccgcag atgtgtataa gagacag 47

<210> 20

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#03_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 20

aggccagagc attcgaagct gcggccgcag atgtgtataa gagacag 47

<210> 21

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#04_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 21

aggccagagc attcgaacag gcggccgcag atgtgtataa gagacag 47

<210> 22

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#05_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 22

aggccagagc attcgagaat gcggccgcag atgtgtataa gagacag 47

<210> 23

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#06_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 23

aggccagagc attcgatacg gcggccgcag atgtgtataa gagacag 47

<210> 24

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#07_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 24

aggccagagc attcgattac gcggccgcag atgtgtataa gagacag 47

<210> 25

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#08_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 25

aggccagagc attcgagttg gcggccgcag atgtgtataa gagacag 47

<210> 26

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#09_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 26

aggccagagc attcgaccgt gcggccgcag atgtgtataa gagacag 47

<210> 27

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#10_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 27

aggccagagc attcgacgaa gcggccgcag atgtgtataa gagacag 47

<210> 28

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#11_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 28

aggccagagc attcgatcta gcggccgcag atgtgtataa gagacag 47

<210> 29

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> DNA_#12_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<400> 29

aggccagagc attcgagggc gcggccgcag atgtgtataa gagacag 47

<210> 30

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#01_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 30

aggccagagc attcgtcatc cctgcaggtt tttttttttt ttttvn 46

<210> 31

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#02_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 31

aggccagagc attcgtatga cctgcaggtt tttttttttt ttttvn 46

<210> 32

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#03_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 32

aggccagagc attcgtagct cctgcaggtt tttttttttt ttttvn 46

<210> 33

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#04_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 33

aggccagagc attcgtacag cctgcaggtt tttttttttt ttttvn 46

<210> 34

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#05_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 34

aggccagagc attcgtgaat cctgcaggtt tttttttttt ttttvn 46

<210> 35

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#06_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 35

aggccagagc attcgttacg cctgcaggtt tttttttttt ttttvn 46

<210> 36

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#07_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 36

aggccagagc attcgtttac cctgcaggtt tttttttttt ttttvn 46

<210> 37

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#08_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 37

aggccagagc attcgtgttg cctgcaggtt tttttttttt ttttvn 46

<210> 38

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#09_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 38

aggccagagc attcgtccgt cctgcaggtt tttttttttt ttttvn 46

<210> 39

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#10_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 39

aggccagagc attcgtcgaa cctgcaggtt tttttttttt ttttvn 46

<210> 40

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#11_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 40

aggccagagc attcgttcta cctgcaggtt tttttttttt ttttvn 46

<210> 41

<211> 46

<212> DNA

<213> 人工序列

<220>

<223> RNA_#12_RE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (45)..(45)

<223> v是a、g或c

<220>

<221> misc_feature

<222> (46)..(46)

<223> n是a、c、g或t

<400> 41

aggccagagc attcgtgggc cctgcaggtt tttttttttt ttttvn 46

<210> 42

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#01_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 42

aggccagagc attcgtcatc cctgcaggnn nnnn 34

<210> 43

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#02_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 43

aggccagagc attcgtatga cctgcaggnn nnnn 34

<210> 44

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#03_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 44

aggccagagc attcgtagct cctgcaggnn nnnn 34

<210> 45

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#04_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 45

aggccagagc attcgtacag cctgcaggnn nnnn 34

<210> 46

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#05_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 46

aggccagagc attcgtgaat cctgcaggnn nnnn 34

<210> 47

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#06_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 47

aggccagagc attcgttacg cctgcaggnn nnnn 34

<210> 48

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#07_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 48

aggccagagc attcgtttac cctgcaggnn nnnn 34

<210> 49

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#08_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 49

aggccagagc attcgtgttg cctgcaggnn nnnn 34

<210> 50

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#09_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 50

aggccagagc attcgtccgt cctgcaggnn nnnn 34

<210> 51

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#10_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 51

aggccagagc attcgtcgaa cctgcaggnn nnnn 34

<210> 52

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#11_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 52

aggccagagc attcgttcta cctgcaggnn nnnn 34

<210> 53

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> RNA_#12_NRE

<220>

<221> misc_feature

<222> (1)..(1)

<223> 5Phos

<220>

<221> misc_feature

<222> (29)..(34)

<223> n是a、c、g或t

<400> 53

aggccagagc attcgtgggc cctgcaggnn nnnn 34

相关技术
  • 使用挂锁寡核苷酸组合单细胞基因表达作图和靶向RNA或c-DNA测序的方法
  • 靶向血管紧张素原的RNA干扰片段、其表达载体、混合克隆细胞株及其应用
技术分类

06120115924477