掌桥专利:专业的专利平台
掌桥专利
首页

一种用于捕获样本目标DNA的探针池的设计方法、合成方法、探针池及其应用

文献发布时间:2023-06-19 19:30:30



技术领域

本发明属于核酸检测技术领域,具体涉及一种用于捕获样本目标DNA的探针池的设计方法、合成方法、探针池及其应用。

背景技术

一直以来,古生物及疾病样品存在着内源DNA含量低和易污染及样品难获取等问题,这些因素制约了相关研究领域工作的开展。针对疾病相关的病原微生物,首先困扰的问题是样品中病原微生物DNA含量低。随医疗条件和环境的改善,很多传染性疾病已非广泛存在,如麻风、结核、或一些其他烈性疾病。其样本保存条件受年代和环境因素等影响,导致病原体微生物DNA在保存过程中降解或本身含量较低。其次,样品来源少,一般样品来自医院早期保存、博物馆样品、考古样品等,但样品总量偏少。在古生物和动物保护研究领域,一些稀有动物或已灭绝动物的保护工作开展受阻,已灭绝的博物馆标本动物样品,存在保存状态差、易降解;而来源于考古发掘获得的动物样品同样存在相关问题,因此DNA含量低且容易为外源DNA所污染。即使通过高通量测序技术,测序数据仍然很难达到分析需要的覆盖度和深度。所获得的DNA片段信息多是复杂的环境微生物DNA或者其他类型的外源DNA,这极大程度的影响到高通量测序的质量和成本。此时捕获技术的应运而出,有效提高了针对目标区域的测序质量。目标区域特定片段捕获技术的发展在此期间起到至关重要的作用,而成就这一技术的关键步骤既是捕获探针的获取。

获取目标区域捕获探针,以往是依赖于基因芯片直接合成,而这种方式,成本高、片段长度受限、极少接受个性化定制,不利于目前研究需要。而古遗传学研究领域具有样品多样化的特点,且随着前沿科学问题的不断推进对个性化定制的需求越来越大。显然目前的探针产生方式,不适用于古遗传学领域。

围绕古DNA开展的古遗传学研究受限于化石难于获得、内源DNA含量低、片段短且分布不均的问题,一直亟待有效的解决方案。针对古生物(尤其古人类自身线粒体DNA、核DNA、和相关的疾病、伴生动物等)的目标区域捕获探针的设计和合成生产,成为解决这一系列问题的途径。

因此,需要提供一种针对上述现有技术不足的改进技术方案。

发明内容

本发明的目的在于提供一种用于捕获样本目标DNA的探针池的设计方法、合成方法、探针池及其应用,以解决或改善现有技术中的捕获探针对于DNA含量低和/或易降解样本的富集效果差的问题。

为了实现上述目的,本发明提供如下技术方案:一种用于捕获样本目标DNA的探针池的设计方法,包括下述步骤:(1)根据分割长度,以覆瓦形式设计覆盖样本靶基因整个目标区域的多个核酸片段;(2)分别在多个所述核酸片段的两端加入接头,即可设计得到用于捕获样本目标DNA的探针池。

优选地,所述覆瓦形式为2-3bp的覆瓦形式。

优选地,所述分割长度为52bp。

优选地,步骤(2)中,所述核酸片段5′端的接头为5′-ACACGCTGGTGCGATCCCTAT-3′,所述核酸片段3′端的接头为5′-CACTGCGGCTCCTCATCCACG-3′;所述探针池中,每个探针的长度为94mer。

本发明还提供了一种用于捕获样本目标DNA的探针池的合成方法,其采用下述技术方案:一种用于捕获样本目标DNA的探针池的合成方法,包括下述步骤:A.合成如上所述的设计方法设计得到的探针池,所述探针池中,每个探针合成的规模大于0.2fmol;B.对步骤A合成得到的探针池中的探针进行扩增。

优选地,步骤B包括:B1.对所述探针池中的探针进行第一轮扩增;B2.纯化第一轮扩增的产物;B3.对经步骤B纯化得到的产物进行第二轮扩增;B4.纯化第二轮扩增的产物;B5.按照步骤B1进行捕获前探针的扩增;B6.以5’端加生物素修饰的APL5引物,扩增得到单链或双链探针;步骤B1中,所述第一轮扩增的引物为APL5:5′-CGTGGATGAGGAGCCGCAGTG-3′和APL6-adj:5′-ACACGCTGGTGCGATCCCTAT-3′;所述第一轮扩增的循环数为9个循环;步骤B3中,所述第二轮扩增的引物为:APL5:5′-CGTGGATGAGGAGCCGCAGTG-3′和APL4-adj:5′-GGATTCTAATACGACTCACTATAGACACGCTGGTGCGATCCCTAT-3′;所述第二轮扩增的循环数为8个循环;步骤B2中,纯化得到的第一轮扩增产物中,经扩增得到双链探针长度为94bp,浓度大于10ng/μL;步骤B4中,纯化得到的第二轮扩增产物中,经扩增得到双链探针的长度为118bp,浓度为69-97ng/μL;步骤B5中,捕获前的探针扩增至浓度950-1050ng/μL。

优选地,步骤B1之前,还包括采用水或TE缓冲液将所述探针池中的探针稀释至6000copies/探针的步骤;步骤B1具体为:100μL反应体系中,Herculase II Fusion DNApolymerase 1μL,1×Herculase II reaction buffer 60μL,250μM each dNTP,400nM引物APL5和APL6-adj,去核酸酶水补足100μL;反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,9个循环后,72℃延伸5min;步骤B2具体为:PCR产物用MinElute PCRPurification Kit进行纯化,由20μL TEbuffer定容;取步骤B1的产物各1μL PCR产物进行qPCR和浓度及质量检测,1μL产物采用1∶50比例TE buffer稀释,1μL用做qPCR模板,采用两步扩增法,25μL反应体系,其中12.5μL Maxima SYBR Green qPCR Master Mix 2X,noROXbuffer,200nM引物APL5和APL6-adj;反应条件:95℃预变性15min,95℃变性15s,60℃退火20s,45个循环;取1μL产物检测片段长度是否为94bp、产物浓度是否合格。

优选地,步骤B3具体为:5μL经步骤B2纯化所得的纯化产物用于第二轮扩增,100μL反应体系中,Herculase II Fusion DNA polymerase 1μL,1×Herculase II reactionbuffer 60μL,250μM each dNTP,400nM引物APL5和APL4-adj,去核酸酶水补足100μL;反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,8个循环后,72℃延伸5min;

步骤B4具体为:第二轮扩增产物用MinElute PCR Purification Kit进行纯化,由20μL TEbuffer定容;分别取1μL第二轮扩增产物进行qPCR和浓度及质量检测,1μL产物采用1∶50比例TEbuffer稀释,1μL用做qPCR模板;采用两步扩增法,25μL反应体系,其中12.5μLMaxima SYBR Green qPCR Master Mix 2X,no ROXbuffer,200nM引物APL5和APL4-adj;反应条件:95℃预变性15min,95℃变性15s,60℃退火20s,45个循环;1μL产物由生物分析仪检测片段长度是否为118bp和产物浓度是否合格;取产物1μL经核酸检测仪检测探针浓度,浓度范围需满足在69~97ng/μL;步骤B4的纯化产物既可用于后续DNA探针生成,亦可用于RNA探针生成。

本发明还提出了一种探针池,其采用下述技术方案:一种探针池,,所述探针池采用如上所述的方法合成得到。

本发明还提出了一种探针池的应用,其采用下述技术方案:如上所述的探针池在古DNA富集、司法鉴定、医学检验和动物保护中的应用。

有益效果:

本发明的用于捕获样本目标DNA的探针池的设计方法选择了覆瓦式(Tiling)设计方式,探针长度和探针设计排布的策略对捕获效率有很大的影响,覆瓦式的探针设计比相邻式或间隔式的探针排布富集效率更高。其次,在探针设计的过程中,片段化的序列(与样本目标DNA模板互补的核酸序列)两端同期加入接头(adapters),后续探针合成的过程中可以连同接头一并打印,既可简化后续合成(无需再通过接头连接实验实现接头的连接),又可有效避免因需连接接头而产生的副产物。

本发明的用于捕获样本目标DNA的探针池的合成方法可通过多轮扩增,保证产物浓度需求,降低探针成本。且还可根据PCR产物需求,可选择性扩增为单链或双链探针。

本发明的用于捕获样本目标DNA的探针池对于古代样品、博物馆样品和现代病理样本的DNA均具有较好的富集效果。

本发明的用于捕获样本目标DNA的探针池可用于古DNA富集(高度降解样本),有望可拓展至司法鉴定(如毛发、牙齿、指纹、血液、体液等可能包含DNA的残留物)、医学检验(如特殊保存方式的降解病理样本)和动物保护(如野生动物样本中的毛发、粪便残留物和一些博物馆保存样品等)中的应用。

具体实施方式

下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的范围。

下面将结合实施例来详细说明本发明。需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。

本发明针对目前古生物及疾病等高度降解样品中存在着的内源DNA含量低和易污染及样品难获取等问题,提供一种用于捕获样本目标DNA的探针池的设计方法,本发明实施例中,该用于捕获样本目标DNA的探针的设计方法包括下述步骤:(1)根据分割长度,以覆瓦形式设计覆盖样本靶基因整个目标区域的多个核酸片段;(2)分别在多个所述核酸片段的两端加入接头,即可设计得到用于捕获样本目标DNA的探针池。

在探针设计过程中,片段化的序列(上述步骤(1)得到的核酸片段)两端同期加入接头(adapters),之后再合成添加接头后得到的多个探针,既可简化后续合成(省略了后续的接头连接实验),又可有效避免因需要进行接头连接实验而产生的副产物(在连接接头的实验中,可能会发生接头丢失或接头自连等情况)。本发明采用覆瓦式(Tiling)设计覆盖靶基因整个目标区域基因组序列的探针,相较于相邻式或间隔式的探针排布,富集效率更高。

本发明优选实施例中,覆瓦形式为2-3bp的覆瓦形式。覆瓦长度主要和探针最后覆盖参考序列的深度(Depth)有关,本发明选用2-3bp的覆瓦形式,能达到20x以上的深度,捕获效率会相对于低深度(1-3x)更好。

本发明优选实施例中,分割长度为52bp。探针长度和探针设计排布的策略对捕获效率有很大的影响。该分割长度是考虑到古DNA片段较短(平均长度为50-60bp),选择了52bp的分割长度(捕获区域长度),在保证探针的复杂度和特异性的同时,也尽可能降低形成二级结构影响捕获的可能性。

本发明优选实施例中,步骤(2)中,核酸片段5′端的接头为:5′-ACACGCTGGTGCGATCCCTAT-3′,核酸片段3′端的接头为5′-CACTGCGGCTCCTCATCCACG-3′;探针池中,每个探针的长度为94mer。

本发明还提出了一种用于捕获样本目标DNA的探针池的合成方法,本发明实施例的用于捕获样本目标DNA的探针池的合成方法,包括下述步骤:A.合成如上所述的设计方法设计得到的探针池,该探针池中,每个探针合成的规模大于0.2fmol;B.对步骤A合成得到的探针池中的探针进行扩增。

具体地,步骤A可通过将设计得到的核酸片段交付商业化公司合成得到。随着技术进步,含有多个核酸片段的探针池形式在保证浓度和质量要求前提下,较之前的合成方式(直接的基因芯片合成方式)可节约更多成本。本次探针的模板(探针的浓度低,便于后续以该低浓度的探针为模板对探针进行扩增)以探针池形式按设计生成,每个Oligo(探针池中的每个探针)的合成规模>0.2fmol,通过硅基技术合成探针(由商业化公司合成),平台最长可合成300nt的oligo,利用硅基DNA编辑技术,一次可合成2000条以上,错误率低至1∶2000nt。

本发明优选实施例中,步骤B包括:B1.对所述探针池中的探针进行第一轮扩增;B2.纯化第一轮扩增的产物;B3.对经步骤B纯化得到的产物进行第二轮扩增;B4.纯化第二轮扩增的产物;B5.按照步骤B1进行捕获前探针的扩增;B6.以5’端加生物素修饰的APL5引物,扩增得到单链或双链探针。

本发明优选实施例中,步骤B1中,所述第一轮扩增的引物为APL5:5′-CGTGGATGAGGAGCCGCAGTG-3′和APL6-adj:5′-ACACGCTGGTGCGATCCCTAT-3′,所述第一轮扩增的循环数为9个循环。

步骤B3中,所述第二轮扩增的引物为:APL5:5′-CGTGGATGAGGAGCCGCAGTG-3′和APL4-adj:5′-GGATTCTAATACGACTCACTATAGACACGCTGGTGCGATCCCTAT-3′;所述第二轮扩增的循环数为8个循环。

其中,APL4-adj引物序列中含有T7-promoter序列,使得该引物后续可用于合成RNA引物;此外,步骤B4的产物(第2轮扩增并纯化后的产物)既可用于后续DNA探针生成,亦可用于RNA探针生成。再次,区别于以往单一型探针合成模式(通常的探针合成模式仅适用于DNA探针或RNA探针的合成)。多轮扩增保证产物浓度需求,从而降低探针成本。并且PCR产物根据需求,可选择性扩增为单链或双链探针。

本发明优选实施例中,步骤B2中,纯化得到的第一轮扩增产物中,经扩增得到双链探针长度为94bp,浓度大于10ng/μL;步骤B4中,纯化得到的第二轮扩增产物中,经扩增得到双链探针长度为118bp,浓度为69-97ng/μL(例如,69ng/μL、75ng/μL、85ng/μL或97ng/μL);步骤B5中,捕获前的探针扩增至浓度950-1050ng/μL(例如,950ng/μL、1000ng/μL或1050ng/μL)。

本发明优选实施例中,步骤B1之前,还包括采用水或TE缓冲液将所述探针池中的探针稀释至6000copies/探针的步骤;

本发明优选实施例中,步骤B1具体为:100μL反应体系中,Herculase II FusionDNA polymerase 1μL,1×Herculase II reaction buffer 60μL,250μM each dNTP,400nM引物APL5和APL6-adj,去核酸酶水补足100μL;反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,9个循环后,72℃延伸5min。

本发明优选实施例中,步骤B2具体为:PCR产物用MinElute PCR PurificationKit进行纯化,由20μL TEbuffer定容;取步骤B1的产物各1μL PCR产物进行qPCR和浓度及质量检测,1μL产物采用1∶50比例TE buffer稀释,1μL用做qPCR模板,采用两步扩增法,25μL反应体系,其中12.5μL

本发明优选实施例中,步骤B3具体为:5μL经步骤B2纯化所得的纯化产物用于第二轮扩增,100μL反应体系中,Herculase II Fusion DNA polymerase 1μL,1×Herculase IIreaction buffer 60μL,250μM each dNTP,400nM引物APL5和APL4-adj,去核酸酶水补足100μL;反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,8个循环后,72℃延伸5min。

本发明优选实施例中,步骤B4具体为:第二轮扩增产物用MinElute PCRPurification Kit进行纯化,由20μL TEbuffer定容;分别取1μL第二轮扩增产物进行qPCR和浓度及质量检测,1μL产物采用1:50比例TEbuffer稀释,1μL用做qPCR模板;

采用两步扩增法,25μL反应体系,其中12.5μL

本发明还提供了一种探针池,本发明实施例的探针池采用如上所述的用于捕获样本目标DNA的探针池的合成方法合成得到。

本发明还提供了如上所述的探针池的应用:如上所述的探针池在古DNA富集、司法鉴定、医学检验和动物保护中的应用。本发明针对古生物(尤其古人类自身线粒体DNA、核DNA、和相关的疾病、伴生动物等)的目标区域捕获探针的设计和合成生产,成为解决这一系列问题的途径。通过探索性研究,我们发现本发明的特有性和拓展性。首先,本研究的初始目的在于针对古代样品,随着研究的深入,我们拓展研究至现生样品,如一些疾病和近现代博物馆动物样品。均获得了较好的效果。此外,根据已有数据推断,未来我们可以拓展研究至司法领域的样本鉴定方面(如毛发、牙齿、指纹、血液、体液等可能包含DNA的残留物);医学检验方面,如特殊保存方式的降解病理样本;动物保护方面,如野生动物样本中的毛发、粪便残留物和一些博物馆保存样品等。成为解决上述问题的有效途径。

下面通过具体实施例对本发明的用于捕获样本目标DNA的探针池的设计方法、合成方法、探针池及其应用进行详细说明。

实施例1

1.1探针池设计

以麻风杆菌全基因组(Mycobacterium leprae TN,Genebank no:ASM19585v1)序列为模板,2bp覆瓦形式构建的长度为94bp的探针(单链探针)。

其中,麻风杆菌全基因组共3,268,203bp,共设计得到2,150,994探针,其中:

第1个探针以5’端第1-52bp为模板设计,并在两端加上接头后设计得到;第2个探针以5’端第3-54bp为模板设计,并在两端加上接头后得到;第3个探针以5’端第5-56bp为模板设计,并在两端加上接头后设计得到;以此类推。

各个探针中,与上述设计得到的多个核酸片段的5’端的相连的接头为:5'-ACACGCTGGTGCGATCCCTA-3’;

与上述设计得到的多个核酸片段的3’端的相连的接头为:5'-CACTGCGGCTCCTCATCCACG-3’。

1.2探针池合成:

A.将上述设计得到的多个探针,交付艾吉泰康生物科技(北京)有限公司商业化公司合成得到;以探针池(oligo pool)形式合成。随着技术进步,探针池形式在保证浓度和质量要求前提下,较之前的合成方式可节约更多成本。本次探针的模板以探针池形式按设计生成,每个Oligo的合成规模>0.2fmol,通过硅基技术合成探针,平台最长可合成300nt的oligo,利用硅基DNA编辑技术,一次可合成2000条以上,错误率低至1∶2000nt。

B.对步骤A合成得到的探针池中的探针进行扩增,包括下述步骤:

先将合成好的探针以水或TE缓冲液稀释至固定浓度(~6,000copies/探针),之后按照下述步骤进行:

B1.100μL反应体系中,Herculase II Fusion DNA polymerase(安捷伦公司)1μL,1×Herculase II reaction buffer 60μL,250μM each dNTP,400nM引物APL5(5′-CGTGGATGAGGAGCCGCAGTG-3′)和APL6-adj(5′-ACACGCTGGTGCGATCCCTAT-3′)。反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,9个循环后,72℃延伸5min。

B2.PCR产物用MinElute PCR产物纯化试剂盒(凯杰公司,28006)进行纯化,由20μLTE缓冲液(配方)定容。取产物各1μL PCR产物进行qPCR和浓度及质量检测,1μL产物采用1∶50比例TE缓冲液稀释,1μL用做qPCR模板,采用两步扩增法,25μL反应体系,其中12.5μL

B3.5μL纯化产物用于第二轮扩增。100μL反应体系中,Herculase II Fusion DNApolymerase(安捷伦公司,600679)1μL,1×Herculase II reaction buffer 60μL,250μMeach dNTP,400nM引物APL5(5′-CGTGGATGAGGAGCCGCAGTG-3′)和APL4-adj(5′-GGATTCTAATACGACTCACTATAGACACGCTGGTGCGATCCCTAT-3′)。反应条件:95℃预变性2min,95℃变性30s,60℃退火30s,72℃延伸30s,8个循环后,72℃延伸5min。

B4.PCR产物用MinElute PCR Purification Kit(凯杰公司,28006)进行纯化,由20μL TE缓冲液(配方)定容。取产物各1μL PCR产物进行qPCR和浓度及质量检测,1μL产物采用1∶50比例TE缓冲液稀释,1μL用做qPCR模板,采用两步扩增法,25μL反应体系,其中12.5μL

B5.捕获前探针的扩增。为进一步提高浓度,保证浓度约为1000ng/μL,片段长度为94bp,以确保探针质量和降低成本。反应体系和条件参考步骤B1。

B6.PCR产物(步骤B5的产物)根据需求,扩增为双链探针。用于捕获实验。具体参照步骤A和B。其中APL5换成相同序列的5’端加biotin修饰的引物。PCR产物采用磁珠纯化方法。

1.3捕获测试

捕获实验,是利用碱基互补配对原理,将设计好的核酸探针与目标区域结合后,对目标区域进行钓取富集的一项技术(参照下述参考文献:Fu Q.,Meyer M.,Gao X.,StenzelU.,Burbano H.A.,Kelso J.,et al.(2013).DNA Analysis of an Early Modern Humanfrom Tianyuan Cave,China.Proc.Natl.Acad.Sci.U.S.A.110(6),2223-2227.DOI:10.1073/pnas.1221359110)

将上述1.2扩增得到的探针池用于古代样本中麻风杆菌DNA的捕获:古代样本中DNA含量低,该实验有效提高文库中内源DNA含量,捕获后的文库可进行下一步测序工作。

测序结果评估(Tllumina Xten测序平台)

对19个古代骨骼样本(无需对样本进行预处理),每个样品加入500ng单链探针,进行捕获实验并测序。比对捕获前后DNA文库(DNA文库的构建方法参照Meyer et al.,2012Meyer M.,Kircher M.,Gansauge M.-T.,Li H.,Racimo F.,Mallick S.,et al.(2012).A High-Coverage Genome Sequence from an Archaic DenisovanIndividual.Science 338(6104),222-226.DOI:10.1126/science.1224344)中目标DNA(Mycobacterium leprae TN)含量(比对到目标物种参考序列上的DNA序列比例)如表1。样本经测序得到46,154-20,035,134条序列(平均46,154条),原始测序数据比对至麻风杆菌基因组(3,268,203bp)。富集前比对后覆盖深度小于0.30×。富集后比对覆盖深度为0.01-5.86×,平均深度为2.09×。捕获前,样本中平均目标DNA比例(目标DNA比例=比对到参考序列的DNA/总测序数据;平均值是用所有同类样本目标DNA比例计算)为0.03%,捕获后平均目标DNA比例为3.5%,目标DNA比例在捕获后平均提高至92.94倍(富集系数=捕获后目标DNA比例/捕获前目标DNA比例)。在测试样品中,最低富集系数为8.5,最高为450.9。具体实验结果如下表1所示:

表1古代骨骼样本捕获结果

实施例2

将上述实施例1扩增得到的探针池用于现代病理样本中麻风杆菌DNA的捕获(同实施例1),捕获方法同实施例1。

测序结果评估:

对37个现代病理样本(无需对样本进行预处理),每个样品加入500ng单链探针,进行捕获实验并测序。样本经测序得到60,213-52,921,025条序列(平均5,607,389条),原始测序数据比对至麻风杆菌基因组(3,268,203bp)。富集前比对后覆盖深度小于0.01×。富集后比对覆盖深度为0.01-650.93×,平均深度为32.07×。比对捕获前后DNA文库中目标DNA(Mycobacterium leprae TN)含量如表2所示:

表2现代病理样本捕获结果

/>

由表2可知:捕获前,样本中平均目标DNA比例为1.69%,捕获后平均目标DNA比例为32.18%,平均富集系数为19.05。在测试样品中,最低富集系数为2.35,最高为8265.62。另有两个样本(现代病理-25和现代病理-36)捕获前未检出目标DNA,捕获后分别检出0.27%和0.39%目标DNA。

实施例3

3.1探针池设计

以博物馆保存的大鲵线粒体基因组(Andriasdavidianus,Genebank no:AJ492192.1)序列为模板,3bp覆瓦形式构建的长度为94bp的探针(单链探针)。

其中,大鲵线粒体基因组共16,503bp,共设计得到5501探针;

第1个探针以5’端第1-52bp为模板设计,并在两端加上接头后设计得到;第2个探针以5’端第4-55bp为模板设计,并在两端加上接头后得到;以此类推。

各个探针中,与上述设计得到的多个核酸片段的5’端的相连的接头为:5’-ACACGCTGGTGCGATCCCTA-3’;

与上述设计得到的多个核酸片段的3’端的相连的接头为:5’-CACTGCGGCTCCTCATCCACG-3’。

3.2探针池合成:具体步骤同实施例1

3.3捕获测试方法同实施例1

3.4测序结果评估:

对20个博物馆样本(无需对样品进行预处理),每个样品加入500ng双链探针,进行捕获实验并测序。样本经测序得到78,533-504,122条序列(平均229,356条),原始测序数据比对至大鲵线粒体基因组(16,503bp),富集前比对后覆盖深度小于0.00012×。富集后比对覆盖深度为8.27-111.32×,平均深度为53.76×。比对捕获前后DNA文库中目标DNA(Andriasdavidianus线粒体DNA)含量如表3所示。

表3博物馆样本捕获结果

/>

由表3可知:捕获前,样本中平均目标DNA比例为0.03%,捕获后平均目标DNA比例为32.54%,平均富集系数为3565.75。在测试样品中,最低富集系数为94.87,最高为8599.20。

综上所述:本发明的用于捕获样本目标DNA的探针池的设计方法和合成方法,在3类案例中进行了应用与评估,分别是古代骨骼样本中病原菌、博物馆动物线粒体DNA和现代病理样本中的病原菌捕获。三组评估分别包括19例、20例和37例样本。结果表明,所有受测样本的目标DNA比例在捕获后均得到了提升,最高富集系数高达8599.2。在三类样本中,博物馆样本平均富集系数最高,古代骨骼样本其次,病理样本较低(年代信息:古代骨骼样本>博物馆样本>病理样本)。

综合以上结果,说明本方法能有效提高各种类型的高度降解样本中的目标DNA含量,且在古代样本、博物馆样本和现代病理样本中均取得了较好的应用效果。

以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120115933671