掌桥专利:专业的专利平台
掌桥专利
首页

一种微生物多重PCR靶向扩增引物池的设计方法

文献发布时间:2023-06-19 18:30:43


一种微生物多重PCR靶向扩增引物池的设计方法

技术领域

本发明涉及病原微生物检测技术领域,尤其涉及一种微生物多重PCR靶向扩增引物池的设计方法。

背景技术

被不明感染后,首要工作就是要快速准确对感染源进行鉴定。尽可能快的进行早期诊断和早期药物干预可以尽可能提高生存率。对于病原微生物的靶向扩增,可以对病原微生物进行快速、准确的鉴定。从而进行第一时间的诊断并进行药物治疗。

现有的靶向病原扩增一般是扩增病原的某个特殊基因,这些基因往往非该病原特有,这就导致了假阳性的出现。而目前造成感染的病原极多,人体同一部位可能被多种病原微生物感染,临床上则需要多次的单重靶向扩增进行鉴定,这增加了操作步骤和实验资源的成本。

多重PCR(Multiplex polymerase chain reaction,MPCR)是在同一PCR反应体系里加上二对以上引物,同时扩增出不同模板而获得不同扩增片段的PCR反应。它既然保留了常规PCR的特异性和敏感性,又减少了操作步骤及试剂量的使用。然而现有技术普遍存在单重靶向病原微生物扩增假阳性较高,速度较慢的问题。有必要提供一种高效的设计出多重PCR引物池的方法,提高在复杂的样品中大量微生物同时靶向扩增的效率。

发明内容

本发明的目的在于提供一种微生物多重PCR靶向扩增引物池的设计方法,实现多重PCR引物池的高效设计,解决单重靶向病原微生物扩增假阳性较高,速度较慢的问题,提高在复杂的样品中大量微生物同时靶向扩增的效率。

有鉴于此,本发明的方案如下:

一种微生物多重PCR靶向扩增引物池的设计方法,包括如下步骤:

筛选微生物物种的特异性序列集;

针对每个物种特异性序列分别设计引物对;

各物种引物对进行自我二聚体测试筛选出若干引物对;

对物种自定义排序,按排序先后向引物池添加单个物种至少一对引物,在后添加的每一对引物均与在先添加的引物对进行异源二聚体测试,至引物池中每个物种均有两对以上的引物,得到多重PCR靶向扩增引物池。

进一步地,所述微生物物种的特异性序列集筛选方法为:

S100.针对基因组数据库,根据数据量、质量或在种量选取物种基因组作为种子基因组;

S200.基于种子基因组的每一条序列,将其打断为序列集并合并所有序列集;

S300.筛选存在于基因组数据集比例超过30%的序列片段集合作为种内普遍序列集;

S400.将种内普遍序列集与冗余核酸数据库进行序列比对,剔除比对上该物种外Identity大于75%且Coverage大于70的基因组序列或核酸片段,获得种外特异序列集;

S500.对种外特异序列集进行目标片段调整得到该物种的目标特异序列集。

优选地,所述数据量筛选过程如下:

若该物种菌株基因组数据含有超过n个,则选取组装完成度为“Complete”的基因组;

若选取的基因组数据小于k个,则额外选取“Chomosome”基因组;

若选取的基因组数据仍小于k个,则再额外选取“Scaffold”基因组;

若选取的基因组数据仍小于k个,则再额外选取“Contig”基因组;

若选取全部基因组数据仍小于k个,则选取全部基因组数据;

其中,n取30~1000的自然数;k取1~30的自然数。

优选地,所述n取50~100,所述k取10~20。

进一步地,步骤S200中,所述序列打断过程为,将序列打断为长度为a且移步窗口为b的序列集;a为200~100000的自然数,b为10~200的自然数。

进一步地,步骤S500中,所述目标片段调整步骤为:剔除掉种外特异序列集中GC含量大于70%或小于20%的序列,去除含有超过6联碱基的序列。

进一步地,所述自我二聚体测试筛选方法为:将上游引物的一端的碱基与下游引物一端的碱基进行相向重叠,上游引物和下游引物之间以一个碱基步长进行相对位移,得到碱基重叠区域群;对每段碱基重叠区域,按以下原则进行打分:

重叠区域中比对上的碱基数目为c,重叠区域中从第一个比对上的碱基开始到最后一个比对上的碱基结束,该碱基数目记为d,碱基重叠区域最终得分S=mc-2d,碱基重叠区域群中最高得分S作为Smax,若Smax≤p,则自我二聚体测试通过;反之,则自我二聚体测试未通过;m为1~10,p为1-50。

进一步地,所述异源二聚体测试筛选方法为:将第一引物的一端的碱基与第二引物一端的碱基进行相向重叠,第一引物和第二引物之间以一个碱基步长进行相对位移,得到碱基重叠区域群;对每段碱基重叠区域作为G值计算区,根据相邻核苷酸热力学表打分求和,取低于G值阈值的序列。

优选地,所述G值计算区分为上下两段碱基短序列,取尽两段碱基短序列5`端到3`端的二联碱基,基于二联碱基进行打分加和。

优选地,所述异源二聚体测试筛选方法根据G值计算区中二联碱基计算最终G值:G=-(i+j)+Gb;其中:Gb为二联碱基吉布斯自由能之和,i为2~10;j为5~15,若G值最高得分Smax≤p,则异源二聚体测试通过,且报出碱基重叠区域群中最低G值;反之,则异源二聚体测试未通过。

相比现有技术,本发明的有益效果包括但不限于:

1.本发明提出的所述引物池设计方法可根据物种自定义排序,通过引物对添加的先后顺序进行二聚体测试避免在先物种的引物对难以筛选,可实现多重PCR引物池的高效设计,解决单重靶向病原微生物扩增假阳性较高,速度较慢的问题,提高在复杂的样品中大量微生物同时靶向扩增的效率。

2.本发明提出的所述引物池设计方法可结合不同的样本中目标检测物种重要性进行自定义,适用性强,为检测提供便利。

3.本发明提出的所述引物池设计方法通过快速全面且严格的挑选出目标物种的特异性序列集,提高了靶向扩增引物的特异性。

4.本发明所述引物池设计方法中,二聚体测试基于二元罚分矩阵与碱基相互吉布斯自由能计算的二聚体评分机制方法,进一步提高了引物池的设计效率,降低了引物之间的互补概率,降低假阳性,进一步提高扩增效率。

附图说明

图1为本发明实施例针对待测物种设计多重PCR靶向引物池的实验验证琼脂糖凝胶电泳图。

具体实施方式

为了使本发明的目的、技术方案和有益技术效果更加清晰明白,以下结合具体实施方式,对本发明进行进一步详细说明。应当理解的是,本说明书中描述的具体实施方式仅仅是为了解释本发明,并不是为了限定本发明。

本发明的目的在于提供一种微生物多重PCR靶向扩增引物池的设计方法,即针对于大量微生物的靶向PCR扩增,寻找对应物种在种水平的特异性片段,并设计极多数量的特异性引物对,再基于二元罚分矩阵与碱基相互吉布斯自由能计算的二聚体评分机制方法,设计多重PCR靶向扩增引物池。解决了单重靶向病原微生物扩增假阳性较高,速度较慢的问题。可以高效的设计出多重PCR引物池,提高在复杂的样品中大量微生物同时靶向扩增的效率。

本发明中的微生物包括且不限于细菌、真菌、病毒、古细菌以及部分动物。

本发明的第一方面,提出一种微生物特异序列集筛选方法,步骤如下:

1.基因组数据获取

通过对NCBI的RefSeq和Genbank数据库和PATRIC数据库中分类为bacteria、archaea、fungi、protozoa和viral的基因组数据下载的方式获取大量同一物种细菌基因组数据。

具体如下:若该物种菌株基因组数据含有超过n个,则选取组装完成度为“Complete”的基因组;

若选取的基因组数据小于k个,则额外选取“Chomosome”的基因组;

若选取的基因组数据仍小于k个,则再额外选取“Scaffold”的基因组;

若选取的基因组数据仍小于k个,则再额外选取“Contig”的基因组;

若选取全部基因组数据仍小于k个,则选取全部基因组数据。

其中,所述n为30~1000的自然数;所述k为1~30。

在优选的实施例中,所述n为50~100;所述k为10~20。

5.种子片段获取

对于选取的基因组数据集,挑选其中组装质量最高或有文献支持的一株菌株基因组作为该物种的种子基因组。

对于种子基因组的每一条序列,将其打断为长度为a且移步窗口为b的序列集并合并所有序列集;例如,从序列第i个碱基开始,往后截取直至长度为a个碱基的子序列作为第一条序列。再以起始位置向后步移b个碱基,往后截取长度为a个碱基的子序列作为第二条序列。接下来再以上一步截取开始的位置向后步移b个碱基,往后截取长度为a个碱基的子序列作为第三条序列。依次循环,对于截取的第N条序列,其在基因组的位置为从(i+N-1)b到(N-1)b+a。直到取到序列末尾,无法截取长度为a个碱基的子序列后,将其作为最后一条序列加入序列集。其中,i为1~100000;a为200~100000;b为10~200。

对于种子基因组的每一条序列,都会生成一组该序列集,合并序列集得到种子序列集。

6.片段种内普遍性确认

基于种子序列集平均序列长度的不同,本领域人员可选择blastn或minimap2不同的比对软件。

将种子序列集与基因组数据获取中选取的基因组数据集进行序列比对,查看种子序列集中序列是否存在于选取的基因组的每一个基因组中。

筛选存在于基因组数据集超过30%的序列片段集合作为种内普遍序列集。

7.片段种外特异性筛选

将种内普遍序列集与NCBI网站冗余核酸数据库NT(Nucleotide SequenceDatabase)库进行序列比对,查看种内普遍序列集中序列是否存在于该物种外的物种基因组中。剔除掉比对上该物种外的基因组或核酸片段且Identity大于75%且Coverage为大于70的序列。将筛选后的序列片段集作为种外特异序列集。

8.目标片段调整:

对于种外特异序列集,剔除掉其中GC含量大于70%或小于20%的序列。

检索并去除序列集中包含有超过6联碱基的序列。

将最终筛选后的序列片段集作为该物种的目标特异序列集。

多重PCR需要充分考虑模板、引物及反应体系等因素,其中,引物池的合理配置起到决定性因素。多重PCR引物池中的引物应该两两匹配结合互补的概率极低,互相之间具有极强的抗二聚体形成能力。基于此,本发明的第二方面,提出一种多重PCR靶向扩增引物池设计方法,步骤如下:

1.物种引物池设计:确定需要构建的多重靶向引物池所包含的物种列表。

根据本发明的第一方面陈述的细菌特异序列集筛选方法,获取列表中每一个物种的目标特异序列集;

使用引物设计软件PrimerPremier、Beacon、Primer3、Oligo7、Primerbank或BathPrimer3.0,对每一个物种的目标特异序列集中每一段序列设计n对引物,y取1~50;最终每个物种获得的对应引物池作为该物种的特异性靶向扩增引物池。

2.多重PCR靶向引物池构建:

将引物池所包含的物种按物种在引物池中重要性进行从高到低的排列得到物种重要性列表。

从重要性最高的物种中随机挑选一对引物,直到这一对引物的两条序列通过自我二聚体测试;测试通过后,将这一对引物作为多重PCR靶向引物池的第一对引物。

依据物种重要性列表,将排名第二物种的特异性靶向扩增引物池中,每一对引物,先进行自我二聚体测试,筛选获得第二物种引物池;再分别与第一对引物进行异源二聚体测试,并按异源二聚体打分方法获得打分与G值,得到打分与G值综合最低的引物对,将这对引物作为多重PCR靶向引物池的第二对引物。

对排序在后物种的引物对进行自我二聚体测试筛选若干引物,再分别和多重PCR靶向引物池中的引物对进行异源二聚体测试,取打分G值最小作为引物对;依此类推,直至将重要性列表上全部物种都依次有一对引物加入到多重PCR靶向引物池。

跳过随机挑选引物加入的步骤,开始第二轮的引物添加流程。重复上述步骤,直至多重PCR靶向引物池中,重要性列表上的物种每个都有至少两对引物。最终得到的多重PCR靶向引物池则是对应列表物种的微生物的多重PCR靶向扩增引物池。

上述引物池的构建主要考虑将重要的物种放在前面,以免后面条件太过苛刻找不到合适的引物,也可以优先将重要物种两对的引物添加进引物池,在后物种的引物对分别与在先添加的所有引物对进行异源二聚体测试,保证引物池内所有引物对之间都进行了异源二聚体测试,降低两两匹配结合互补的概率。

在本发明的一个实施例中,所述自我二聚体测试的评价方法为:

对于一对引物的左端与右端。将右端引物序列最左边第一个碱基与左端引物最右边第一个碱基重叠,即相向重叠,记录下两条引物重叠的碱基区域。

以此开始,固定其中左端不动,右端引物向左做步长为1碱基的位移,直到右端引物序列最右边第一个碱基与左端引物最左边第一个碱基重叠。自此,得到多段长度不一的碱基重叠区域群。

对每段碱基重叠区域,按以下原则进行打分:

重叠区域中比对上的碱基数目为k。

重叠区域中从第一个比对上的碱基开始到最后一个比对上的碱基结束,该碱基数目记为L;

碱基重叠区域最终得分S=nk-2L,n为1~10。

碱基重叠区域群中最高得分作为Smax,若Smax小于等于p,p取1-50,则自我二聚体测试通过。反之,则自我二聚体测试未通过。

在本发明的一个实施例中,异源二聚体测试的评价方法为:

对于异源二聚体测试的两条引物。将一号引物序列最左边第一个碱基与二号引物最右边第一个碱基重叠,记录下两条引物重叠的碱基区域。

以此开始,固定其中二号不动,一号引物向左做步长为1碱基的位移,直到一号引物序列最右边第一个碱基与二号引物最左边第一个碱基重叠。自此,得到多段长度不一的碱基重叠区域群。

重叠区域中从第一个比对上的碱基开始到最后一个比对上的碱基结束的重叠区作为该重叠区域的G值计算区。

若是重叠区大于1,则对于每一个G值计算区,按以下原则进行打分:

G值计算区分为上下两段碱基短序列,取尽两段碱基短序列5`端到3`端的二联碱基,并根据相邻核苷酸热力学表打分加和。

碱基结合吉布斯自由能表为:'AA'=>1.9,'AT'=>1.5,'AC'=>1.3,'AG'=>1.6,'TT'=>1.9,'TA'=>0.9,'TC'=>1.6,'TG'=>1.9,'CC'=>3.1,'CG'=>3.6,'CA'=>1.9,'CT'=>1.6,'GG'=>3.1,'GC'=>3.1,'GT'=>1.3,'GA'=>1.6。

例如,一对上为“AACGG”,下为“TCGTC”的G值计算区。由于引物序列特性,下端引物序列实际表示应为“CTGCT”,则两段碱基短序列的二联碱基为“AA,AC,CG,GG,CT,TG,GC,CT”,其最终加和Gb=1.9+1.3+3.6+3.1+1.6+1.9+3.1+1.6=18.1。

其碱基重叠区域最终G值为G=-(i+y)+Gb,Gb代表二联碱基G值,i为2~10;y为5~15。

碱基重叠区域群中每一个碱基重叠区域都需要计算最终G值。碱基重叠区域最终得分与自我二聚体测试的得分评价方法一致。碱基重叠区域群中最高得分作为Smax,若Smax小于等于p,p取1-50,则异源二聚体测试通过,且报出碱基重叠区域群中最低G值。反之,则异源二聚体测试未通过。

实施例1

下面通过人葡萄球菌(Staphylococcus hominis)为例,展示本发明的第一部分,构建人葡萄球菌特异序列集。

1.基因组数据获取

NCBI(National Center for Biotechnology Information)全称为美国国家生物技术信息中心,网站上收录了绝大部分目前人类已测序的物种基因组数据。可以通过NCBI官方数据下载软件datasets进行下载,或者从其服务器(https://ftp.ncbi.nlm.nih.gov/genomes/genbank/)上下载所收录的基因组数据。

NCBI的Genbank数据库中人葡萄球菌基因组数据共有224条,选取其中组装完整度为“Chomosome”、“Complete”以及“Scaffold”的基因组共计95条作为人葡萄球菌基因组数据。

2.种子片段获取

以NCBI数据库中人葡萄球菌的参考基因组GCF_003812505.1作为该菌株的种子基因组。

将其每一条序列从头开始按照长度为1600bp,移步窗口为100bp切割,即i=0;n=1600;k=100。最后合并,得到种子序列集。

3.片段种内普遍性确认

选择使用blast软件的blastn功能,将种子序列集与基因组数据获取中下载的人葡萄球菌基因组数据进行序列比对。

筛选存在于基因组数据集超过50%的序列片段集合作为种内普遍序列集。

4.片段种外特异性筛选

选择使用blast软件的blastn功能,将种子序列集与NCBI网站冗余核酸数据库NT(Nucleotide Sequence Database)库进行序列比对。剔除掉比对上该物种外的基因组或核酸片段且Identity大于85%且Coverage大于60的序列。

将筛选后的序列片段集作为种外特异序列集。

5.目标片段调整

剔除掉种外特异序列集中包含有超过7联碱基的序列,最后得到人葡萄球菌的目标特异序列集共2702条。

实施例2

对于一组多重PCR靶向扩增引物池,其中所包含的物种都需要使用实施例1中步骤一至五的方法构建目标特异序列集。调整阈值并使每一个物种都有至少100条不同的目标特异序列集。

下面通过人葡萄球菌(Staphylococcus hominis)、屎肠球菌(Enterococcusfaecium)、脑膜炎奈瑟氏菌(Neisseria meningitidis)、沃氏葡萄球菌(Staphylococcuswarneri)与光滑念珠菌(Candida glabrata)为例,构建这五个物种的多重PCR靶向扩增引物池,展示本发明的第二部分。

1.物种引物池设计

对于人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌与光滑念珠菌,使用以上实施例1中步骤1至5的方法。调整至合适的阈值,分别获得对应的目标特异序列集,其中每个物种所获得的目标特异序列集数目如下:

表1:物种目标特异序列集序列数

使用引物设计软件Primer3对序列设计引物,设置参数PRIMER_OPT_SIZE=20、PRIMER_MIN_SIZE=18、PRIMER_MAX_SIZE=24、PRIMER_NUM_RETURN=8。

对于不同物种目标特异序列集中的每一条序列,都设计8对引物。

这些引物池作为对应物种的特异性靶向扩增引物池。

2.多重PCR靶向引物池构建

将物种以沃氏葡萄球菌、脑膜炎奈瑟氏菌、屎肠球菌、人葡萄球菌、光滑念珠菌的重要性排序。

首先,从沃氏葡萄球菌的特异性靶向扩增引物池中,随机取出一对满足自我二聚体测试的引物。这对引物作为多重PCR靶向引物池的第一对引物。其次,将脑膜炎奈瑟氏菌的特异性靶向扩增引物池中全部引物,按排列顺序,依次先进行自我二聚体测试后,与现有的多重PCR靶向引物池中每一条引物进行异源二聚体测试。选择脑膜炎奈瑟氏菌的特异性靶向扩增引物池中G值最低的一对引物,加入多重PCR靶向引物池。

然后,依此类推,将重要性排序表中下一个物种特异性靶向扩增引物池的全部引物进行引物测试。直至重要性排序表中全部物种都有至少一对引物加入到多重PCR靶向引物池。

最后,从沃氏葡萄球菌开始,进行第二轮的引物加入。如此循环,使多重PCR靶向引物池中每个物种都有至少三对引物。

表2为以人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌与光滑念珠菌多重PCR靶向引物池构建的最终结果:

表2:测试物种多重PCR靶向引物池

3.多重PCR靶向引物池实验验证

相对于传统方法,本实施例提供的方法所得到的多重PCR靶向引物池特异性与灵敏度有一定的优势。以下实验用于以上方法设计的多重PCR靶向引物池的可行性。

分别提取人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌与光滑念珠菌的基因组DNA。

使用多重PCR靶向引物分别扩增人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌、光滑念珠菌以及以上五株菌的混合模板DNA。

对以上PCR产物进行琼脂糖凝胶电泳实验,所得电泳图结果如图1所示。图中,第一条带为2000 DNA Marker,第二至第七条带分别为:人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌、光滑念珠菌以及以上五株菌的混合模板所扩增出的PCR引物。

从图中1可以看出,人葡萄球菌、屎肠球菌、脑膜炎奈瑟氏菌、沃氏葡萄球菌、光滑念珠菌的条带都比较明显,且片段大小在400-550bp之间,说明可以成功扩增。五株菌的混合模板也有极强亮度的条带,大小在500-600bp之间,说明也可以成功扩增。

本发明并不仅仅限于说明书和实施方式中所描述,因此对于熟悉领域的人员而言可容易地实现另外的优点和修改,故在不背离权利要求及等同范围所限定的一般概念的精神和范围的情况下,本发明并不限于特定的细节、代表性的方案和这里描述的示例。

相关技术
  • 一种具有靶向光热治疗和可控释药的多重作用纳米材料的制备方法及应用
  • 可同时检测多种微生物的多重荧光定量PCR检测方法和多重荧光定量PCR检测试剂盒
  • 一种扩增BRCA1/2基因的多重PCR引物及一种多重PCR引物的设计方法
技术分类

06120115596772