掌桥专利:专业的专利平台
掌桥专利
首页

一段来源于细粒棘球绦虫的游离DNA序列及其应用

文献发布时间:2023-06-19 13:48:08



技术领域

本发明属于生物技术和医药领域,具体为一段来源于细粒棘球绦虫的游离DNA序列;此外,本发明还涉及该游离DNA序列在制备包虫病(或棘球蚴病)检测和诊断产品中的应用。本发明受国家自然科学基金(81601792、81772224、81772225、81501771)及国家卫生健康委包虫病防治研究重点实验室开放课题(2020WZK2008)资助。

背景技术

棘球绦虫(Echinococcus spp.)的幼虫寄生于人体可引起棘球蚴病(echinococcosis),俗称为包虫病(hydatid disease),是一种严重影响人体健康和畜牧业发展的人兽共患寄生虫病,是我国重点防治的寄生虫病。其中细粒棘球绦虫(Echinococcusgranulosus)引起的棘球蚴病为囊型包虫病,占包虫病总数的98%。我国是包虫病流行最为严重的国家,全国包虫病流行县370个,流行区面积占国土面积40%以上,患病人数超过16万,受威胁人口数近6000万,均居全球首位,我国包虫病疾病负担占全球疾病负担的40%,为全球最高。

目前,对包虫病病人的诊断采用的是超声检查的方法,以发现包虫病特征性影像结合流行病学调查作为主要的诊断依据,对疑似病例进行血清免疫学辅助诊断。

超声检查为无创检查方法,是目前包虫病筛查诊断的首选方法,但仍存在一些问题,如实际检查中采用的腹部超声检查仅能对腹腔进行检查,不能发现腹部以外的病灶,检查过程中对操作人员的技术水平和临床经验要求高,易与肝囊肿、肝血管瘤、肝癌等混淆,且对于2cm以内缺乏特征影像结构的小囊无法诊断,从而导致漏诊或误诊。在包虫病影像不典型时,用免疫学检测作为辅助诊断方法。目前用于免疫学检测的抗原多为粗抗原,来源于囊液、原头蚴、囊壁等虫体成分,通常敏感性较高,但特异性不足,且常常与其他绦虫、吸虫有交叉反应,使得免疫学检测结果通常假阳性较高。

因此包虫病检测和诊断领域急需开发一种敏感特异的检测方法。基于特异性核酸标志物的分子生物学方法已在多种疾病中被证明是敏感、特异、高效的检测方法,在包虫病检测和诊断领域也已开展相关探索,通过聚合酶链式反应(PCR)、巢式PCR、荧光PCR、环介导等温扩增(LAMP)等方法进行检测和诊断。

分子生物学方法的关键点在于筛选获得敏感性和特异性都足够高的核酸标志物作为检测靶标,游离DNA(cell-free DNA)是存在于血液、尿液、唾液等体液中的细胞外游离状态的DNA分子,寄生虫源的游离DNA可能是虫体在生长、发育、成熟、崩解等过程中分泌或释放出的DNA分子进入宿主体液循环而产生的,虫源游离DNA已在疟原虫、弓形虫、血吸虫、锥虫等寄生虫研究中被证明是可作为寄生虫病检测或诊断的核酸靶标。

目前尚未有文献公开细粒棘球绦虫游离DNA序列作为包虫病(或棘球蚴病)检测和诊断的应用。

发明内容

本发明要解决的技术问题之一是提供一段来源于细粒棘球绦虫的游离DNA序列。

本发明要解决的技术问题之二是上述游离DNA序列的筛选方法。

本发明要解决的技术问题之三是上述游离DNA序列的应用。

本申请采用大通量基因组学测序结合生物信息学分析的方法,筛选得到了来自于细粒棘球绦虫的游离DNA序列,通过荧光定量PCR法初步鉴定了该DNA序列具有较高的敏感性和特异性,可应用于包虫病检测和诊断。

本发明解决上述技术问题采用的技术方案为:

在本发明的一方面,提供一段来源于细粒棘球绦虫的游离DNA序列,长度为101个碱基,其序列为SEQ ID NO.3所示序列:

GCAAGATCTTCACGAGCCTCAGAGAATTCACCTTCTTCCATGCCTTCACCGACGTACCAATGAACGAATGCACGCTTGCCGTACATAAGATCAAACTTGTG

作为本发明优选的技术方案,所述游离DNA序列是用囊型包虫病病人血浆游离DNA经基因组重测序技术结合生物信息学分析方法,再通过荧光定量PCR法在病人和健康人中验证后筛选得到的。

在本发明的第二方面,还提供上述一段来源于细粒棘球绦虫的游离DNA序列的筛选方法,包括如下步骤:

第一步,通过重测序技术从囊型包虫病病人血样中得到大量游离DNA序列;

第二步,通过生物信息学方法分析比对从中筛选出来源于细粒棘球绦虫的虫源游离DNA序列;

第三步,再通过荧光定量PCR方法在包虫病病人和健康人中验证后筛选得到。

作为本发明优选的技术方案,第一步具体包括如下步骤:

(1)采用试剂盒对包虫病病人新鲜血浆游离DNA进行提取;

(2)对电泳检测合格的DNA样本进行文库构建;

(3)文库检验合格后进行双端测序。

作为本发明优选的技术方案,第二步具体包括如下步骤:

(1)首先用预处理软件Trimmomatic进行数据过滤,去掉低质量数据,获得清洁测序数据;

(2)然后将上述数据与参考基因组比对:先将清洁测序数据序列比对细粒棘球绦虫参考基因组信息,提取比对上的序列,与人参考基因组比对,将比对到人基因组的序列剔除,再与细粒棘球绦虫参考基因组比对,得到来源于细粒棘球绦虫的游离DNA序列;

(3)对比6份来自不同囊型包虫病病人血样通过上述步骤(2)获得的数据中的游离DNA序列,提取在6份病人血样中均存在且丰度较高的游离DNA序列,得到候选游离DNA序列。

作为本发明优选的技术方案,第三步具体包括如下步骤:用包虫病病人和健康人血样作为阳性和阴性对照,通过荧光定量PCR方法对第二步筛选得到的虫源游离DNA序列的敏感性和特异性逐一进行验证,筛选出敏感性和特异性最优的一段游离DNA序列。

作为本发明优选的技术方案,第三步中,所述荧光定量PCR法中针对SEQ ID NO.3所示序列采用的PCR引物序列为:

F:GCAAGATCTTCACGAGCCTC,如SEQ ID NO.21所示;

R:CACAAGTTTGATCTTATGTACGGCA,如SEQ ID NO.22所示。

作为本发明优选的技术方案,第三步中,所述荧光定量PCR方法的反应条件为:95℃预变性10min,95℃变性15sec,40个循环;60℃退火30sec,40个循环。

作为本发明优选的技术方案,第三步中,所述荧光定量PCR方法的反应体系包括:2×荧光定量试剂盒(罗氏)FastStart Universal SYBR Green Master(ROX)5μl;ddH2O 3.4μl;上游引物0.3μl;下游引物0.3μl;DNA模板1μl。

在本发明的另一方面,提供所述的一段来源于细粒棘球绦虫的游离DNA序列在制备包虫病诊断和检测产品中的应用。所述诊断和检测产品包括生物检测领域中各种常见的产品,如基因芯片、试剂盒、核酸检测试剂等。

与现有技术相比,本发明具有如下有益效果:

1.敏感性和特异性高,本发明基于寄生虫源的特异游离DNA为检测靶标,经包虫病病人和健康人血样验证,特异性和敏感性都较高;

2.重复性好,本发明采用的荧光PCR检测方法,反应体系和反应条件都较为稳定,阳性样本检出重复性好;

3.效率高,拿到待测样本从提取游离DNA到荧光定量PCR检测完成得到结果只需2小时左右,且可一次性检测近百个样品,实现大通量检测。

本发明所述游离DNA的筛选是基于基因组学重测序技术,因此筛选得到的候选游离DNA序列量非常大(丰度较高的候选序列超过200条,对其中63条序列进行了验证,本申请中列出了20条序列的验证结果)。敏感性和特异性的验证需用荧光定量PCR方法逐条序列验证,根据每条候选游离DNA序列的特征设计特异性检测引物,而候选游离DNA序列短,GC含量不一,可能含有大量重复序列,引物设计需要多次摸索和优化以保证检测灵敏度。针对每条候选序列,采用了阴性和阳性对照共16个样品进行验证,并平行检测2次,总体工作量非常大,最终筛选得到敏感性和特异性都较高的SEQ ID NO.3所示序列。

本发明公开了一段来源于细粒棘球绦虫的游离DNA序列,上述游离DNA序列作为检测靶标经荧光定量PCR法在包虫病病人及健康人血浆样本中进行验证,检测结果显示该游离DNA序列在包虫病病人检测中具有较高的敏感性和特异性,可应用于基于核酸检测的诊断或检测试剂盒等的研制,在包虫病诊断和检测领域有很好的应用前景。

具体实施方式

以下实施例仅用于说明本发明而不用于限制本发明的范围。实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的条件。

本申请通过重测序技术从囊型包虫病病人血样中得到了大量游离DNA序列,通过生物信息学方法分析比对从中筛选出来源于细粒棘球绦虫的虫源游离DNA序列,再用包虫病病人和健康人血样作为阳性和阴性对照通过荧光定量PCR方法对上述虫源游离DNA序列的敏感性和特异性逐一进行验证,筛选出敏感性和特异性最优的一段游离DNA序列,具体实施方式如下:

实施例1细粒棘球绦虫来源的游离DNA序列的获取

1.1重测序血浆样本来源

采自6名囊型包虫病确诊病人新鲜血浆,包虫病病人由临床影像学诊断,均符合手术指征,于手术前采集血样,手术后经病理诊断确诊为囊型包虫病病人。

1.2重测序

1.2.1血浆样本游离DNA提取

采用QIAGEN公司QIAamp Circulating Nucleic Acid Kit对上述包虫病病人新鲜血浆游离DNA进行提取。电泳检测合格后进行建库。

1.2.2文库构建

检测合格的DNA样本用Covaris超声波核酸剪切仪随机打断成350bp的片段,采用TruSeq DNA LT Sample Prep Kit试剂盒进行建库,DNA片段经过末端修复,加多聚A尾巴,加测序接头、纯化、PCR扩增等步骤,最终完成文库构建。

1.2.3测序

文库检验合格后委托上海欧易生物医学科技有限公司利用测序仪进行双端测序。

1.3生物信息学分析

测序数据下机后,首先用预处理软件Trimmomatic进行数据过滤,去掉低质量数据,获得清洁测序数据,然后将此数据与参考基因组比对。样本血浆游离DNA中混有人及细粒棘球绦虫两个物种的DNA,先将清洁测序数据序列比对细粒棘球绦虫(Echinococcusgranulosus)参考基因组信息,提取比对上的序列,与人参考基因组比对,将比对到人基因组的序列剔除,再与细粒棘球绦虫参考基因组比对,得到来源于细粒棘球绦虫的游离DNA序列。6名囊型包虫病病人血样共获得6组虫源游离DNA序列数据,对比6组数据中的游离DNA序列,提取在此6组数据中均存在且丰度较高的游离DNA序列,得到候选游离DNA序列。因获得的候选序列信息巨大,在此仅列出部分序列,见表1:

表1

实施例2游离DNA序列敏感性和特异性的验证

2.1标准血样作为阳性和阴性对照

8份囊型包虫病病人血浆,包虫病病人由临床影像学诊断,均符合手术指征,于手术前采集血样,手术后经病理诊断确诊为囊型包虫病病人,该8份血浆采用QIAGEN公司QIAamp Circulating Nucleic Acid Kit试剂盒提取游离DNA,作为阳性对照;

8份健康人血浆,与包虫病病人来自同一包虫病流行区,经体检无任何异常指标,血样经寄生虫ELISA检测,均为阴性,该8份血浆采用QIAGEN公司QIAamp CirculatingNucleic Acid Kit试剂盒提取游离DNA,作为阴性对照。

2.2荧光定量PCR检测

以阳性对照和阴性对照为模板,以实施例1的1.3所述候选游离DNA序列(参见表1)为检测靶标,根据序列设计特异引物,通过荧光定量PCR法逐一进行检测。

罗氏荧光定量PCR检测试剂盒:FastStart Universal SYBR Green Master(ROX);

荧光定量PCR反应体系:

荧光定量PCR反应条件:

95℃ 0min

95℃ 15s 40循环

60℃ 30s 40循环

2.2.1检测结果

表2-表3中1-20表示实施例1的1.3中所述序号为SEQ ID NO.1-SEQ ID NO.SEQ IDNO.20的游离DNA序列,P1-P8为阳性对照1-8,N1-N8为阴性对照1-8,荧光定量PCR结果为Ct值,显示Undetermined为阴性,显示为数值的为阳性,每条游离DNA序列平行检测两次,两次结果均为阴性的视为扩增阴性,两次结果均为阳性的视为扩增阳性,阳性对照中一次阳性一次阴性视为阴性,阴性对照中一次阳性一次阴性视为阳性。荧光定量PCR结果如下表2-表3所示,因检测数量多,仅列出部分序列的检测结果:

表2

表3

以实施例1的1.3所述游离DNA序列为检测靶标,以包虫病病人血样和健康人血样为阳性和阴性对照,有效检测结果应为在阳性对照中为扩增阳性,在阴性对照中为扩增阴性。通过以上表2-表3结果可看出,以编号为3(即SEQ ID NO.3)的游离DNA序列为检测靶标的检测结果是有效的,且效果最佳,在8份阳性对照病人血样中扩增阳性5份,扩增阴性3份;在8份阴性对照健康人血样中,扩增阳性1份,扩增阴性7份。可见,在大量的候选游离DNA序列中发明人出乎意料地筛选到SEQ ID NO.3所示游离DNA序列的检测效果最佳。所述荧光定量PCR法中针对SEQ ID NO.3所示序列采用的PCR引物序列为:F:GCAAGATCTTCACGAGCCTC,如SEQ ID NO.21所示;R:CACAAGTTTGATCTTATGTACGGCA,如SEQ ID NO.22所示。

2.2.2敏感性和特异性

敏感性=真阳性病人数/病人血样数×100%

特异性=真阴性病人数/健康人血样数×100%

表4为编号1-20(即SEQ ID NO.1-SEQ ID NO.20)的游离DNA序列的敏感性和特异性对比数据。

表4

以上表4的结果可说明编号3的来源于细粒棘球绦虫的游离DNA序列与其他编号序列相比,作为检测靶标在包虫病检测和诊断中具有较高的敏感性和特异性,从表4的结果来看,特异性达到100%的有五段序列,分别为编号1、编号9、编号10、编号11、编号18;这五段序列中,编号9和编号11的敏感性为0%,编号1和编号18的敏感性为25.0%,编号10的敏感性为37.5%。敏感性达到100%的有两段序列,分别为编号4和编号6,但特异性分别为25.0%和12.5%。综合来看,编号3的敏感性为62.5%,特异性为87.5%,高于其他序列,达到了预料不到的技术效果,因此编号3的来源于细粒棘球绦虫的游离DNA序列在包虫病诊断和检测领域有着开发应用潜力。

综上所述,上述各实施例仅为本发明的较佳实施例而已,并不用以限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,皆应包含在本发明的保护范围内。

序列表

<110>中国疾病预防控制中心寄生虫病预防控制所(国家热带病研究中心)

<120>一段来源于细粒棘球绦虫的游离DNA序列及其应用

<130> WH-NP-20-100685

<160> 22

<170> PatentIn version 3.5

<210> 1

<211> 131

<212> DNA

<213> 人工序列(未知)

<400> 1

gatggatgga tggatggatg gatggatgga tggatggatg gatggatgga tggatggatg 60

gatggatgga tggatggatg gatggatgga tggatggatg gatggatgga tggatggatg 120

gatggatagg n 131

<210> 2

<211> 114

<212> DNA

<213> 人工序列(未知)

<400> 2

aatgaacggg cagcaatatt tcaaatctgt ctgaaaacaa ggagaacgaa aatgacctaa 60

cttttaaggc atactttttg atgaatgaga tcacactaag tagtctccac ttga 114

<210> 3

<211> 101

<212> DNA

<213> 人工序列(未知)

<400> 3

gcaagatctt cacgagcctc agagaattca ccttcttcca tgccttcacc gacgtaccaa 60

tgaacgaatg cacgcttgcc gtacataaga tcaaacttgt g 101

<210> 4

<211> 142

<212> DNA

<213> 人工序列(未知)

<400> 4

tttcacgcac tctttactct ctcttcagag tacttttcaa ctttccctca cggtacttgt 60

ccgctatcgg actcgtgcct gtatttagcc ttggatggag tttaccaccc actttgggct 120

gcaatctcaa acaacccgac tc 142

<210> 5

<211> 106

<212> DNA

<213> 人工序列(未知)

<400> 5

ggaggaggta gtggtggtgg tggtggttga aaggcgtttg gatagaggca cgtctcaatg 60

gaagacgatc gaccactgga aaagtagtgc tccaacccag ctgctg 106

<210> 6

<211> 147

<212> DNA

<213> 人工序列(未知)

<400> 6

aatttccgca tcaagcaatt tgtcaagcga tttaaatttt ggtctagatg tctttggctc 60

ataaatggac gtacattccc gctagaaaca ctgaaaagcc gacaataata tttaaattaa 120

tattggggaa cacaagtctg atttatt 147

<210> 7

<211> 126

<212> DNA

<213> 人工序列(未知)

<400> 7

aaggcatgaa accgcatagc ctaggcagga accctcccca caaattgcga ttatttatga 60

tgcatactga tcgtgtgcct cggtgcagag actgaattaa cgattcttag gcatagtgcg 120

tggtcg 126

<210> 8

<211> 136

<212> DNA

<213> 人工序列(未知)

<400> 8

agaggtggga gggtaaggag atgtaatagg aactaggtct gacattcccc acccatgccc 60

atatctcaat tggtaaaggt agtcagccga accggaaacg gaagcaaccg cttctggctg 120

gaggttttca attctt 136

<210> 9

<211> 130

<212> DNA

<213> 人工序列(未知)

<400> 9

ggccgcctca aacaccaatt ccagcatgta accttgagac ctaaaatcaa ctctactcaa 60

ggtagaaagt agaagtaact cttagctcct ctattttagg cggacaaagg cacagaaacc 120

gtccagtccc 130

<210> 10

<211> 129

<212> DNA

<213> 人工序列(未知)

<400> 10

gagcctttac tgctgcccat tagatctcat gaatcacagt gggaacatcc taactggttt 60

aagctcacga taaagacaga acaatgaact aagcgtcgca acaatcccca tggatgatcg 120

gatttgcta 129

<210> 11

<211> 82

<212> DNA

<213> 人工序列(未知)

<400> 11

cacagacaaa cacagacaaa acttgcagtc agatggccaa ggagcttaag ttcaacgtct 60

gctaattgtt tgcgaaatgc ac 82

<210> 12

<211> 112

<212> DNA

<213> 人工序列(未知)

<400> 12

agcagagctt ctccttaatg tcacgcacta tttcgcgctc agcagtggtg gtgaacgagt 60

aacctcgctc agtcaagatc ttcatgaggt agtcagtcag atcacgacca gc 112

<210> 13

<211> 101

<212> DNA

<213> 人工序列(未知)

<400> 13

tgactaattg accaatcaga gcgagaagga cttggcggaa ggtctaacga tgcaatgttc 60

ggagagagaa gctcgtagaa acactcatca gtctatcggt a 101

<210> 14

<211> 96

<212> DNA

<213> 人工序列(未知)

<400> 14

aaaatcgccg ctatggtgac aagctctggc gtcacacaca cacgtccagt tggttagcca 60

gccagttagc tagccagcta gatatggagg gtgcca 96

<210> 15

<211> 102

<212> DNA

<213> 人工序列(未知)

<400> 15

ttaatgatgt ctacagaatc gacaaagagt gaaagtcagg atagtaactg tgattaatct 60

ctaaattagt ttaaaggaga agatatcaac taatgagata aa 102

<210> 16

<211> 107

<212> DNA

<213> 人工序列(未知)

<400> 16

cgcctccgcg tttgccctcc aattccgctg cccaggttac agagtggccg agcctaacgg 60

acgccgacgc cgattcagac gaggcacagc atcggcgccg ctgcgaa 107

<210> 17

<211> 96

<212> DNA

<213> 人工序列(未知)

<400> 17

aacgaggaat tcctagtaag tgcaggtcat aagcttgcgc tgattacgtc cctgcccttt 60

gtacacaccg cccgtcgcta ctaccgattg aatggt 96

<210> 18

<211> 142

<212> DNA

<213> 人工序列(未知)

<400> 18

gagtcgggtt gtttgagatt gcagcccaaa gtgggtggta aactccatcc aaggctaaat 60

acaggcacga gtccgatagc ggacaagtac cgtgagggaa agttgaaaag tactctgaag 120

agagagtaaa gagtgcgtga aa 142

<210> 19

<211> 112

<212> DNA

<213> 人工序列(未知)

<400> 19

ctaaagctaa atattggccg gagaccgata gcacacaagt agagtgatcg aaagatgaaa 60

agcactttga aaagagagtt aaacagcacg tgaaattgtt gaaagggaag cg 112

<210> 20

<211> 132

<212> DNA

<213> 人工序列(未知)

<400> 20

tgttgggacc cgaaagatgg tgaactatgc ctgaataggg tgaagccaga ggaaactctg 60

gtggaggctc gcagcggttc tgacgtgcaa atcgatcgtc aaatttgggt ataggggcga 120

aagactaatc ga 132

<210> 21

<211> 20

<212> DNA

<213> 人工序列(未知)

<220>

<221> misc_feature

<223> 引物

<400> 21

gcaagatctt cacgagcctc 20

<210> 22

<211> 25

<212> DNA

<213> 人工序列(未知)

<220>

<221> misc_feature

<223> 引物

<400> 22

cacaagtttg atcttatgta cggca 25

技术分类

06120113811602