掌桥专利:专业的专利平台
掌桥专利
首页

一种基于UMI技术的肺癌患者外周血基因突变检测分析方法

文献发布时间:2023-06-19 19:28:50



技术领域

本发明属于基因检测技术领域,具体涉及一种基于UMI技术的肺癌患者外周血基因突变检测分析方法。

背景技术

根据CAP/IASLC/AMP联合发布更新的2018版非小细胞肺癌患者分子检测指南,肺癌的分子标志物可分为3类:

1.必须检测的分子标志物:包括EGFR,ALK和ROS1,对于肿瘤组织中含有腺癌成分的肺癌患者,要进行常规检测。

2.应该检测的分子标志物:包括BRAF,MET,HER2,KRAS和RET,大的靶向测序应该包括这些基因,检测结果可以指导患者参加临床试验,但对于只能进行单基因检测的实验室,不推荐常规检测。

3.正在研究中的潜在分子标志物:目前不推荐临床常规检测。

目前检测肺癌基因突变常见的方式是:(1)一代测序检测若干肺癌相关基因热点;(2)NGS小panel针对肺癌相关若干基因进行靶向扩增/杂交捕获结合测序检测。

这两种方法的局限性在于突变频率检出阈值过高(一代测序:20%,常规NGS突变检测:1%-5%),因此主要应用于肿瘤组织的突变检测。对于肺癌患者外周血中游离肿瘤DNA(ctDNA)突变检出效果不佳(ctDNA由于人体正常细胞的DNA稀释,突变频率可下探到0.1%甚至以下)。

发明内容

针对上述存在的问题,本发明的目的是提供一种基于UMI技术的肺癌患者外周血基因突变检测分析方法,根据肺癌及相关病症相关的基因和位点设计捕获探针,并在建库引物上加入UMI(unique molecular identifiers)单分子标签,对样本进行杂交捕获及高深度测序(>20000X),对下机数据进行比对后根据比对位置和UMI序列进行去UMI处理及后续的突变检测,此方法能有效检出肺癌患者外周血中ctDNA的突变,应用于患者取不到肿瘤组织时需要检测突变的情况,能极大增加肺癌患者基因检测采样的便利性及依从性,对于肺癌患者的诊疗有较大帮助。

为了实现上述目的,本发明的技术方案如下:

一种基于UMI技术的肺癌患者外周血基因突变检测分析方法,其特征在于,包括以下步骤:

S1、通过探针捕获的方法提取正常样本和突变样本的DNA,进行建库和测序,得到原始样本fq数据;

S2、对原始样本fq数据通过fastp预处理,除去低质量reads及接头污染reads,并且将reads序列中umi信息提取至fq reads ID栏;

S3、对步骤S2得到的样本数据通过bwa mem比对至参考基因组,通过gencore软件对原始bam文件去umi处理,然后通过GATK best practice对bam文件进行碱基质量重校正,得到供变异检测的样本数据bam文件;

S4-1、采用Mutect2对样本数据bam文件进行体细胞突变检测,采用LUMPY软件对样本数据bam文件进行融合基因检测,得到vcf结果文件及过滤后的变异列表;

S4-2、采用MSIsensor-pro软件对样本数据bam文件进行MSI状态检测,得到MSI信息;

S5、分析S4-1、S4-2中得到的文件信息,生成检测报告。

作为本发明的进一步优选,在步骤S1前还包括步骤:S0、选定肺癌基因捕获区域,生成bed文件。

作为本发明的进一步优选,步骤S1中探针捕获的探针序列设计包括:根据bed文件,通过catch软件设计多个探针序列,将设计的探针序列通过blastn软件和参考基因组比对,找出多处比对到参考基因组的序列去除,得到探针序列。

作为本发明的进一步优选,步骤S4-1中,体细胞突变检测包括:建立正常样本的数据集作为本底过滤,分析并过滤无意义和良性的胚系变异;融合基因检测包括:以正常样本作为基线来去除背景变异。

作为本发明的进一步优选,步骤S0中肺癌基因捕获区域根据数据库和指南中肺癌相关基因和关键区域得到。

综上所述,本发明具有以下有益效果:

本发明提供的检测分析方法囊括了肺癌及相关病症的绝大部分基因和位点,能检出低至0.1%的体细胞突变位点,因此可应用于外周血样本的检测,并且可在缺少正常对照组织的情况下准确评估患者MSI信息,相比传统肺癌检测方法具有样本要求低、操作便捷、检测费用适中和检测范围广(包含SNV/INDEL/ SV/MSI等变异类型)等优点。

具体实施方式

一种基于UMI技术的肺癌患者外周血基因突变检测分析方法

1.探针序列的设计

(1)根据clinvar数据库和NCCN指南中关于肺癌相关基因和关键区域从而确定目标捕获区域,生成捕获区域bed文件。其中,clinvar数据库和NCCN指南为本领域技术人员的公知常识,故不再赘述。

(2)根据生成的bed文件和hg19参考基因组,通过catch软件设计目标区域探针序列(参考文献:Metsky H C , Siddle K J , Gladden-Young A , et al. Capturingsequence diversity in metagenomes with comprehensive and scalable probedesign[J]. Nat Biotechnol, 2019:160-168.)。其中,catch软件运行方法如下:

(3)设计出的探索序列通过blastn软件和hg19比对,找出多处比对到hg19的序列去除,得到探针序列如表1所示。

2. 基于UMI单分子标签技术的肺癌基因突变检测分析方法

S1、对正常样本和标准突变样本采用探针捕获的方法对正常样本和标准突变样本提取的DNA进行建库和测序,得到原始样本fq数据。

S2、将得到的原始样本fq数据根据正常样本和标准突变样本进行拆分。对所有的原始样本fq数据通过fastp预处理,除去低质量reads及接头污染reads,并且将reads序列中umi信息提取至fq reads ID栏,(预处理的方法参考文献为:Chen S , Zhou Y , Chen Y, et al. fastp : an ultra-fast all-in-one FASTQ preprocessor. 2018)。

S3、对步骤S2得到的样本数据通过bwa mem比对至hg19,通过gencore软件对原始bam文件去umi处理,然后使用GATK best practice对所得bam文件进行碱基质量重校正,得到供变异检测的样本数据bam文件,(bwa为目前主流短序列比对软件,具体检测方法参考文献:Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics. 2009)。

S4、体细胞突变检测、融合基因检测以及MSI信息检测

a.采用Mutect2对样本数据bam文件进行体细胞突变检测(snv/indel):建立正常样本的数据集作为本底过滤(PoN, Panel of Normals),分析并过滤无意义/良性的胚系变异,(Mutect2为GATK软件其中一个分析模块,具体检测方法参考文献: Mckenna, A ,Hanna, M , Banks, E, Sivachenko, A. , & Cibulskis, K. . The Genome AnalysisToolkit: A MapReduce framework for analyzing next-generation DNA sequencingdata.)。

b.采用LUMPY软件对样本数据bam文件进行融合基因检测:以正常样本作为基线来去除背景变异,(检测方法参考文献:Layer R M , Hall I M , Quinlan A R . LUMPY: Aprobabilistic framework for structural variant discovery[J]. 2012)。

c.采用MSIsensor-pro软件在正常样本数据基础上检测各个样本的MSI状态(参考文献为:Jia P , Yang X , Guo L , et al. MSIsensor-pro: Fast, Accurate, andMatched-normal-sample-free Detection of Microsatellite Instability[J]. 基因组蛋白质组与生物信息学报:英文版, 2020(1):7)。其中,结果大于等于10%即为MSI-H,小于10%为MSI-L。

S5、通过实验室内部积累的肺癌临床相关突变解读数据集及报告程序,读取信息分析步骤S4中变异结果及MSI信息,自动生成临床检测报告。

以上S2-S4步骤中分析流程均已封装成自动化流程,运行时仅需提供下机文件fq列表即能自动化运行程序并输出结果。

实施例

选取一例突变标准品:实验室编号40-2-2(菁良,#GW-OCTM009,肿瘤SNV 0.1%gDNA标准品),采用上述实验分析步骤,得到的突变列表如下所示:

如结果所示,本发明采用的分析方法能检出标准品中所有低频致病性突变,检出率达到100%,且测得突变频率较为接近。

本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。

表1.探针序列表

/>

/>

/>

/>

。/>

技术分类

06120115926434