掌桥专利:专业的专利平台
掌桥专利
首页

烟草依赖个体化干预基因变异位点筛选方法及试剂盒

文献发布时间:2024-04-18 19:58:26


烟草依赖个体化干预基因变异位点筛选方法及试剂盒

技术领域

本发明涉及生物信息学的技术领域,尤其涉及一种烟草依赖个体化干预基因变异位点筛选方法,以及利用该烟草依赖个体化干预基因变异位点筛选方法的试剂盒。

背景技术

已经有大量的研究证实了吸烟可以引起很多疾病,比如呼吸系统疾病、消化系统疾病、心脑血管疾病等。长期吸烟,烟草中的有害物质会侵害呼吸道和肺部,导致各种呼吸系统疾病。例如,吸烟是慢性支气管炎、肺气肿和慢性阻塞性肺疾病的主要诱因之一。而且吸烟会增加肺癌的发病几率。长期大量吸烟还会对消化系统造成不良的影响。食管壁、胃肠粘膜等长期受到烟草的不良刺激,会增加患反流性食管炎、急慢性胃炎、十二指肠溃疡、胃溃疡、胃癌、食道癌等疾病的风险。长期抽烟还可对身体的血管造成进行性的损害,增加患高血压、冠心病、脑卒中、动脉粥样硬化等心脑血管疾病的风险。

吸烟可以成瘾,称为烟草依赖。导致烟草依赖和治疗药物疗效差异的影响因素众多,研究显示遗传因素具有重要的作用,烟草依赖与数百个基因变异相关。烟草依赖相关的慢性病随着烟龄的累积而逐渐显现。吸烟人群患肺癌的风险是不吸烟人群的25倍,患冠心病或卒中的风险是不吸烟者的2~4倍。如果40岁前戒烟,烟草依赖相关疾病的死亡风险降低约90%。

实现永久戒烟十分困难,需要30甚至更多次的尝试才能实现。3%~5%的吸烟者在尝试戒烟后达到6~12个月不吸烟,大部分人会在尝试戒烟后8天内复吸,急性戒断症状(如难以集中注意力,以及焦虑、悲伤、愤怒、沮丧、易怒、失眠和饥饿感加重)和渴望吸烟(烟瘾)是导致戒烟失败的主要原因。戒断症状在一个人尝试戒烟后2天内达到顶峰,并在停止吸烟后1周内大大减轻,但烟瘾往往持续存在并导致复吸。停止吸烟后的1年内,复吸率高达10%,2年后降至2%~4%。此外,远期复吸也有可能发生。

目前有3种能够增加长期戒烟效果的一线临床戒烟用药,包括非处方戒烟药尼古丁替代疗法(nicotine replacement therapy,NRT)(如尼古丁咀嚼胶、和尼古丁贴剂)和2种处方类戒烟药(盐酸安非他酮缓释片和酒石酸伐尼克兰)。我国目前常用的一线戒烟药物有盐酸安非他酮缓释片、酒石酸伐尼克兰以及尼古丁咀嚼胶。

不同的药物对不同烟草依赖者产生不同的疗效以及副作用,而研究表明这种差异是由烟草依赖患者的基因型差异所导致的。多项双生子研究结果显示,尼古丁依赖与遗传相关,其中遗传因素作用约占59%,进一步Meta分析显示,尼古丁依赖还存在性别差异,男女性别遗传因素分别为59%和46%,可见遗传因素在治疗烟草依赖的药物疗效差异中的重要作用。但是,目前尚无可以根据患者的基因型精确地预测应该使用哪种戒烟药物的方法。

发明内容

为克服现有技术的缺陷,本发明要解决的技术问题是提供了一种烟草依赖个体化干预基因变异位点筛选方法,该方法能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。

本发明的技术方案是:这种烟草依赖个体化干预基因变异位点筛选方法包括以下步骤:

(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS:

(1.1)数据质控,利用Trimmomatic和BBTools组件中的bbduk.sh脚本来获得高质量的有效数据;

(1.2)数据比对;

(1.3)变异位点鉴定,得到百万级别的SNP位点;

(1.4)使用PLINK软件并结合上一步处理好的SNP位点,使用logistic回归模型对BED文件进行分析,获得GWAS summary数据;

(2)在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;

(3)通过连锁不平衡分析,将文献中的位点和GWAS数据中得到的位点构建连锁不平衡模块,获得能代表模块的标签位点,通过GWAS数据佐证文献筛选出的位点的重要性;

(4)最终入选了重要的文献位点和标签位点。

本发明根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS,在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点,结合文献中的位点和GWAS数据中得到的位点,得到最终的候选位点和基因,因此能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。

还提供了烟草依赖个体化干预基因变异位点筛选方法的试剂盒,本试剂盒应用在戒烟药物的选择上,通过构建样本DNA测序预文库,并使用特异探针对文库进行目标区域捕获富集,捕获后的文库通过高通量测序,实现多个基因多种突变的一次性检测;

试剂盒A部分组分如下:

试剂1:组分名称为末端修复液,成分包括Tris,规格和数量为96 µL×1管;

试剂2:组分名称为末端修复酶,成分包括末端修复酶,规格和数量为192 µL×1管;

试剂3:组分名称为连接缓冲液,成分包括Tris、ATP、二硫苏糖醇,规格和数量为384 µL×1管;

试剂4:组分名称为连接酶,成分包括T4连接酶,规格和数量为192 µL×1管;

试剂5:组分名称为接头,成分包括寡核苷酸,规格和数量为5 µL×32管;

试剂6:组分名称为引物,成分包括寡核苷酸,规格和数量为70 µL×1管;

试剂7:组分名称为扩增液,成分包括Tris、dNTPs、DNA 聚合酶,规格和数量为1390µL×2管;

试剂8:组分名称为封闭液,成分包括寡核苷酸,规格和数量为176 µL×1管;

试剂9:组分名称为杂交液,成分包括吐温、硫酸葡聚糖,规格和数量为672 µL×1管;

试剂10:组分名称为杂交增强剂,成分包括甲酰胺,规格和数量为215 µL×1管;

试剂11:组分名称为捕获探针,成分包括寡核苷酸,规格和数量为211 µL×1管;

试剂12:组分名称为洗杂液SW,成分包括乙二胺四乙酸二钠盐,规格和数量为1152µL×1管;

试剂13:组分名称为洗杂液1,成分包括十二烷基硫酸钠,规格和数量为960 µL×1管;

试剂14:组分名称为洗杂液2,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;

试剂15:组分名称为洗杂液3,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;

试剂16:组分名称为磁珠清洗液,成分包括Tris、EDTA、氯化钠,规格和数量为1415µL×4管;

试剂17:组分名称为标签,成分包括寡核苷酸,规格和数量为4 µL×32管;

试剂18:组分名称为阳性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;

试剂19:组分名称为阴性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;

试剂盒B部分:

试剂20:组分名称为捕获磁珠,成分包括链霉亲和素磁珠,规格和数量为1760 µL×1管。

附图说明

图1为根据本发明的烟草依赖个体化干预基因变异位点筛选方法的流程图。

具体实施方式

如图1所示,这种烟草依赖个体化干预基因变异位点筛选方法包括以下步骤:

(1)根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS(GenomeWide Association Study,全基因组关联分析,使用全基因组测序的方式来找到疾病的相关位点的一种方法):

(1.1)数据质控,利用Trimmomatic(github.com/usadellab/Trimmomatic)和BBTools组件中的bbduk.sh(Version 38.93)脚本来获得高质量的有效数据;

(1.2)数据比对;

(1.3)变异位点鉴定,得到百万级别的SNP(单核苷酸多态性)位点;

(1.4)使用PLINK软件并结合上一步处理好的SNP位点,使用logistic回归模型(二分类模型)对BED文件进行分析,获得GWAS summary数据;

(2)在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点;

(3)通过连锁不平衡分析,将文献中的位点和GWAS数据中得到的位点构建连锁不平衡模块,获得能代表模块的标签位点;

(4)最终入选了重要的文献位点和标签位点。

本发明根据戒烟药物的不同将下机数据分为三组:酒石酸伐尼克兰组,盐酸安非他酮组,以及尼古丁替代疗法组,每组分别进行如下步骤的全基因组关联分析GWAS,在文献中筛选候选烟草的位点,根据位点证据的强弱,制定证据等级,根据不同的证据等级,对文献中的位点进行分类,选择证据等级最高的位点,结合文献中的位点和GWAS数据中得到的位点,得到最终的候选位点和基因,因此能够针对患者的基因和位点精确地预测烟草依赖者应该使用哪种药物。

优选地,所述步骤(1.1)中,过滤条件为:去掉接头;去掉3'和5'端质量值低于3的碱基;设置4碱基长的滑窗,如果每个碱基的平均质量值低于15则去掉;将长度少于36 bp的reads移除;通过FastQC软件 (http://www.bioinformatics.babraham.ac.uk/projects/fastqc)过滤后检查测序数据质控后的质量。

优选地,所述步骤(1.2)包括以下分步骤:

(1.2.1)利用BWA软件中的MEM模块(http://bio-bwa.sourceforge.net)进行比对,使用默认参数,将质控得到高质量的数据比对到参考基因组,参考基因组为UCSC的hg38,该方法在大于70-150 bp reads的比对上优于BWA的SW及backtrack模块;

(1.2.2)通过SAMtools 的sort命令(www.htslib.org)对原始比对结果进行排序得到 BAM 格式的文件;

(1.2.3)使用Picard (broadinstitute.github.io/picard/)的默认参数去除光学和PCR重复,得到最初的比对结果。

优选地,所述步骤(1.3)包括以下分步骤:

(1.3.1)使用GATK4的 HaplotypeCaller模块选择默认参数得到原始的突变信息;

(1.3.2)使用GATK4的SelectVariants模块分开SNV及INDEL;

(1.3.3)使用GATK4的VariantFiltration模块过滤低质量的突变位点,得到包含准确SNP信息的vcf文件;参数具体如下:

QD < 2.0 || FS > 60.0 || MQ < 40.0 || MQRankSum < -12.5 ||ReadPosRankSum < -8.0 , indels:QD < 2.0 || FS > 200.0 || ReadPosRankSum < -20.0,QaulByDepth (QD),FisherStrand (FS), RMSMappingQuality (MQ),MappingQualityRankSumTest (MQRankSum), ReadPosRankSumTest (ReadPosRankSum);

(1.3.4)使用GATK4的GenotypeGVCFs模块基于dbSNP138数据库进行SNP注释,给每个SNP标注了rs号;

(1.3.5)使用PLINK v1.90b6.21 64-bit (zzz.bwh.harvard.edu/plink)对得到的SNP的vcf数据进行位点及样本质控。

优选地,所述步骤(1.3.5)包括以下分步骤:

(1.3.5.1)删除在样本中缺失率大于5%的SNP位点;

(1.3.5.2)删除缺失率大于2%的样本,共有2个样本被移除;

(1.3.5.3)通过哈德温伯格平衡进行过滤,阈值为P值< 10

(1.3.5.4)最小等位基因频率过滤,阈值为MAF < 0.01;

(1.3.5.5)使用snpEff软件对所有位点进行基因和功能注释;

(1.3.5.6)使用LDBlockShow程序进行位点间的连锁不平衡分析。

优选地,所述步骤(2)中,证据等级包括位点的P值,OR值,MAF,样本量,文献报道的次数。感兴趣的候选基因包括Chr15q25(包括CHRNA5、CHRNA3和CHRNB4基因簇)、剩余的nAChR亚基基因、编码varenicline转运体(SLC22A2)的基因和血清靶点。酒石酸伐尼克兰对烟碱受体有很高的选择性,但也显示出对5-HT3的和其他常见的烟碱受体中等亲和力。针对尼古丁的不同药物,总结的每种药物的易感基因如下,目前比较被公认的跟烟瘾有关的基因也同样列在其中。

优选地,所述步骤(2)中,基因包括:尼古丁和安非他酮代谢相关CYP2A6, CYP2B6;尼古丁受体CHRNA1, CHRNA2, CHRNA3,CHRNA4, CHRNA5, CHRNA6,CHRNA7, CHRNA9,CHRNA10,CHRNB1, CHRNB2, CHRNB3,CHRNB4, CHRND, CHRNE, CHRNG;酒石酸伐尼克兰转运以及酒石酸伐尼克兰的其他目标LC22A2 (OCT8), HTR3A, HTR3B。

优选地,所述步骤(3)中,最终的候选位点和基因如下:

rs588765,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,NRT;

rs578776,对应基因是CHRNA3; CHRNA5,对应药物是NRT;

rs4680,对应基因是COMT;MIR4761,对应药物是NRT;

rs1800497,对应基因是ANKK1,对应药物是盐酸安非他酮,NRT;

rs1799971,对应基因是OPRM1,对应药物是NRT;

rs1799732,对应基因是DRD2;LOC105369501,对应药物是盐酸安非他酮,NRT;

rs16969968,对应基因是CHRNA5,对应药物是酒石酸伐尼克兰,盐酸安非他酮和NRT;

rs680244,对应基因是CHRNA5,对应药物是盐酸安非他酮;

CYP2A6*4,对应基因是CYP2A6,对应药物是盐酸安非他酮,NRT;

rs2279343,对应基因是CYP2A6,对应药物是盐酸安非他酮;

rs8109525,对应基因是CYP2A6,对应药物是盐酸安非他酮。

进一步我们验证了这些位点和本发明中GWAS数据得到的显著位点的连锁不平衡,以确定本发明找到的位点的准确性。本发明中的候选位点和GWAS数据得到的显著位点高度连锁不平衡,即这些位点分别在一个GWAS数据得到的显著位点组成的区块内。

还提供了烟草依赖个体化干预基因变异位点筛选方法的试剂盒,本试剂盒应用在戒烟药物的选择上,通过构建样本DNA测序预文库,并使用特异探针对文库进行目标区域捕获富集,捕获后的文库通过高通量测序,实现多个基因多种突变的一次性检测。首先,以基因组DNA为材料,进行DNA片段化、末端修复和加A处理,使用DNA连接酶将带有单分子条码序列(Barcode)的接头连接到DNA模板的两端,经PCR扩增得到预文库;预文库与带有生物素标记的寡核苷酸探针进行液相杂交,并用链霉亲和素(Streptavidin)包被的磁珠对与探针结合的文库进行捕获富集,最后使用带有标签序列(Index)的引物和聚合酶进行PCR扩增得到捕获文库。捕获文库通过高通量测序得到测序数据,经配套的数据分析软件分析后即可得到最终的基因变异信息。

本试剂盒包含阴、阳性对照品,用来监控实验环节和数据分析环节的随机误差及系统误差。

试剂盒A部分组分如下:

试剂1:组分名称为末端修复液,成分包括Tris,规格和数量为96 µL×1管;

试剂2:组分名称为末端修复酶,成分包括打断修复酶,规格和数量为192 µL×1管;

试剂3:组分名称为连接缓冲液,成分包括Tris、ATP、二硫苏糖醇,规格和数量为384 µL×1管;

试剂4:组分名称为连接酶,成分包括T4连接酶,规格和数量为192 µL×1管;

试剂5:组分名称为接头,成分包括寡核苷酸,规格和数量为5 µL×32管;

试剂6:组分名称为引物,成分包括寡核苷酸,规格和数量为70 µL×1管;

试剂7:组分名称为扩增液,成分包括Tris、dNTPs、DNA 聚合酶,规格和数量为1390µL×2管;

试剂8:组分名称为封闭液,成分包括寡核苷酸,规格和数量为176 µL×1管;

试剂9:组分名称为杂交液,成分包括吐温、硫酸葡聚糖,规格和数量为672 µL×1管;

试剂10:组分名称为杂交增强剂,成分包括甲酰胺,规格和数量为215 µL×1管;

试剂11:组分名称为捕获探针,成分包括寡核苷酸,规格和数量为211 µL×1管;

试剂12:组分名称为洗杂液SW,成分包括乙二胺四乙酸二钠盐,规格和数量为1152µL×1管;

试剂13:组分名称为洗杂液1,成分包括十二烷基硫酸钠,规格和数量为960 µL×1管;

试剂14:组分名称为洗杂液2,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;

试剂15:组分名称为洗杂液3,成分包括十二烷基硫酸钠,规格和数量为576 µL×1管;

试剂16:组分名称为磁珠清洗液,成分包括Tris、EDTA、氯化钠,规格和数量为1415µL×4管;

试剂17:组分名称为标签,成分包括寡核苷酸,规格和数量为4 µL×32管;

试剂18:组分名称为阳性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;

试剂19:组分名称为阴性对照品,成分包括脱氧核糖核酸,规格和数量为24 µL×1管;

试剂盒B部分:

试剂20:组分名称为捕获磁珠,成分包括链霉亲和素磁珠,规格和数量为1760 µL×1管。

优选地,选取SNP上下游各500bp区域设计探针,影响探针灵敏度的主要因素包括Tm值、长度、GC含量和二级结构,影响探针特异度的主要因素包括:探针方向、探针数量、交叉杂交、复杂度和重复序列。为保证探针的捕获效率和均一性,探针设计过综合考虑了上述因素。使用网页版探针设计软件进行设计和评价探针。10个位点探针信息如下:

位点1:rs588765位于chr15:78573083,探针覆盖区域78572933—78573283;

位点2:rs578776位于chr15:78596058,探针覆盖区域78595828—78596198;

位点3:rs4680位于chr22:19963748,探针覆盖区域19963558—19963888;

位点4:rs1800497位于chr11:113400106,探针覆盖区域113399806—113400351;

位点5:rs1799971位于chr6:154039662,探针覆盖区域154039522—154039917;

位点6:rs1799732位于chr11:113475529,探针覆盖区域113475400—113475833;

位点7:rs16969968位于chr15:78590583,探针覆盖区域78590349—78590742;

位点8:rs680244位于chr15:78578946,探针覆盖区域78578679—78579173;

位点9:rs2279343位于chr19:41009358,探针覆盖区域41008970—41009659;

位点10:rs8109525位于chr19:40986013,探针覆盖区域40985711—40986221。

下面对本发明的实施方式做详细说明。

样本募集:收集来自于烟草依赖患者的血液样本,并且根据服用药物的不同分为三组。对于所有的样本分别进行DNA的提取,建库以及测序。测序平台是illumina的NovaSeq,目标深度是10x。从样本收集到建库测序的每一个步骤都进行了质量控制,对于不合格的样本可以进行及时的补充或者剔除。

1.基因组DNA提取

采用商业化试剂盒,从新鲜或冷冻的全血(用柠檬酸盐、EDTA等抗凝剂处理过的血液)样品中提取基因组DNA。

提取样本总量:适用于起始量为 5 ng~500 ng DNA 的文库构建,为了提升数据质量,建议 DNA 投入量不低于 50 ng。请使用荧光定量进行 DNA 浓度检测。

提取样本质量和纯度:经琼脂糖凝胶电泳检测可判断DNA完整性和蛋白残留情况。Nanodrop A260/A280 = 1.8-2.0;A260/A230>2.0。

2.DNA片段化

提取后的基因组DNA,加入缓冲液和DNA保护液,使用超声波打断仪将DNA打断为200bp左右的片段。

3.末端修复及加A

向打断产物中加入末端修复酶和末端修复缓冲液,混匀后放入PCR仪进行孵育;PCR程序设置:37℃,15min;65℃,30min;4℃,∞。

4.加接头

向末端加A产物中加入接头、连接酶、连接缓冲液,混匀后放入PCR仪进行孵育,20℃连接15min。

5.PCR扩增

连接产物中加入引物和PCR酶混合液,混匀后放入PCR仪进行扩增,PCR程序设置:98℃,45s;(98℃,15s;65℃,30s;72℃,30s) 11-13个循环;72℃ ,1min;4℃,∞。

6.PCR产物纯化

向扩增产物中加入1.5倍的纯化磁珠,混匀后静置;将PCR管放入磁力架中,静置,弃去液体;用现配的80%乙醇,清洗两遍;最后,加入无核酸酶水洗脱。

取1 μL文库使用 Qubit dsDNA HS Assay Kit 试剂在 Qubit 4.0 Fluorometer上进行文库浓度检测,记录文库浓度;取 1 μL 文库使用片段分析仪进行文库片段长度检测。

7.文库与探针杂交

各取500 ng文库在真空浓缩仪中进行浓缩,浓缩完成后,加入杂交反应液(探针、封闭液、杂交缓冲液配制而成),涡旋振荡以确保干燥在管底的DNA 溶解,并短暂离心;在PCR以上进行65℃过夜杂交。

8.目标区域 DNA 捕获

洗杂液置于水浴锅上完全溶解,配置成1ⅹ的工作液;提前将捕获磁珠充分混匀并置于室温平衡,用磁珠清洗液清洗三遍,加入磁珠重悬液混匀后,加入到杂交产物中,吸打混匀;置于垂直旋转混匀仪上,室温结合 30 min;捕获产物用1×的洗杂液进行清洗,最后加入无酶水洗脱,短暂涡旋重悬混匀磁珠。

9.捕获后 PCR 扩增

向重悬后的捕获磁珠中加入测序引物和扩增液,混匀后放入PCR仪进行扩增,PCR程序设置:98℃,45s;(98℃,15s;60℃,30s;72℃,30s)11-13个循环;72℃ ,1min;4℃,∞。

10.扩增后纯化

取出纯化磁珠,平衡至室温,向扩增产物中加入 1.1 倍体积的纯化磁珠混匀后静置;将PCR管放入磁力架中,静置,弃去液体;用现配的80%乙醇,清洗两遍;最后,加入无核酸酶水洗脱。

11.文库质控

取1 μL文库使用 Qubit dsDNA HS Assay Kit 试剂在 Qubit 4.0 Fluorometer上进行文库浓度测定,记录文库浓度; 取 1 μL 文库使用片段分析仪进行片段质检,片段大小应与预文库大小基本一致。

12.上机测序

使用NGS测序平台对文库进行测序,按照仪器使用说明进行150 bp Pair-End模式测序。

13.数据预处理和找突变

对于所有的下机后的fastq数据,首先使用fastqc对每一个样本进行初步的质控,查看数据的质量是否合格,包括碱基的平均质量,GC含量,N含量,Ts/Tv比例等,结果表明1246个样本质控后的数据量全部大于30G,Q30大于85%,样本平均测序深度大于10×,符合标准可用于接下来的分析。然后使用BWA进行比对得到BAM文件,比对的基因组是下载自UCSC的hg38人参考基因组,使用GATK VariantFiltration进行突变的质控,GATKhaplotypeCaller进行多样本的突变查找,最后判读样本的基因型。

依据比对结果,得到的判读样本基因型为表1(部分样本结果)。

表1

以上所述,仅是本发明的较佳实施例,并非对本发明作任何形式上的限制,凡是依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属本发明技术方案的保护范围。

相关技术
  • 高血压个体化药物治疗基因型检测SNP位点和配套试剂盒
  • 预测高血压个体化药物药效的SNP位点和检测试剂盒
  • 基因变异位点筛选方法及系统
  • 基因变异位点筛选方法及系统
技术分类

06120116490032