掌桥专利:专业的专利平台
掌桥专利
首页

一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物

文献发布时间:2023-06-19 13:48:08



技术领域

本发明涉及医学领域,特别涉及一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物。

背景技术

脑卒中是由于脑部供血动脉突然破裂或管腔的阻塞或狭窄,导致脑部的局部血液循环障碍而产生的一系列症状的临床疾病[Lindgren A.Stroke genetics:a review andupdate[J].Journal of Stroke,2014,16(3):114]。2016年全球25岁及以上人群患脑卒中的终生风险约为25%,中国人群患脑卒中风险高达39.3%,其中男性为41.1%,女性为36.7%[Collaborators GBDLRoS,Feigin VL,Nguyen G,Cercy K,Johnson CO,Alam T,etal.Global,regional,and country-specific lifetime risks of stroke,1990and2016.N Engl J Med.2018;379:2429-2437]。《中国心血管病报告2018年》指出,我国心血管疾病现患人数约为2.9亿,其中脑卒中1300万。脑卒中已成为中国居民的首位死因,高于肿瘤及其他疾病[《中国心血管病报告2018》概要.中国循环杂志.34:6-17]。从总体上看,中国脑卒中患病率及死亡率仍处于上升阶段,且脑卒中具有极高的致残率。目前常使用影像学方法来进行脑卒中的诊断,例如CT和核磁共振检查,CT对于出血性脑卒中的灵敏度较高,但对于缺血性脑卒中的灵敏度只有16%,由于辐射的原因不宜频繁使用;核磁共振检查对缺血性脑卒中的灵敏度高于CT且没有辐射影响,但其缺点是较低的可行性、实用性和可及性(设备以及训练有素的人员)。因此,深入探讨脑卒中发生的危险因素、开展脑卒中早期识别和诊断及人群防控研究具有十分重要的意义。

脑卒中是由遗传和环境共同作用的复杂疾病[Benjamin EJ,Muntner P,AlonsoA,Bittencourt MS,Callaway CW,Carson AP,et al.Heart disease and strokestatistics-2019update:A report from the american heartassociation.Circulation.2019;139:e56-e528]。大多数脑卒中是可以预防和治疗的,一般通过普及知识提高意识、避免外源性刺激因素和合理膳食适度运动来进行预防,其治疗效果很大程度上依赖于早期诊断及相应的干预措施。目前,临床上关于脑卒中疾病诊断标志物的灵敏度和特异性很有限,尤其是缺乏早期诊断的标志物,因此更为敏感、特异的早期分子标记物亟待发掘。表观遗传学的兴起为揭示基因的表达调控机制提供了新思路,它是指在基因组DNA序列不发生改变的情况下,基因的表达发生了可遗传的改变[Nicoglou A,Merlin F.Epigenetics:A way to bridge the gap between biological fields.StudHist Philos Biol Biomed Sci.2017;66:73-82]。已有大量研究表明,许多疾病以及重要的生物过程受到表观遗传的调控[Mafficini A,Scarpa A.Genetics and epigenetics ofgastroenteropancreaticneuroendocrine neoplasms.Endocr Rev.2019;40:506-536;Dong N,Shi L,Wang DC,Chen C,Wang X.Role of epigenetics in lung cancerheterogeneity and clinical implication.Semin Cell Dev Biol.2017;64:18-25]。DNA甲基化是表观遗传调控的重要方式之一,是指在DNA甲基化转移酶的作用下,在基因组CpG二核苷酸的胞嘧啶5'碳位共价键结合一个甲基基团[Bird A.Perceptions ofepigenetics.Nature.2007;447:396-398]。DNA甲基化能引起染色质结构、DNA构象、DNA稳定性及DNA与蛋白质相互作用方式的改变,从而控制基因表达[Moore LD,Le T,Fan G.DNAmethylation and its basic function.Neuropsychopharmacology.2013;38:23-38]。本研究通过飞行时间质谱DNA甲基化分析技术在多组样品中进行分析,发现了心脑血管疾病和健康对照组的血液DNA甲基化存在显著差异。因此,血液异常的DNA甲基化信号有可能为心脑血管疾病体外早期诊断带来突破。此外,血液容易收集,DNA甲基化常温较稳定的特点也让其在临床应用中独具优势。因此,探索和开发适用于临床检测需要的灵敏和特异血液DNA甲基化诊断技术对提高心脑血管疾病早期诊疗效果和降低死亡率均有重要的科学意义和临床应用价值。

丝氨酸蛋白酶是一个蛋白酶家族,包含四个成员,HTRA1、HTRA2、HTRA3和HTRA4,其中丝氨酸蛋白酶1(HTRA1)是第一个被发现的[Chien J,Campioni M,Shridhar V,BaldiA.Htra serine proteases as potential therapeutic targets in cancer.CurrCancer Drug Targets.2009;9:451-468]。研究表明,HTRA1基因突变与伴有皮质下梗死和白质脑病的常染色体隐性脑动脉病(Cerebral autosomal recessive arteriopathy withsubcortical infarcts and leukoencephalopathy,CARASIL)密切相关[Preethish-KumarV,Nozaki H,Tiwari S,Vengalil S,Bhat M,Prasad C,et al.Carasil families fromindia with 3novel null mutations in the htra1 gene.Neurology.2017;89:2392-2394],CARASIL患者主要为男性青年人群,临床表现为卒中、痴呆、脱发、腰椎关节病变四种主要的症状,脑部病理发现小动脉呈动脉硬化性表现[Nozaki H,Sekine Y,Fukutake T,Nishimoto Y,Shimoe Y,Shirata A,et al.Characteristic features and progressionof abnormalities on mri for carasil.Neurology.2015;85:459-463]。此外,HTRA1能够抑制转化生长因子β(transforming growth factor-β,TGF-β)信号通路,HTRA1过表达抑制TGF-β前体结合蛋白1与TGF-β1结合[Shiga A,Nozaki H,Yokoseki A,Nihonmatsu M,Kawata H,Kato T,et al.Cerebral small-vessel disease protein htra1 controlsthe amount of tgf-beta1 via cleavage of protgf-beta1.Hum Mol Genet.2011;20:1800-1810],沉默HTRA1表达能够显著增加TGF-β1与细胞膜上受体的结合,诱导和促进颅内小动脉动脉粥样硬化及血管重塑[Liu J,Dong F,Hoh J.Loss of htra1-inducedattenuation of tgf-beta signaling in fibroblasts might not be the mainmechanism of carasil pathogenesis.Proc Natl Acad Sci US A.2015;112:E1693;Beaufort N,Scharrer E,Kremmer E,Lux V,Ehrmann M,Huber R,et al.Cerebral smallvessel disease-related protease htra1 processes latent tgf-beta bindingprotein 1and facilitates tgf-beta signaling.Proc Natl Acad Sci USA.2014;111:16496-16501]。目前关于外周血HTRA1基因甲基化与人群脑卒中关系的研究未见报道,HTRA1基因甲基化与缺血性脑卒中和出血性脑卒中均未见报道。此外,HTRA1基因甲基化与脑卒中的关系在动物模型包括小鼠以及细胞系亦无人报道。

发明内容

本发明的目的是提供一种用于辅助诊断脑卒中疾病的丝氨酸蛋白酶1(HTRA1)甲基化标志物及试剂盒。

第一方面,本发明要求保护甲基化HTRA1基因作为标志物在制备产品中的应用;所述产品具有如下任一功能:

(1)辅助诊断脑卒中;

(2)在临床症状之前预警卒中。

第二方面,本发明要求保护用于检测HTRA1基因甲基化水平的物质在制备产品中的应用;所述产品具有如下任一功能:

(1)辅助诊断脑卒中;

(2)在临床症状之前预警卒中。

第三方面,本发明要求保护用于检测HTRA1基因甲基化水平的物质和储存有数学模型建立方法和/或使用方法的介质在制备产品中的应用;所述产品具有如下任一功能:

(1)辅助诊断脑卒中;

(2)在临床症状之前预警卒中;

所述数学模型按照包括如下步骤的方法获得:

(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;

(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;

其中,(A1)中的n1和n2均可为50以上的正整数。

所述数学模型的使用方法包括如下步骤:

(B1)检测待测样本的HTRA1基因甲基化水平;

(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;

所述A类型样本和所述B类型样本为如下中的任一种:

(C1)未来2年内发生脑卒中的潜在患者和健康对照;

(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;

(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;

(C4)未来1年内发生脑卒中的潜在患者和健康对照。

其中,所述阈值可根据最大约登指数确定,可以根据实际情况确定为某一个数值比如0.5。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。

第四方面,本发明要求保护前文第三方面中所述的“储存有数学模型建立方法和/或使用方法的介质”在制备产品中的应用;所述产品具有如下任一功能:

(1)辅助诊断脑卒中;

(2)在临床症状之前预警卒中。

第五方面,本发明要求保护一种试剂盒。

本发明所要求保护的试剂盒,包括用于检测HTRA1基因甲基化水平的物质;所述试剂盒的用途为如下中的至少一种:

(1)辅助诊断脑卒中;

(2)在临床症状之前预警卒中。

进一步地,所述试剂盒中还含有前文所述的储存有数学模型建立方法和/或使用方法的介质。

第六方面,本发明要求保护一种系统。

本发明所要求保护的系统,包括:

(D1)用于检测HTRA1基因甲基化水平的试剂和/或仪器;

(D2)装置,所述装置包括单元M和单元N。

所述单元M用于建立数学模型,包括数据采集模块、数据分析处理模块和模型输出模块;

所述数据采集模块用于采集(D1)检测得到的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据。

所述数据分析处理模块能够基于所述数据采集模块采集的n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型。

其中,(A1)中的n1和n2均可为50以上的正整数。

所述模型输出模块用于输出所述数据分析处理模块建立的数学模型。

所述单元N用于确定待测样本是A类型样本还是B类型样本,包括数据输入模块、数据运算模块、数据比较模块和结论输出模块。

所述数据输入模块用于输入(D1)检测得到的待测者的HTRA1基因甲基化水平数据。

所述数据运算模块用于将所述待测者HTRA1基因甲基化水平数据代入所述数学模型,计算得到检测指数。

所述数据比较模块用于将所述检测指数与阈值进行比较。

所述结论输出模块用于根据所述数据比较模块的比较结果输出所述待测样本是A类型样本还是B类型样本的结论。

所述A类型样本和所述B类型样本为如下中的任一种:

(C1)未来2年内发生脑卒中的潜在患者和健康对照;

(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;

(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;

(C4)未来1年内发生脑卒中的潜在患者和健康对照。

另外,本发明还要求保护一种检测待测样本是A类型样本还是B类型样本的方法(即辅助诊断脑卒中的方法或者在临床症状之前预警脑卒中的方法)。该方法可包括如下步骤:

(A)可按照包括如下步骤的方法建立数学模型:

(A1)分别检测n1个A类型样本和n2个B类型样本的HTRA1基因甲基化水平;

(A2)取步骤(A1)获得的所有样本的HTRA1基因甲基化水平数据,按照A类型样本和B类型样本的分类方式,通过二分类逻辑回归法建立数学模型;

其中,(A1)中的n1和n2均可为50以上的正整数。

(B)可按照包括如下步骤的方法确定所述待测样本是A类型样本还是B类型样本:

(B1)检测待测样本的HTRA1基因甲基化水平;

(B2)将步骤(B1)获得的所述待测样本的HTRA1基因甲基化水平数据代入所述数学模型,得到检测指数;然后比较检测指数和阈值的大小,根据比较结果确定所述待测样本是A类型样本还是B类型样本;

所述A类型样本和所述B类型样本为如下中的任一种:

(C1)未来2年内发生脑卒中的潜在患者和健康对照;

(C2)未来1.5年内发生脑卒中的潜在患者和健康对照;

(C3)未来1.32年内发生脑卒中的潜在患者和健康对照;

(C4)未来1年内发生脑卒中的潜在患者和健康对照。

其中,所述阈值可根据最大约登指数确定,也可以根据实际情况确定为某一个数值比如0.5。大于阈值归为一类,小于阈值归为另外一类,等于阈值作为不确定的灰区。其中A类型和B类型为相对应的两分类,二分类的分组,哪一组是A类型,哪一组是B类型,要根据具体的数学模型来确定,无需约定。

在实际应用中,以上任一所述数学模型可能会根据DNA甲基化的检测方法以及拟合方式不同有所改变,要根据具体的数学模型来确定,无需约定。

在本发明的实施例中,所述模型具体为log(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化值代入模型以后得出的检测指数,b0为常量,x1~xn为自变量即为该待测样品的一个或者多个甲基化位点的甲基化值(每一个值为0-1之间的数值),b1~bn为模型赋予每一个位点甲基化值的权重。

在本发明中,所述模型的建立还可酌情加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数来提高判别效率。

本发明的实施例中建立的一个具体模型为用于辅助区分未来2年内发生脑卒中的潜在患者和健康对照。所述模型具体为:log(y/(1-y))=-3.795+1.061*HTRA1_E_CpG_1+3.270*HTRA1_E_CpG_2-0.245*HTRA1_E_CpG_3.4+3.264*HTRA1_E_CpG_5+3.185*HTRA1_E_CpG_7+3.305*HTRA1_E_CpG_8.9-0.758*HTRA1_E_CpG_10+2.798*HTRA1_E_CpG_11.12+4.070*HTRA1_E_CpG_13.14.15+2.526*HTRA1_E_CpG_16+0.014*年龄+0.086*性别(男性赋值为1,女性赋值为0)+0.181*白细胞计数+0.005*体重指数+0.261*吸烟(吸烟赋值为1,不吸烟赋值为0)-0.006*饮酒(饮酒赋值为1,不饮酒赋值为0)+0.277*高血压史(有高血压史赋值为1,无高血压史赋值为0)+0.195*糖尿病史(有糖尿病史赋值为1,无糖尿病史赋值为0)+0.268*HDL-C+0.429*LDL-C-0.386*TC+0.142*TG。所述HTRA1_E_CpG_1为SEQ ID No.5所示的DNA片段自5’端第43-44位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_2为SEQ IDNo.5所示的DNA片段自5’端第73-74位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_3.4为SEQ ID No.5所示的DNA片段自5’端第120-121位和第122-123位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_5为SEQ ID No.5所示的DNA片段自5’端第132-133位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_7为SEQ ID No.5所示的DNA片段自5’端第194-195位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_8.9为SEQ ID No.5所示的DNA片段自5’端第204-205位和第206-207位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_10为SEQ ID No.5所示的DNA片段自5’端第225-226位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_11.12为SEQID No.5所示的DNA片段自5’端第240-241位和第248-249位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_13.14.15为SEQ ID No.5所示的DNA片段自5’端第254-255位、第259-260位和第268-269位所示CpG位点的甲基化水平;所述HTRA1_E_CpG_16为SEQ ID No.5所示的DNA片段自5’端第294-295位所示CpG位点的甲基化水平。所述模型的阈值为通过最大约登指数得到的诊断阈值0.53。通过模型计算的检测指数大于0.53的待测者候选为脑卒中潜在患者,小于0.53的待测者候选为无脑卒中。

第七方面,本发明要求保护细胞或机体内HTRA1基因甲基化水平在调控所述细胞或机体内HTRA1基因表达量中的应用。

进一步地,在所述细胞或机体内,所述HTRA1基因甲基化水平越高,所述HTRA1基因表达量越低;所述HTRA1基因甲基化水平越低,所述HTRA1基因表达量越高。

在本发明的具体实施方式中,所述HTRA1基因表达量具体体现为RNA水平的表达。

所述机体可为人。

在本发明的具体实施方式中,未来2年、1.5年、1.32年或1年内发生脑卒中的潜在患者的所述HTRA1基因甲基化水平高于健康对照,相应的,未来2年、1.5年、1.32年或1年内发生脑卒中的潜在患者的所述HTRA1基因表达量低于健康对照。

在上述各方面中,所述检测HTRA1基因甲基化水平为检测血液中HTRA1基因甲基化水平。

在前文各方面中,所述HTRA1基因甲基化水平为HTRA1基因中如下(e1)-(e5)所示片段中全部或部分CpG位点的甲基化水平;

所述甲基化HTRA1基因为HTRA1基因中如下(e1)-(e5)所示片段中全部或部分CpG位点甲基化;

(e1)SEQ ID No.1所示的DNA片段或与其具有80%以上同一性的DNA片段;

(e2)SEQ ID No.2所示的DNA片段或与其具有80%以上同一性的DNA片段;

(e3)SEQ ID No.3所示的DNA片段或与其具有80%以上同一性的DNA片段;

(e4)SEQ ID No.4所示的DNA片段或与其具有80%以上同一性的DNA片段;

(e5)SEQ ID No.5所示的DNA片段或与其具有80%以上同一性的DNA片段。

进一步地,所述“全部或部分CpG位点”具体可为如下任一:

(f1)SEQ ID No.1所示的DNA片段自5’端第164-165位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第255-256位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第265-266位所示CpG位点、SEQ ID No.1所示的DNA片段自5’端第282-283位所示CpG位点,或SEQ ID No.1所示的DNA片段自5’端第366-367位所示CpG位点;

(f2)SEQ ID No.2所示的DNA片段自5’端第90-91位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第155-156位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第217-218位所示CpG位点、SEQ ID No.2所示的DNA片段自5’端第226-227位所示CpG位点、SEQ IDNo.2所示的DNA片段自5’端第234-235位和第239-240位所示CpG位点,或SEQ ID No.2所示的DNA片段自5’端第263-264位和第269-270位所示CpG位点;

(f3)SEQ ID No.3所示的DNA片段自5’端第95-96位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第157-158位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第241-242位所示CpG位点、SEQ ID No.3所示的DNA片段自5’端第258-259位所示CpG位点,或SEQID No.3所示的DNA片段自5’端第268-269位所示CpG位点;

(f4)SEQ ID No.4所示的DNA片段自5’端第33-34位和第35-36位所示CpG位点、SEQID No.4所示的DNA片段自5’端第105-106位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第110-111位和第117-118位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第173-174位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第203-204位和第209-210位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第258-259位、第263-264位和第268-269位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第315-316位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第326-327位、第329-330位和第332-333位所示CpG位点、SEQ ID No.4所示的DNA片段自5’端第410-411位所示CpG位点,或SEQ ID No.4所示的DNA片段自5’端第439-440位所示CpG位点;

(f5)SEQ ID No.5所示的DNA片段自5’端第73-74位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第132-133位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第194-195位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第204-205位和第206-207位所示CpG位点、SEQ ID No.5所示的DNA片段自5’端第240-241位和第248-249位所示CpG位点、SEQID No.5所示的DNA片段自5’端第254-255位、第259-260位和第268-269位所示CpG位点,或SEQ ID No.5所示的DNA片段自5’端第294-295位所示CpG位点;

(f6)SEQ ID No.1所示的DNA片段的7个可区分CpG位点;

(f7)SEQ ID No.2所示的DNA片段的9个可区分CpG位点;

(f8)SEQ ID No.3所示的DNA片段的7个可区分CpG位点;

(f9)SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f10)SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f11)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.2所示的DNA片段的9个可区分CpG位点;

(f12)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;

(f13)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f14)SEQ ID No.1所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f15)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;

(f16)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f17)SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f18)SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f19)SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f20)SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f21)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.3所示的DNA片段的7个可区分CpG位点;

(f22)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f23)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f24)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f25)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f26)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f27)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.4所示的DNA片段的13个可区分CpG位点;

(f28)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f29)SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

(f30)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ IDNo.4所示的DNA片段的13个可区分CpG位点;

(f31)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;

(f32)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;

(f33)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;

(f34)SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ IDNo.5所示的DNA片段的10个可区分CpG位点;

(f35)SEQ ID No.1所示的DNA片段的7个可区分CpG位点、SEQ ID No.2所示的DNA片段的9个可区分CpG位点、SEQ ID No.3所示的DNA片段的7个可区分CpG位点、SEQ ID No.4所示的DNA片段的13个可区分CpG位点和SEQ ID No.5所示的DNA片段的10个可区分CpG位点;

在(f6)-(f35)中,所述SEQ ID No.1所示的DNA片段的7个可区分CpG位点为:SEQID No.1自5’端第60-61位所示CpG位点;第164-165位所示CpG位点;第201-202位所示CpG位点;第255-256位所示CpG位点;第265-266位所示CpG位点;第282-283位所示CpG位点;第366-367位所示CpG位点;

所述SEQ ID No.2所示的DNA片段的9个可区分CpG位点为:SEQ ID No.2自5’端第70-71位所示CpG位点;第90-91位所示CpG位点;第155-156位所示CpG位点;第206-207位所示CpG位点;第217-218位所示CpG位点;第226-227位所示CpG位点;第234-235位和第239-240位所示CpG位点;第263-264位和第269-270位所示CpG位点;第306-307位所示CpG位点;

所述SEQ ID No.3所示的DNA片段的7个可区分CpG位点为SEQ ID No.3自5’端第62-63位所示CpG位点;第95-96位所示CpG位点;第127-128位所示CpG位点;第157-158位所示CpG位点;第241-242位所示CpG位点;第258-259位所示CpG位点;第268-269位所示CpG位点;

所述SEQ ID No.4所示的DNA片段的13个可区分CpG位点为SEQ ID No.4自5’端第33-34位和第35-36位所示CpG位点;第105-106位所示CpG位点;第110-111位和第117-118位所示CpG位点;第166-167位所示CpG位点;第173-174位所示CpG位点;第203-204位和第209-210位所示CpG位点;第258-259位、第263-264位和第268-269位所示CpG位点;第293-294位和第304-305位所示CpG位点;第315-316位所示CpG位点;第326-327位、第329-330位和第332-333位所示CpG位点;第410-411位所示CpG位点;第424-425位所示CpG位点;第439-440位所示CpG位点;

所述SEQ ID No.5所示的DNA片段的10个可区分CpG位点为:SEQ ID No.5自5’端第43-44位所示CpG位点;第73-74位所示CpG位点;第120-121位和第122-123位所示CpG位点;第132-133位所示CpG位点;第194-195位所示CpG位点;第204-205位和第206-207位所示CpG位点;第225-226位所示CpG位点;第240-241位和第248-249位所示CpG位点;第254-255位、第259-260位和第268-269位所示CpG位点;第294-295位所示CpG位点。

在本发明的具体实施方式中,有些相邻的甲基化位点在利用飞行时间质谱进行DNA甲基化分析时由于几个CpG位点位于一个甲基化片段上,峰图无法区分,因而在进行甲基化水平分析、以及构建和使用相关数学模型时将其按照一个甲基化位点进行处理。

在前文各方面中,所述用于检测HTRA1基因甲基化水平的物质包含(或为)用于扩增HTRA1基因全长或部分片段的引物组合。所述用于检测HTRA1基因甲基化水平的试剂包含(或为)用于扩增HTRA1基因全长或部分片段的引物组合。

进一步地,所述部分片段可为如下中至少一个片段:

(g1)SEQ ID No.1所示的DNA片段或其包含的DNA片段;

(g2)SEQ ID No.2所示的DNA片段或其包含的DNA片段;

(g3)SEQ ID No.3所示的DNA片段或其包含的DNA片段;

(g4)SEQ ID No.4所示的DNA片段或其包含的DNA片段;

(g5)SEQ ID No.5所示的DNA片段或其包含的DNA片段;

(g6)与SEQ ID No.1所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;

(g7)与SEQ ID No.2所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;

(g8)与SEQ ID No.3所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;

(g9)与SEQ ID No.4所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段;

(g10)与SEQ ID No.5所示的DNA片段或其包含的DNA片段具有80%以上同一性的DNA片段。

更进一步地,所述引物组合为引物对A和/或引物对B和/或引物对C和/或引物对D和/或引物对E。

所述引物对A为引物A1和引物A2组成的引物对;所述引物A1为SEQ ID No.6或SEQID No.6的第11-34位核苷酸所示的单链DNA;所述引物A2为SEQ ID No.7或SEQ ID No.7的第32-55位核苷酸所示的单链DNA。

所述引物对B为引物B1和引物B2组成的引物对;所述引物B1为SEQ ID No.8或SEQID No.8的第11-35位核苷酸所示的单链DNA;所述引物B2为SEQ ID No.9或SEQ ID No.9的第32-57位核苷酸所示的单链DNA。

所述引物对C为引物C1和引物C2组成的引物对;所述引物C1为SEQ ID No.10或SEQID No.10的第11-35位核苷酸所示的单链DNA;所述引物C2为SEQ ID No.11或SEQ ID No.11的第32-56位核苷酸所示的单链DNA。

所述引物对D为引物D1和引物D2组成的引物对;所述引物D1为SEQ ID No.12或SEQID No.12的第11-35位核苷酸所示的单链DNA;所述引物D2为SEQ ID No.13或SEQ IDNo.13的第32-59位核苷酸所示的单链DNA。

所述引物对E为引物E1和引物E2组成的引物对;所述引物E1为SEQ ID No.14或SEQID No.14的第11-38位核苷酸所示的单链DNA;所述引物E2为SEQ ID No.15或SEQ ID No.15的第32-56位核苷酸所示的单链DNA。

在前文各方面中,所述辅助诊断脑卒中和/或所述在临床症状之前预警卒中的待测者为符合如下任一条件中至少一种的脑卒中潜在患者或者健康对照:

(h1)年龄大于等于65周岁;

(h2)男性;

(h3)吸烟;

(h4)年龄小于65周岁;

(h5)女性;

(h6)不吸烟。

所述吸烟定义为当前吸烟>20支/周,且持续吸烟>3个月/年。

所述脑卒中潜在患者为在未来2年内、1.5年内、1.32年内或者1年内发生脑卒中的潜在患者。

在本发明中,前文所述健康对照可理解为现在及曾经均没有患过脑卒中,以及未来2.5年均不会发生脑卒中。

本发明采用巢式病例对照研究,收集了社区队列入选后2年内新发脑卒中患者作为病例组(病例组在血样采集时均未发病,在血液采集后2年以内发生脑卒中),并按年龄性别匹配2.7年随访期间未发生脑卒中者作为对照组,探讨血液HTRA1甲基化与中国人群脑卒中的关系。研究证明血液HTRA1甲基化可作为脑卒中预警和早期诊断的潜在标志物。本发明对于提高脑卒中诊疗效果均有重要的科学意义和临床应用价值。

具体实施方式

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。

下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1、用于检测HTRA1基因甲基化位点的引物设计

经过大量序列和功能分析,本次检测覆盖HTRA1基因启动子区、第一外显子及第一内含子区的五个片段(HTRA1_A、HTRA1_B、HTRA1_C、HTRA1_D和HTRA1_E片段)进行甲基化水平和脑卒中的相关性分析。

HTRA1_A片段(SEQ ID No.1)位于hg19参考基因组chr10:124219200-124221200,正义链。

HTRA1_B片段(SEQ ID No.2)位于hg19参考基因组chr10:124219200-124221200,正义链。

HTRA1_C片段(SEQ ID No.3)位于hg19参考基因组chr10:124219200-124221200,反义链。

HTRA1_D片段(SEQ ID No.4)位于hg19参考基因组chr10:124221500-124223000,正义链。

HTRA1_E片段(SEQ ID No.5)位于hg19参考基因组chr10:124221500-124223000,正义链。

HTRA1_A片段中的CpG位点信息如表1所示。

HTRA1_B片段中的CpG位点信息如表2所示。

HTRA1_C片段中的CpG位点信息如表3所示。

HTRA1_D片段中的CpG位点信息如表4所示。

HTRA1_E片段中的CpG位点信息如表5所示。

表1 HTRA1_A片段中CpG位点信息

表2 HTRA1 B片段中CpG位点信息

表3 HTRA1_C片段中CpG位点信息

表4 HTRA1_D片段中CpG位点信息

表5 HTRA1 E片段中CpG位点信息

针对五个片段(HTRA1_A片段、HTRA1_B片段、HTRA1_C片段、HTRA1_D片段和HTRA1_E片段)设计特异PCR引物,如表6所示。其中,SEQ ID No.6、SEQ ID No.8、SEQ ID No.10、SEQID No.12和SEQ ID No.14为正向引物,SEQ ID No.7、SEQ ID No.9、SEQ ID No.11、SEQ IDNo.13和SEQ ID No.15为反向引物;SEQ ID No.6、SEQ ID No.8、SEQ ID No.10、SEQ IDNo.12和SEQ ID No.14中自5’端第1至10位为非特异标签,SEQ ID No.6第11至34位、SEQ IDNo.8、SEQ ID No.10和SEQ ID No.12第11至35位、SEQ ID No.14第11至38位为特异引物序列;SEQ ID No.7、SEQ ID No.9、SEQ ID No.11、SEQ ID No.13和SEQ ID No.15自5’端第1至31位为非特异标签,SEQ ID No.7第32至55位、SEQ ID No.9第32至57位、SEQ ID No.11和SEQ ID No.15第32至56位、SEQ ID No.13第32至59位为特异引物序列。引物序列中不包含SNP和CpG位点。

表6 HTRA1甲基化引物序列

实施例2、HTRA1基因甲基化检测及结果分析

一、研究样本

采用流行病学整群抽样方法,于2015年10月至12月对江苏省句容市16个镇的18岁以上社区人群进行调查,基线调查共11151人。本研究通过南京医科大学伦理委员会审查,所有调查对象均签署了知情同意书。

基线调查内容包括收集调查对象的一般人口学资料信息如性别、年龄、籍贯、民族等;询问疾病史、用药史、家族史等,主要包括心血管疾病、糖尿病、肾脏疾病及血脂异常史等;收集吸烟状况、饮酒状况等。吸烟状况分为吸烟(定义为当前吸烟>20支/周,且持续吸烟>3个月/年)、既往吸烟(此研究开始前1年已戒烟)和不吸烟(本研究满足既往吸烟定义的人数为0)。饮酒的定义是目前或过去饮酒≥2次/周且持续饮酒半年。人体测量指标包括体重、血压、身高和腰围。体重测量要求被调查者着轻装,读数精确到0.1kg。血压测量时,被调查对象需满足清晨空腹、未进行剧烈运动,同时静坐休息5分钟。采用水银汞柱血压计测量右臂肱动脉血压,每位被调查者重复血压测量三次,每次需间隔30s以上,若三次收缩压或舒张压测量的差值≥8mmHg,则需加测一次。身高测量时,将皮尺固定在墙上,所有被调查者脱鞋帽,两脚后跟并拢并直立于皮尺,大三角板的直角边用于读数,精确到0.1cm。腰围测量时,在肚脐上1cm处,使用软皮尺贴皮肤围上一圈读数。体质指数(Body mass index,BMI)等于体重(kg)/身高的平方(m

每年通过当地医院、疾控中心慢病管理系统、社区卫生服务中心和工作站慢病常规登记项目、社保中心报销数据记录心脑血管疾病发病与死亡信息。队列开始时间为基线调查日期,结局变量为脑卒中发病,对于失访研究对象的随访时间,统一按照随访结束时间的一半来计算。截止随访日期2018年7月13日,共计新发脑卒中234例,我们选择了队列入组后2年内新发脑卒中患者作为病例组,共计139例,经年龄和性别匹配后,选择2.7年随访期间未发生脑卒中者作为对照,共计147例。所有患者离体血液样本都是入组时且发病前收集的。患病情况在后续发病时都经过影像学和病理确诊。

脑卒中病例平均年龄为67.64±9.51岁,对照平均年龄为67.59±9.11岁,两组年龄差异无统计学意义(P>0.05)。性别、BMI、SBP、DBP、吸烟、饮酒、高血压史、糖尿病史、TC、TG、HDL-C、LDL-C、葡萄糖、白细胞计数、中性粒细胞比例、单核细胞、嗜酸性粒细胞和嗜碱性粒细胞比例在两组人群中差异均无统计学意义(P>0.05)。脑卒中病例的中位发病时间(从抽血到脑卒中确诊的时间)为1.32年,对照的中位随访时间(抽血到随访截止日期的时间)为2.71年。详细结果见表7。

表7 研究对象一般人口学特征和临床特征分布情况

注:BMI,体质指数;SBP,收缩压;DBP,舒张压;TC,总胆固醇;Glucose,空腹血糖;TG,甘油三酯;HDL-C,高密度脂蛋白胆固醇;LDL-C,低密度脂蛋白胆固醇。

二、甲基化检测

1、提取血液样本的总DNA。

2、将步骤1制备的血液样本总DNA进行重亚硫酸盐处理(参照Qiagen的DNA甲基化试剂盒说明书操作)。重亚硫酸盐处理后,未发生甲基化的胞嘧啶(C)被转化成尿嘧啶(U),而甲基化的胞嘧啶保持不变,即原来CpG位点的C碱基经重亚硫酸盐处理后转化为C或U。

3、以步骤2经过重亚硫酸盐处理的DNA为模板,采用表6中的5对特异引物对通过DNA聚合酶按照常规PCR反应要求的反应体系进行PCR扩增,5对引物都采用相同的常规PCR体系,且5对引物都按照以下程序进行扩增。

PCR反应程序为:95℃,4min→(95℃,20s→56℃,30s→72℃,2min)45个循环→72℃,5min→4℃,1h。

4、取步骤3的扩增产物,通过飞行时间质谱进行DNA甲基化分析,具体方法如下:

(1)向5μl PCR产物中加入2μl虾碱性磷酸盐(SAP)溶液(0.3ml SAP[0.5U]+1.7mlH

(2)取出2μl步骤(1)得到的SAP处理后的产物,根据说明书加入5μl T-Cleavage反应体系中,然后在37℃孵育3h;

(3)取步骤(2)的产物,加入19μl去离子水,再用6μg Resin在旋转摇床进行去离子化孵育1h;

(4)2000rpm室温离心5min,将微量上清由Nanodispenser机械手臂上样384SpectroCHIP;

(5)飞行时间质谱分析;获得的数据用SpectroACQUIRE v3.3.1.3软件收集,通过MassArray EpiTyper v1.2软件实现可视化。

上述飞行时间质谱检测使用的试剂均来自于试剂盒(T-Cleavage MassCLEAVEReagent Auto Kit,货号:10129A);上述飞行时间质谱检测使用的检测仪器为

三、质量控制

现场调查:制定严谨的调查问卷,统一衡量标准;调查前对调查员统一培训和考核;正式调查前进行预调查,及时发现和总结问题;问卷由专门的质控人员现场质控,质量不合格的问卷及时退回调查员,重新对研究对象调查;问卷资料双轨录入,并进行一致性检验;现场收集的血标本及时送检。严格按照实验操作要求进行,定期对操作环境紫外消毒;正式实验前进行预实验;随机抽取5%的样本重复飞行时间质谱检测,保证结果一致率达99%以上。双人判读实验结果,整理甲基化数据,保证数据的真实准确性。通过质谱实验,共获得46个可以区别的G峰图。采用SpectroACQUIRE v3.3.1.3软件根据含G峰和A峰面积比较,计算甲基化水平(SpectroACQUIRE v3.3.1.3软件可自动通过计算峰面积得到每个样本在每个CpG位点的甲基化水平)。

四、统计分析

呈正态分布的计量资料采用均数±标准差表示,计数资料用率表示,应用成组t检验或卡方检验进行病例组和对照组一般人口学资料分布差异的比较分析。呈非正态分布的计量资料采用中位数(四分位数间距)表示,采用Mann-Whitney U检验进行病例组和对照组之间差异比较。非条件logistic回归模型用于HTRA1甲基化和脑卒中之间的关联分析,校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量,以每10%甲基化增量计算比值比(Odds ratio,OR)和95%可信区间(Confidenceinterval,CI)。用Spearman秩相关系数评估两变量之间的统计相关性。通过logistic回归和受试者工作特征曲线(receiver operating characteristic curve,ROC)评价多个CpG位点的组合对脑卒中预警和早期诊断的价值。以双侧P<0.05为差异有统计学意义,所有数据均通过SPSS24.0进行统计分析。

五、结果分析

1、HTRA1甲基化与脑卒中的关联分析

本发明将脑卒中病例按不同的临床发病时间进行关联分析,结果显示,早于临床发病时间2年的139例脑卒中病例HTRA1_A片段5个位点[CpG_2(0.26vs.0.22)、CpG_4(0.23vs.0.19)、CpG_5(0.46vs.0.42)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.41)、CpG_5(0.65vs.0.61)、CpG_7(0.76vs.0.72)、CpG_8(0.49vs.0.44)、CpG_9.10(0.64vs.0.59)、CpG_12.13(0.36vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.24vs.0.20)、CpG_4(0.48vs.0.44)、CpG_5(0.54vs.0.50)、CpG_6(0.69vs.0.64)、CpG_7(0.75vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.17)、CpG_3(0.42vs.0.37)、CpG_4.5(0.51vs.0.47)、CpG_8(0.62vs.0.58)、CpG_9.10(0.73vs.0.68)、CpG_11.12.13(0.29vs.0.24)、CpG_16(0.32vs.0.28)、CpG_18.19.20(0.47vs.0.42)、CpG_22(0.80vs.0.76)、CpG_24(0.34vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.31)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.57vs.0.53)、CpG_16(0.52vs.0.48)]的甲基化水平均显著高于对照;logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.23(1.02-1.57),P=0.013;CpG_4:1.24(1.03-1.60),P=0.018;CpG_5:1.28(1.06-1.59),P=0.015;CpG_6:1.33(1.08-1.67),P=0.009;CpG_7:1.28(1.05-1.60),P=0.010]、HTRA1_B[CpG_4:1.30(1.07-1.62),P=0.007;CpG_5:1.32(1.08-1.62),P=0.005;CpG_7:1.29(1.03-1.59),P=0.014;CpG_8:1.21(1.04-1.60),P=0.007;CpG_9.10:1.30(1.04-1.62),P=0.005;CpG_12.13:1.31(1.06-1.61),P=0.004]、HTRA1_C[CpG_2:1.26(1.07-1.61),P=0.008;CpG_4:1.24(1.02-1.59),P=0.013;CpG_5:1.31(1.02-1.61),P=0.005;CpG_6:1.32(1.06-1.62),P=0.006;CpG_7:1.32(1.07-1.61),P=0.007]、HTRA1_D[CpG_1.2:1.27(1.05-1.59),P=0.011;CpG_3:1.32(1.05-1.62),P=0.008;CpG_4.5:1.28(1.06-1.61),P=0.010;CpG_8:1.27(1.04-1.53),P=0.012;CpG_9.10:1.31(1.06-1.61,P=0.013;CpG_11.12.13:1.30(1.03-1.60),P=0.009;CpG_16:1.31(1.05-1.62),P=0.006;CpG_18.19.20:1.30(1.04-1.62),P=0.005;CpG_22:1.29(1.05-1.61),P=0.007;CpG_24:1.31(1.04-1.61),P=0.007]、HTRA1_E[CpG_2:1.23(1.03-1.60),P=0.014;CpG_5:1.23(1.01-1.56),P=0.019;CpG_7:1.33(1.07-1.69),P=0.011;CpG_8.9:1.28(1.05-1.56),P=0.015;CpG_11.12:1.29(1.10-1.69),P=0.016;CpG_13.14.15:1.36(1.07-1.74),P=0.012;CpG_16:1.27(1.02-1.53),P=0.017],具体结果见表8。

有趣的是,早于临床发病时间1.5年(91例)、早于临床发病时间1.32年、(67例)及早于临床发病时间1年(35例)的脑卒中病例上述CpG位点甲基化水平与对照相比差异更显著。早于临床发病时间1.5年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.19)、CpG_5(0.47vs.0.42)、CpG_6(0.56vs.0.50)、CpG_7(0.70vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.46vs.0.41)、CpG_5(0.66vs.0.61)、CpG_7(0.77vs.0.72)、CpG_8(0.50vs.0.44)、CpG_9.10(0.65vs.0.59)、CpG_12.13(0.37vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.20)、CpG_4(0.49vs.0.44)、CpG_5(0.55vs.0.50)、CpG_6(0.70vs.0.64)、CpG_7(0.76vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.22vs.0.17)、CpG_3(0.43vs.0.37)、CpG_4.5(0.52vs.0.47)、CpG_8(0.63vs.0.58)、CpG_9.10(0.74vs.0.68)、CpG_11.12.13(0.30vs.0.24)、CpG_16(0.33vs.0.28)、CpG_18.19.20(0.48vs.0.42)、CpG_22(0.81vs.0.76)、CpG_24(0.35vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.18vs.0.12)、CpG_5(0.40vs.0.34)、CpG_7(0.54vs.0.48)、CpG_8.9(0.36vs.0.31)、CpG_11.12(0.80vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.53vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.34(1.06-1.70),P=0.006;CpG_4:1.33(1.06-1.69),P=0.008;CpG_5:1.38(1.09-1.75),P=0.005;CpG_6:1.43(1.11-1.80),P=0.004;CpG_7:1.38(1.10-1.77),P=0.005]、HTRA1_B[CpG_4:1.40(1.10-1.82),P=0.003;CpG_5:1.42(1.11-1.83),P=0.002;CpG_7:1.39(1.07-1.74),P=0.004;CpG_8:1.35(1.08-1.69),P=0.005;CpG_9.10:1.39(1.12-1.74),P=0.001;CpG_12.13:1.41(1.13-1.78),P=0.002]、HTRA1_C[CpG_2:1.37(1.11-1.71),P=0.006;CpG_4:1.33(1.08-1.69),P=0.003;CpG_5:1.40(1.06-1.72),P=0.002;CpG_6:1.42(1.07-1.76),P=0.001;CpG_7:1.41(1.08-1.74),P=0.001]、HTRA1_D[CpG_1.2:1.37(1.09-1.72),P=0.008;CpG_3:1.42(1.08-1.74),P=0.003;CpG_4.5:1.36(1.10-1.72),P=0.005;CpG_8:1.37(1.07-1.69),P=0.009;CpG_9.10:1.41(1.09-1.78),P=0.004;CpG_11.12.13:1.37(1.06-1.74),P=0.003;CpG_16:1.39(1.07-1.76),P=0.002;CpG_18.19.20:1.38(1.05-1.74),P=0.004;CpG_22:1.33(1.08-1.68),P=0.005;CpG_24:1.39(1.08-1.78),P=0.006]、HTRA1_E[CpG_2:1.31(1.05-1.65),P=0.006;CpG_5:1.35(1.09-1.69),P=0.008;CpG_7:1.40(1.09-1.79),P=0.005;CpG_8.9:1.39(1.08-1.76),P=0.007;CpG_11.12:1.43(1.11-1.89),P=0.003;CpG_13.14.15:1.45(1.17-1.92),P=0.004;CpG_16:1.34(1.09-1.68),P=0.009],详细结果见表9。早于临床发病时间1.32年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.29vs.0.22)、CpG_4(0.28vs.0.19)、CpG_5(0.50vs.0.42)、CpG_6(0.59vs.0.50)、CpG_7(0.72vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.49vs.0.41)、CpG_5(0.69vs.0.61)、CpG_7(0.79vs.0.72)、CpG_8(0.53vs.0.44)、CpG_9.10(0.67vs.0.59)、CpG_12.13(0.40vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.28vs.0.20)、CpG_4(0.51vs.0.44)、CpG_5(0.58vs.0.50)、CpG_6(0.72vs.0.64)、CpG_7(0.78vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.25vs.0.17)、CpG_3(0.44vs.0.37)、CpG_4.5(0.54vs.0.47)、CpG_8(0.65vs.0.58)、CpG_9.10(0.76vs.0.68)、CpG_11.12.13(0.32vs.0.24)、CpG_16(0.35vs.0.28)、CpG_18.19.20(0.50vs.0.42)、CpG_22(0.83vs.0.76)、CpG_24(0.38vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.20vs.0.12)、CpG_5(0.43vs.0.34)、CpG_7(0.56vs.0.48)、CpG_8.9(0.38vs.0.31)、CpG_11.12(0.82vs.0.75)、CpG_13.14.15(0.60vs.0.53)、CpG_16(0.56vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.41(1.09-1.80);CpG_4:1.53(1.15-1.99);CpG_5:1.52(1.14-2.00);CpG_6:1.55(1.19-2.02);CpG_7:1.49(1.11-1.87)]、HTRA1_B[CpG_4:1.54(1.18-2.07);CpG_5:1.57(1.20-2.04);CpG_7:1.48(1.10-1.94);CpG_8:1.42(1.12-1.85);CpG_9.10:1.47(1.16-1.99);CpG_12.13:1.56(1.17-2.08)]、HTRA1_C[CpG_2:1.46(1.13-1.92);CpG_4:1.43(1.14-1.89);CpG_5:1.59(1.15-2.09);CpG_6:1.58(1.15-2.08);CpG_7:1.50(1.11-1.99)]、HTRA1_D[CpG_1.2:1.48(1.13-1.92);CpG_3:1.45(1.10-1.89);CpG_4.5:1.44(1.11-1.88);CpG_8:1.47(1.15-1.89);CpG_9.10:1.51(1.19-2.08);CpG_11.12.13:1.50(1.09-2.07);CpG_16:1.43(1.10-1.87);CpG_18.19.20:1.53(1.15-2.04);CpG_22:1.46(1.09-2.01);CpG_24:1.55(1.18-2.09)]、HTRA1_E[CpG_2:1.42(1.12-1.82);CpG_5:1.50(1.20-1.90);CpG_7:1.52(1.19-1.91);CpG_8.9:1.49(1.11-1.86);CpG_11.12:1.56(1.14-1.94);CpG_13.14.15:1.57(1.19-1.98);CpG_16:1.49(1.14-1.97)],P值均<0.001(表10)。早于临床发病时间1年的脑卒中病例和对照上述CpG位点甲基化水平分别为HTRA1_A片段5个位点[CpG_2(0.32vs.0.22)、CpG_4(0.30vs.0.19)、CpG_5(0.53vs.0.42)、CpG_6(0.62vs.0.50)、CpG_7(0.75vs.0.65)]、HTRA1_B片段6个位点[CpG_4(0.52vs.0.41)、CpG_5(0.71vs.0.61)、CpG_7(0.82vs.0.72)、CpG_8(0.56vs.0.44)、CpG_9.10(0.69vs.0.59)、CpG_12.13(0.42vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.30vs.0.20)、CpG_4(0.53vs.0.44)、CpG_5(0.61vs.0.50)、CpG_6(0.74vs.0.64)、CpG_7(0.80vs.0.70)]、HTRA1_D片段10个位点[CpG_1.2(0.27vs.0.17)、CpG_3(0.48vs.0.37)、CpG_4.5(0.56vs.0.47)、CpG_8(0.67vs.0.58)、CpG_9.10(0.78vs.0.68)、CpG_11.12.13(0.35vs.0.24)、CpG_16(0.37vs.0.28)、CpG_18.19.20(0.52vs.0.42)、CpG_22(0.85vs.0.76)、CpG_24(0.40vs.0.30)]和HTRA1_E片段7个位点[CpG_2(0.22vs.0.12)、CpG_5(0.45vs.0.34)、CpG_7(0.58vs.0.48)、CpG_8.9(0.41vs.0.31)、CpG_11.12(0.85vs.0.75)、CpG_13.14.15(0.63vs.0.53)、CpG_16(0.58vs.0.48)];logistic回归结果显示,较正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.52(1.13-2.01);CpG_4:1.60(1.17-2.10);CpG_5:1.62(1.19-2.12);CpG_6:1.65(1.21-2.15);CpG_7:1.59(1.14-2.03)]、HTRA1_B[CpG_4:1.62(1.19-2.11);CpG_5:1.67(1.24-2.18);CpG_7:1.58(1.13-2.01);CpG_8:1.50(1.12-1.96);CpG_9.10:1.57(1.17-2.09);CpG_12.13:1.64(1.20-2.13)]、HTRA1_C[CpG_2:1.56(1.15-2.02);CpG_4:1.51(1.17-2.02);CpG_5:1.69(1.25-2.18);CpG_6:1.67(1.18-2.15);CpG_7:1.60(1.13-2.09)]、HTRA1_D[CpG_1.2:1.58(1.16-2.07);CpG_3:1.55(1.11-2.08);CpG_4.5:1.50(1.13-1.99);CpG_8:1.57(1.17-2.07);CpG_9.10:1.63(1.21-2.12);CpG_11.12.13:1.61(1.13-2.10);CpG_16:1.54(1.14-2.03);CpG_18.19.20:1.63(1.18-2.14);CpG_22:1.57(1.09-2.07);CpG_24:1.64(1.20-2.14)]、HTRA1_E[CpG_2:1.49(1.13-1.99);CpG_5:1.61(1.21-2.10);CpG_7:1.63(1.22-2.12);CpG_8.9:1.59(1.13-2.06);CpG_11.12:1.63(1.15-2.09);CpG_13.14.15:1.65(1.20-2.14);CpG_16:1.56(1.16-2.05)],P值均<0.001(表11)。

表8 139例脑卒中病例(早于临床发病时间2年)和147例对照HTRA1基因CpG位点甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

表9 91例脑卒中病例(早于临床发病时间1.5年)和147例对照HTRA1基因CpG位点甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

表10 67例脑卒中病例(早于临床发病时间1.32年)和147例对照HTRA1基因CpG位点甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

表11 35例脑卒中病例(早于临床发病时间1年)和147例对照HTRA1基因CpG位点甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

2、HTRA1甲基化与脑卒中临床发病时间的相关性分析

将脑卒中病例按早于临床发病时间2年、1.5年、1.32年、1年分别进行HTRA1甲基化与脑卒中发病时间的相关性分析,结果表明,HTRA1_A片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_B片段6个位点(CpG_4、CpG_5、CpG_7、CpG_8、CpG_9.10、CpG_12.13)、HTRA1_C片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_D片段10个位点(CpG_1.2、CpG_3、CpG_4.5、CpG_8、CpG_9.10、CpG_11.12.13、CpG_16、CpG_18.19.20、CpG_22、CpG_24)和HTRA1_E片段7个位点(CpG_2、CpG_5、CpG_7、CpG_8.9、CpG_11.12、CpG_13.14.15、CpG_16)甲基化程度与脑卒中发病时间均呈负相关(表12-15);尤其早于临床发病时间1.5年、1.32年和1年的脑卒中病例,上述CpG位点甲基化程度与临床发病时间的相关性较强(Spearman秩相关系数绝对值均≥0.550,表13-15)。

表12 HTRA1基因甲基化与脑卒中临床发病时间的相关性(139例脑卒中病例早于临床发病时间2年)

表13 HTRA1基因甲基化与脑卒中临床发病时间的相关性(91例脑卒中病例早于临床发病时间1.5年)

表14 HTRA1基因甲基化与脑卒中临床发病时间的相关性(67例脑卒中病例早于临床发病时间1.32年)

表15 HTRA1基因甲基化与脑卒中临床发病时间的相关性(35例脑卒中病例早于临床发病时间1年)

3、HTRA1甲基化与年龄的相关性

根据研究对象的年龄(65岁)进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在年龄≥65岁的人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.18)、CpG_5(0.46vs.0.41)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.64)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.40)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.71)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.58)、CpG_12.13(0.37vs.0.32)]、HTRA1_C片段5个位点[CpG_2(0.24vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.54vs.0.49)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.17)、CpG_3(0.42vs.0.37)、CpG_4.5(0.52vs.0.47)、CpG_8(0.62vs.0.58)、CpG_9.10(0.74vs.0.68)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.80vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.17vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.31)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.57vs.0.53)、CpG_16(0.52vs.0.47)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、性别、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.38(1.10-1.83),P<0.001;CpG_4:1.27(1.07-1.66),P=0.001;CpG_5:1.33(1.10-1.78),P=0.003;CpG_6:1.42(1.18-1.98),P=0.004;CpG_7:1.44(1.17-2.04),P<0.001]、HTRA1_B[CpG_4:1.32(1.09-1.80),P=0.005;CpG_5:1.39(1.10-1.84),P=0.003;CpG_7:1.37(1.12-1.81),P=0.002;CpG_8:1.30(1.10-1.71),P<0.001;CpG_9.10:1.37(1.09-1.87),P<0.001;CpG_12.13:1.42(1.11-1.88),P=0.002]、HTRA1_C[CpG_2:1.34(1.10-1.72),P=0.003;CpG_4:1.26(1.06-1.56),P=0.002;CpG_5:1.38(1.10-1.95),P=0.001;CpG_6:1.42(1.16-1.95),P<0.001;CpG_7:1.39(1.15-1.92),P=0.002]、HTRA1_D[CpG_1.2:1.33(1.06-1.85),P=0.007;CpG_3:1.46(1.13-2.01),P<0.001;CpG_4.5:1.32(1.09-1.63),P=0.004;CpG_8:1.32(1.06-1.68),P=0.009;CpG_9.10:1.39(1.12-1.82),P<0.001;CpG_11.12.13:1.33(1.09-1.76),P<0.001;CpG_16:1.49(1.15-2.03),P<0.001;CpG_18.19.20:1.40(1.09-1.97),P<0.001;CpG_22:1.38(1.07-1.85),P<0.001;CpG_24:1.39(1.10-1.85),P<0.001]、HTRA1_E[CpG_2:1.30(1.07-1.70),P=0.008;CpG_5:1.48(1.08-1.92),P=0.007;CpG_7:1.42(1.08-1.84),P=0.006;CpG_8.9:1.38(1.03-1.79),P=0.010;CpG_11.12:1.44(1.09-1.99),P=0.011;CpG_13.14.15:1.48(1.09-2.00),P=0.009;CpG_16:1.34(1.08-1.70),P=0.007],具体结果见表16。

表16 按年龄分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、性别、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

4、HTRA1基因甲基化与性别的相关性

根据研究对象的性别进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在男性人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.27vs.0.22)、CpG_4(0.24vs.0.19)、CpG_5(0.46vs.0.42)、CpG_6(0.55vs.0.49)、CpG_7(0.69vs.0.64)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.40)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.71)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.57)、CpG_12.13(0.37vs.0.31)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.55vs.0.50)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.16)、CpG_3(0.42vs.0.35)、CpG_4.5(0.51vs.0.45)、CpG_8(0.62vs.0.57)、CpG_9.10(0.74vs.0.67)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.80vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.34)、CpG_7(0.53vs.0.48)、CpG_8.9(0.34vs.0.30)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.52vs.0.47)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.37(1.10-1.80),P=0.004;CpG_4:1.25(1.02-1.60),P=0.003;CpG_5:1.36(1.09-1.80),P=0.007;CpG_6:1.45(1.11-1.94),P=0.002;CpG_7:1.36(1.09-1.90),P=0.005]、HTRA1_B[CpG_4:1.34(1.10-1.73),P=0.001;CpG_5:1.39(1.11-1.82),P=0.006;CpG_7:1.39(1.08-1.80),P=0.004;CpG_8:1.34(1.03-1.79),P<0.001;CpG_9.10:1.41(1.13-1.91),P<0.001;CpG_12.13:1.45(1.15-1.92),P<0.001]、HTRA1_C[CpG_2:1.38(1.10-1.81),P<0.001;CpG_4:1.32(1.09-1.69),P=0.001;CpG_5:1.42(1.10-1.94),P=0.002;CpG_6:1.46(1.14-2.02),P<0.001;CpG_7:1.41(1.17-1.89),P<0.001]、HTRA1_D[CpG_1.2:1.39(1.10-1.83),P<0.001;CpG_3:1.37(1.10-1.82),P=0.001;CpG_4.5:1.33(1.07-1.75),P=0.001;CpG_8:1.32(1.09-1.71),P=0.002;CpG_9.10:1.38(1.09-1.80),P<0.001;CpG_11.12.13:1.35(1.10-1.80),P<0.001;CpG_16:1.49(1.13-2.04),P=0.001;CpG_18.19.20:1.37(1.10-1.83),P<0.001;CpG_22:1.40(1.10-1.87),P<0.001;CpG_24:1.33(1.09-1.81),P<0.001]、HTRA1_E[CpG_2:1.29(1.09-1.68),P=0.009;CpG_5:1.36(1.07-1.84),P=0.011;CpG_7:1.39(1.09-1.92),P=0.007;CpG_8.9:1.40(1.05-1.87),P=0.012;CpG_11.12:1.39(1.09-1.92),P=0.008;CpG_13.14.15:1.45(1.07-1.95),P=0.005;CpG_16:1.43(1.13-1.95),P=0.004]。而在女性人群中,上述CpG位点的甲基化水平在脑卒中病例和对照中差异均无统计学意义,具体结果见表17。

表17 按性别分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、年龄、饮酒、吸烟、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

5、HTRA1基因甲基化与吸烟的相关性

研究表明,除遗传机制外,环境因素(如吸烟)可能导致DNA甲基化模式改变。根据研究对象的吸烟状况进行分层,分析HTRA1甲基化与脑卒中的关联。结果显示,在吸烟人群中,脑卒中病例HTRA1_A片段5个位点[CpG_2(0.26vs.0.21)、CpG_4(0.23vs.0.18)、CpG_5(0.47vs.0.41)、CpG_6(0.55vs.0.50)、CpG_7(0.69vs.0.63)]、HTRA1_B片段6个位点[CpG_4(0.45vs.0.41)、CpG_5(0.65vs.0.60)、CpG_7(0.76vs.0.72)、CpG_8(0.49vs.0.43)、CpG_9.10(0.64vs.0.58)、CpG_12.13(0.36vs.0.31)]、HTRA1_C片段5个位点[CpG_2(0.25vs.0.19)、CpG_4(0.48vs.0.43)、CpG_5(0.55vs.0.49)、CpG_6(0.69vs.0.63)、CpG_7(0.75vs.0.69)]、HTRA1_D片段10个位点[CpG_1.2(0.21vs.0.16)、CpG_3(0.42vs.0.35)、CpG_4.5(0.52vs.0.46)、CpG_8(0.62vs.0.56)、CpG_9.10(0.73vs.0.67)、CpG_11.12.13(0.29vs.0.23)、CpG_16(0.32vs.0.27)、CpG_18.19.20(0.47vs.0.41)、CpG_22(0.81vs.0.75)、CpG_24(0.34vs.0.29)]和HTRA1_E片段7个位点[CpG_2(0.16vs.0.12)、CpG_5(0.38vs.0.33)、CpG_7(0.53vs.0.48)、CpG_8.9(0.35vs.0.30)、CpG_11.12(0.79vs.0.75)、CpG_13.14.15(0.58vs.0.53)、CpG_16(0.53vs.0.48)]的甲基化水平显著高于对照;logistic回归结果显示,较正白细胞亚型比例、年龄、性别、饮酒、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG协变量后,ORs(95%CIs)每+10%甲基化分别为HTRA1_A[CpG_2:1.34(1.10-1.78),P=0.005;CpG_4:1.33(1.08-1.71),P=0.004;CpG_5:1.43(1.13-1.96),P<0.001;CpG_6:1.35(1.10-1.85),P=0.006;CpG_7:1.44(1.15-2.03),P<0.001]、HTRA1_B[CpG_4:1.28(1.05-1.66),P=0.010;CpG_5:1.40(1.10-1.93),P=0.005;CpG_7:1.30(1.05-1.72),P=0.006;CpG_8:1.39(1.10-1.83),P=0.001;CpG_9.10:1.42(1.12-1.90),P<0.001;CpG_12.13:1.46(1.16-1.98),P<0.001]、HTRA1_C[CpG_2:1.35(1.10-1.82),P<0.001;CpG_4:1.30(1.05-1.75),P=0.007;CpG_5:1.43(1.13-1.99),P<0.001;CpG_6:1.48(1.16-2.05),P<0.001;CpG_7:1.40(1.13-1.97),P<0.001]、HTRA1_D[CpG_1.2:1.38(1.09-1.81),P=0.001;CpG_3:1.43(1.13-1.97),P<0.001;CpG_4.5:1.37(1.10-1.83),P<0.001;CpG_8:1.31(1.08-1.75),P=0.001;CpG_9.10:1.40(1.09-1.90),P<0.001;CpG_11.12.13:1.39(1.11-1.89),P<0.001;CpG_16:1.38(1.12-1.89),P=0.004;CpG_18.19.20:1.41(1.10-1.95),P<0.001;CpG_22:1.44(1.15-2.05),P<0.001;CpG_24:1.40(1.10-1.95),P<0.001]、HTRA1_E[CpG_2:1.26(1.05-1.70),P=0.007;CpG_5:1.31(1.07-1.85),P=0.006;CpG_7:1.38(1.09-1.96),P=0.005;CpG_8.9:1.41(1.09-1.97),P=0.001;CpG_11.12:1.32(1.05-1.82),P=0.011;CpG_13.14.15:1.43(1.09-2.05),P<0.001;CpG_16:1.33(1.08-1.85),P=0.005],具体结果见表18。

表18 按吸烟与否分层分析139例早于临床发病时间2年的脑卒中病例和147例对照HTRA1基因CpG位点的甲基化水平比较

注:IQR,四分位数间距;OR:优势比;CI:可信区间;*校正白细胞亚型比例、年龄、性别、饮酒、BMI、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG。

6、HTRA1基因甲基化与基因表达的相关性

研究表明DNA甲基化能影响基因的表达。因此,本研究随机选取48例上述社区队列入选后2年内新发脑卒中患者作为病例组,并按年龄性别匹配上述2.7年随访期间未发生脑卒中者48例作为对照组。提取外周血白细胞中的RNA,并对其进行反转录,应用荧光定量PCR技术对外周血中HTRA1基因的mRNA表达水平进行检测与分析。结果表明,病例组HTRA1基因的mRNA相对表达水平显著低于对照组(0.75vs.1.26,P=0.006,表19),且HTRA1_A片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_B片段6个位点(CpG_4、CpG_5、CpG_7、CpG_8、CpG_9.10、CpG_12.13)、HTRA1_C片段5个位点(CpG_2、CpG_4、CpG_5、CpG_6、CpG_7)、HTRA1_D片段10个位点(CpG_1.2、CpG_3、CpG_4.5、CpG_8、CpG_9.10、CpG_11.12.13、CpG_16、CpG_18.19.20、CpG_22、CpG_24)和HTRA1_E片段7个位点(CpG_2、CpG_5、CpG_7、CpG_8.9、CpG_11.12、CpG_13.14.15、CpG_16)甲基化程度与HTRA1基因的mRNA表达水平均呈负相关(Spearman秩相关系数均≥0.667,表20)。

上述结果表明HTRA1基因甲基化的改变能影响该基因的表达,从而促进脑卒中的发生。

表19 病例组和对照组外周血中HTRA1基因的mRNA表达水平比较

注:内参基因为GAPDH,每个样本设立三个平行样,mRNA的相对表达量用2

表20 HTRA1基因甲基化与基因表达的相关性

7、HTRA1基因甲基化对脑卒中预警和早期诊断的价值

本发明建立的用于辅助脑卒中诊断的数学模型可以达到如下目的:

(1)区分脑卒中患者和无脑卒中对照;

(2)提前预警脑卒中。

数学模型的建立方法如下:

(A)数据来源:步骤一中列出的社区队列入选后2年内新发脑卒中患者139例和2.7年随访期间未发生脑卒中者147例的离体血液样本的目标CpG位点(表1-表5中的一种或多种的组合)甲基化水平(检测方法同步骤二)。

数据可根据实际需要加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数来提高判别效率。

(B)模型建立

根据需要选取任意两类不同类型患者数据即训练集(例如:早于临床发病时间2年的脑卒中患者和对照、早于临床发病时间1.5年的脑卒中患者和对照、早于临床发病时间1.32年的脑卒中患者和对照、早于临床发病时间1年的脑卒中患者和对照、年龄<65岁的脑卒中患者和年龄<65岁的对照、年龄≥65岁的脑卒中患者和年龄≥65岁的对照、男性脑卒中患者和对照、女性脑卒中患者和对照、吸烟的脑卒中患者和吸烟的对照、不吸烟的脑卒中患者和不吸烟的对照)作为用于建立模型的数据,使用SAS,R,SPSS等统计软件使用二分类逻辑回归的统计方法通过公式建立数学模型。数学模型公式计算出的最大约登指数对应的数值为阈值或直接设定0.5为阈值,待测样品经过测试和代入模型计算后得到的检测指数大于阈值归为一类(B类),小于阈值归为另外一类(A类),等于阈值作为不确定的灰区。在对新的待测样品进行预测来判断属于哪一类时,首先通过DNA甲基化的测定方法检测该待测样品HTRA1基因上一个或者多个CpG位点的甲基化水平,然后将这些甲基化水平的数据代入上述数学模型,计算得到所述待测样本对应的检测指数,然后比较所述待测样本对应的检测指数和阈值的大小,根据比较结果确定所述待测样本属于哪一类样本。

举例:将训练集中HTRA1基因单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平的数据通过SAS、R、SPSS等统计软件使用二分类逻辑回归的公式建立用于区分A类和B类的数学模型。该数学模型在此为二类逻辑回归模型,具体为:log(y/(1-y))=b0+b1x1+b2x2+b3x3+…+bnXn,其中y为因变量即将待测样品的一个或者多个甲基化位点的甲基化值代入模型以后得出的检测指数,b0为常量,x1~xn为自变量即为该测试样品的一个或者多个甲基化位点的甲基化值(每一个值为0~1之间的数值),b1~bn为模型赋予每一个位点甲基化值的权重。具体应用时,先根据训练集中已经检测的样本的一个或者多个DNA甲基化位点的甲基化程度(x1~xn)及其已知的分类情况(A类或者B类,分别对y赋值0和1)建立数学模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1~bn,并由该数学模型计算出的以最大约登指数对应的数值为阈值或直接设定0.5为划分的阈值。待测样品经过测试和代入模型计算后得到的检测指数即y值大于阈值归为B类,小于阈值归为A类,等于阈值作为不确定的灰区。其中A类和B类为相对应的两分类(二分类的分组,哪一组A类,哪一组是B类,要根据具体的数学模型来确定,在此不做约定)。对受试者的样品进行预测来判断属于哪一类时,首先采集受试者的血液,然后从中提取DNA。将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者HTRA1基因的单个CpG位点的甲基化水平或者多个CpG位点组合的甲基化水平进行检测,然后将检测得到的甲基化数据代入上述数学模型。如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平代入上述数学模型后计算出来的值即检测指数大于阈值,则该受试者判定与训练集中检测指数大于阈值的归属一类(B类);如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数小于阈值,则该受试者跟训练集中检测指数小于阈值的归属一类(A类);如果该受试者的HTRA1基因一个或者多个CpG位点的甲基化水平数据代入上述数学模型后计算出来的值即检测指数等于阈值,则不能判断该受试者是A类还是B类。

举例:举例说明HTRA1_E的全部CpG位点(CpG_1,CpG_2,CpG_3.4,CpG_5,CpG_7,CpG_8.9,CpG_10,CpG_11.12,CpG_13.14.15,CpG_16)的甲基化以及数学建模在用于提前2年发现脑卒中患者(提前预警脑卒中)的应用:将早于临床发病时间2年的脑卒中患者和对照训练集(在此为:139例早于临床发病时间2年的脑卒中患者和147例对照)中已经检测的HTRA1_E的全部CpG位点的甲基化水平的数据以及患者的年龄、性别(男性赋值为1,女性赋值为0)、白细胞计数、体重指数、吸烟(吸烟赋值为1,不吸烟赋值为0)、饮酒(饮酒赋值为1,不饮酒赋值为0)、高血压史(有高血压史赋值为1,无高血压史赋值为0)、糖尿病史(有糖尿病史赋值为1,无糖尿病史赋值为0)、HDL-C、LDL-C、TC和TG通过SAS、SPSS软件或R软件使用二分类逻辑回归的公式建立用于提前2年发现脑卒中患者(提前预警脑卒中)的数学模型。该数学模型在此为二类逻辑回归模型,由此确定该数学模型的常量b0以及各个甲基化位点的权重b1~bn,在此例中具体为:log(y/(1-y))=-3.795+1.061*HTRA1_E_CpG_1+3.270*HTRA1_E_CpG_2-0.245*HTRA1_E_CpG_3.4+3.264*HTRA1_E_CpG_5+3.185*HTRA1_E_CpG_7+3.305*HTRA1_E_CpG_8.9-0.758*HTRA1_E_CpG_10+2.798*HTRA1_E_CpG_11.12+4.070*HTRA1_E_CpG_13.14.15+2.526*HTRA1_E_CpG_16+0.014*年龄+0.086*性别+0.181*白细胞计数+0.005*体重指数+0.261*吸烟-0.006*饮酒+0.277*高血压史+0.195*糖尿病史+0.268*HDL-C+0.429*LDL-C-0.386*TC+0.142*TG,其中y为因变量即将待测样品的HTRA1_E的全部CpG位点的甲基化值以及年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG代入模型以后得出的检测指数。通过最大约登指数得到的诊断阈值(0.53),待测样品的HTRA1_E的全部CpG位点的甲基化水平经过测试后连同其年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG的信息代入模型进行计算,得到的检测指数即y值大于阈值归为脑卒中潜在患者,小于阈值归为无脑卒中对照,等于阈值则不确定为脑卒中患者还是对照。此模型的曲线下面积(AUC)计算结果为0.78(表21)。具体受试者判断方法举例如下所示,从两位受试者(甲,乙)分别采集血液提取DNA,将提取的DNA通过重亚硫酸盐转化后,用DNA甲基化的测定方法对受试者的HTRA1_E的全部CpG位点的甲基化水平进行检测。然后将检测得到的甲基化水平数据连同受试者的年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG的信息代入上述数学模型。甲受试者经数学模型后计算出来的值为0.62大于0.53,则甲受试者判定为脑卒中潜在患者;乙受试者的HTRA1_E的全部CpG位点的甲基化水平数据代入上述数学模型后计算出来的值为0.38小于0.53,则乙受试者判定无脑卒中,且未来2年内发生脑卒中的概率小。

(C)模型效果评价

根据上述方法,分别建立用于提前1年、1.32年、1.5年和2年发现脑卒中患者的数学模型,并且通过受试者曲线(ROC曲线)对其有效性进行评价。ROC曲线得出的曲线下面积(AUC)越大,说明模型的区分度越好,分子标志物越有效。采用不同CpG位点进行数学模型构建后的评价结果如表21所示。表21中,1个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E扩增片段中任意一个CpG位点,2个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E中任意2个CpG位点的组合,3个CpG位点代表HTRA1_A/HTRA1_B/HTRA1_C/HTRA1_D/HTRA1_E中任意3个CpG位点的组合,……以此类推。表中的数值为不同位点组合评价结果的范围值(即任意个CpG位点组合方式的结果均在此范围内)。

本研究结果显示,HTRA1基因甲基化(所有CpG位点)用于提前1年、1.32年、1.5年和2年发现脑卒中的ROC曲线下面积分别为0.92、0.89、0.86、0.82,通过最大约登指数得到的敏感度分别为88.2%、86.0%、83.2%和79.8%,特异度分别为90.6%、86.9%、85.8%和81.2%,提示HTRA1基因甲基化对脑卒中有很好的预警和早期诊断效果。此外,我们进一步分析了HTRA1基因甲基化对不同年龄、性别和吸烟状态的脑卒中的诊断价值,结果显示HTRA1基因甲基化(所有CpG位点)对年龄<65岁和年龄≥65岁者诊断脑卒中的ROC曲线下面积为0.80和0.89,通过最大约登指数得到的敏感度为79.1%和85.9%,特异度为80.4%和87.0%;HTRA1基因甲基化(所有CpG位点)对男性和女性诊断脑卒中的ROC曲线下面积为0.90和0.80,通过最大约登指数得到的敏感度为87.1%和78.9%,特异度为88.4%和80.8%;HTRA1基因甲基化(所有CpG位点)诊断吸烟和不吸烟状态下的脑卒中的ROC曲线下面积为0.89和0.81,通过最大约登指数得到的敏感度为86.3%和79.1%,特异度为87.0%和81.3%。以上结果提示HTRA1基因甲基化对≥65岁人群、男性和吸烟者的脑卒中诊断效果较好(表21)。

表21 HTRA1基因甲基化对脑卒中预警和早期诊断的价值

注:表中的结果是“加入年龄、性别、白细胞计数、体重指数、吸烟、饮酒、高血压史、糖尿病史、HDL-C、LDL-C、TC和TG等已知参数”后的结果。

以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。

<110> 南京医科大学

<120> 一种蛋白酶基因甲基化作为脑卒中早期诊断的潜在标志物

<130> GNCLN201336

<160> 15

<170> PatentIn version 3.5

<210> 1

<211> 392

<212> DNA

<213> Artificial sequence

<400> 1

ctctgcagtc tggctgctca gggggatgga ggaggatggg gcttgcaggc aggcacagcc 60

ggtttggaag gtgtcctggc tccagcactc aacttgtggc atgacactca ggggagtcac 120

cctttctggc cctcagtttt ctcctctgta aaataaggaa attcgacaaa aataagttat 180

caccaattta ttcaccacca cgtgtccttt taattccatc tgccccagga ctgcagtggg 240

gagtctttct ttgccgatgg acttcgaaaa tcatcacccc ccgcattttt tgtggttaac 300

cacagctagc caggaactca gggcttctca tcagcagagg cctctgcctc tccagtatcc 360

agggccgaat ggattttggg tcaaggcctc cc 392

<210> 2

<211> 370

<212> DNA

<213> Artificial sequence

<400> 2

cacaggcctg gtgctgcctg ggcacccaga cccacctcca gggtcgccct cagccctcct 60

gatgactctc ggactcgcat ctgtcccaac ggatgcacca aagattctcc agtgggaaat 120

caaatttttg ataacaagtg ttttgaaata atcacgcact tggtgaaaaa tcaaaagagg 180

ggaaaacccc tttcccatct gagaccgctc caccctcgcc agttacgagc tgccgagccg 240

cttcctaggc tctctgcgaa tacggacacg catgccaccc acaacaactt tttaaaagaa 300

tcagacgtgt gaaggattct attcgaatta cttctgctct ctgcttttat cacttcactg 360

tgggtctggg 370

<210> 3

<211> 313

<212> DNA

<213> Artificial sequence

<400> 3

tgcccaaggt ccagaggggt cccccagaaa ggcccaggag cctggggcat gggaaagctg 60

tcggggtccc catgctgact ccctggactc caagcgatat tccataaagc cagggcctcc 120

tggctgcggg agggaggcct tgacccaaaa tccattcggc cctggatact ggagaggcag 180

aggcctctgc tgatgagaag ccctgagttc ctggctagct gtggttaacc acaaaaaatg 240

cggggggtga tgattttcga agtccatcgg caaagaaaga ctccccactg cagtcctggg 300

gcagatggaa tta 313

<210> 4

<211> 480

<212> DNA

<213> Artificial sequence

<400> 4

ggccatggag tgccctgagg gcaaccacac agcgcgggga ccccaggaca aataagagga 60

atgggggcat aaaggaagga gagaagttca ggactgggaa ttggcgcctc gcagagcggc 120

ttcaggacca caagaagtca tttcggttgc tttttcttct atttacgtcc tccgtcccct 180

ttaaaattca ctgctttgat cacgggaccg ctcagtgaaa actgtatgta actcttttgg 240

aaaggaacag tgtttgccgg cccgccccgg agtttctcca aaaagtctac cccgagcagg 300

gaacggtttg gcaccgctct cgtttcggcg gcgttgctgc ctgtcttgct ttcctcgttt 360

tgagccagcc ctacaaaaat gaaagtggct ccttttgaat aagctgaatc gggctttgga 420

tcacgaaatc tgcagaggcg gagaagggac cgggttagtg atgaggaaga agtctacccc 480

<210> 5

<211> 344

<212> DNA

<213> Artificial sequence

<400> 5

ggttagtgat gaggaagaag tctacccctc tgttcctaca gccgcacaca ggacctgttc 60

tggcagggga gacggtggtg atgggggaag gagtggaatg gagcaatgtc taactctctc 120

gcgggacctt ccggagagat gctcctcatc ttcaggcaga ggccatgtgg aaaaataata 180

tcgagttcag cagcggccag ccccgcgttg taggaaccag acagcggggc ttggcagtgc 240

gcttgggcgc agccgtgccg ctgctgccgg accccagtgc tgcctcctca acacgggcag 300

tgccaggaga ggggcatagg ggagcacagt gcagagggac tggt 344

<210> 6

<211> 34

<212> DNA

<213> Artificial sequence

<400> 6

aggaagagag ttttgtagtt tggttgttta gggg 34

<210> 7

<211> 55

<212> DNA

<213> Artificial sequence

<400> 7

cagtaatacg actcactata gggagaaggc taaaaaacct taacccaaaa tccat 55

<210> 8

<211> 35

<212> DNA

<213> Artificial sequence

<400> 8

aggaagagag tataggtttg gtgttgtttg ggtat 35

<210> 9

<211> 57

<212> DNA

<213> Artificial sequence

<400> 9

cagtaatacg actcactata gggagaaggc tcccaaaccc acaataaaat aataaaa 57

<210> 10

<211> 35

<212> DNA

<213> Artificial sequence

<400> 10

aggaagagag tgtttaaggt ttagaggggt ttttt 35

<210> 11

<211> 56

<212> DNA

<213> Artificial sequence

<400> 11

cagtaatacg actcactata gggagaaggc ttaattccat ctaccccaaa actaca 56

<210> 12

<211> 35

<212> DNA

<213> Artificial sequence

<400> 12

aggaagagag ggttatggag tgttttgagg gtaat 35

<210> 13

<211> 59

<212> DNA

<213> Artificial sequence

<400> 13

cagtaatacg actcactata gggagaaggc taaaataaac ttcttcctca tcactaacc 59

<210> 14

<211> 38

<212> DNA

<213> Artificial sequence

<400> 14

aggaagagag ggttagtgat gaggaagaag tttatttt 38

<210> 15

<211> 56

<212> DNA

<213> Artificial sequence

<400> 15

cagtaatacg actcactata gggagaaggc taccaatccc tctacactat actccc 56

技术分类

06120113811627