掌桥专利:专业的专利平台
掌桥专利
首页

用于检测肺癌的标志物及其用途和系统

文献发布时间:2023-06-19 19:28:50



技术领域

本发明涉及生物技术领域,尤其涉及一种用于检测肺癌的标志物及其用途和系统。

背景技术

肺癌是全球发病率最高、死亡率最高的癌症之一。在我国,肺癌发病率、死亡率也居首位。预计至2025年,我国每年新发肺癌患者将达到100万。其中,绝大多数患者位于肺癌晚期,失去了手术治疗机会,同时肺癌的预后特别差,而我国肺癌的5年生存率仅为16.1%。常规的筛查肺癌的手段除了低剂量螺旋CT(LDCT),还有一些蛋白标志物,例如:癌胚抗原(CEA)、鳞状细胞癌抗原(SCC)、神经元特异性烯醇化酶(NSE)等。但这些手段在灵敏性和特异性方面各参差不齐。目前,DNA甲基化已被证明具有组织特异性,可用于早期癌症检测,并可根据循环肿瘤DNA(ctDNA)甲基化特征追踪到肿瘤原发部位。

cfDNA(cell-free DNA)是外周血中游离的核酸小片段DNA,源于正常细胞或肿瘤细胞与代谢,包含体细胞突变和DNA甲基化等遗传信息。其中,ctDNA甲基化可在肿瘤发生的早期被检测到,而且具有较好的稳定性,因此ctDNA甲基化成为肿瘤液体活检中一个极具价值的标志物。

附图说明

图1为本发明生物标志物研究的流程图(N表示健康样本,C表示肺癌样本)。

图2为基于5个标志物构建模型在训练集中的ROC曲线。

图3为基于5个标志物构建模型在测试集中的ROC曲线。

图4为基于5个中的2个标志物构建模型在测试集中的ROC曲线。

图5为基于5个中的3个标志物构建模型在测试集中的ROC曲线。

图6为基于5个中的4个标志物构建模型在测试集中的ROC曲线。

发明内容

本发明的目的在于提供了一种用于检测肺癌的标志物及其用途和系统。

本发明具体技术方案如下:

1.一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下甲基化标志物中的一种或两种以上:

第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

2.根据项1所述的标志物,其特征在于,

第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

3.包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第一标志物;或

包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第二标志物;或

包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第三标志物;或

包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第四标志物;或

包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第五标志物,

在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

4.根据项3所述的用途,其特征在于,

第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

5.一种用于检测肺癌的系统,其特征在于,所述系统包括:

样品采集模块,其用于采集受试者的样品;

样品处理模块,其用于提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;

测序模块,其对样品处理模块处理后的样品进行测序;

分析模块,其用于分析测序结果以确定样品中甲基化标志物的综合甲基化水平;

判定模块,其用于根据分析得到的综合甲基化水平判定受试者是否患有肺癌。

6.根据项5所述的系统,其特征在于,

所述标志物包括以下甲基化标志物中的一种或两种以上:

第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

7.根据项6所述的系统,其特征在于,

第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

8.根据项6或7所述的系统,其特征在于,在分析模块中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。

9.根据项8所述的系统,其特征在于,在分析模块中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。

10.根据项9所述的系统,其特征在于,在判定模块中,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的,

其中所述阈值是基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个在给定肺癌受试者或健康受试者人群中的甲基化水平检测数据确定的;

所述综合甲基化标志物大于指定阈值则判定为受试者患有肺癌,所述综合甲基化水平标志物小于等于指定阈值则判定为受试者正常。

11.根据项5所述的系统,其特征在于,所述受试者样品为血液样品。

12.一种用于检测肺癌的方法,其特征在于,所述方法包括:

样品采集步骤,其采集受试者的样品;

样品处理步骤,其提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;

测序步骤,其对样品处理步骤处理后的样品进行测序;

分析步骤,其分析测序结果以确定样品中甲基化标志物的综合甲基化水平;

判定步骤,其根据分析得到的综合甲基化水平判定受试者是否患有肺癌。

13.根据项12所述的方法,其特征在于,

所述标志物包括以下甲基化标志物中的一种或两种以上:

第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

14.根据项13所述的方法,其特征在于,

第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

15.根据项13或14所述的方法,其特征在于,在分析步骤中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。

16.根据项15所述的方法,其特征在于,在分析步骤中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。

17.根据项16所述的方法,其特征在于,在判定步骤中,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的,

其中所述阈值是基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个在给定肺癌受试者或健康受试者人群中的甲基化水平检测数据确定的;

所述综合甲基化标志物大于指定阈值则判定为受试者患有肺癌,所述综合甲基化水平标志物小于等于指定阈值则判定为受试者正常。

18.根据项12所述的方法,其特征在于,所述受试者样品为血液样品。

本发明的标志物和系统可以:1)以非侵入性的方式用于无症状人群的早期筛查,以及癌症患者的预后检测,降低了侵入性检测造成的危害,2)具有更高的灵敏度和准确性,能够实现实时监测。

具体实施方式

下面对本发明做以详细说明。虽然显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。

需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。

定义

除非在本文的其他地方具体限定,否则本文使用的所有其他技术和科学术语具有本申请所属领域的普通技术人员通常理解的含义。

甲基化

甲基化是蛋白质和核酸的一种重要的修饰,调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。最常见的甲基化修饰有DNA甲基化和组蛋白甲基化。

DNA甲基化是指发生在CpG二核苷酸中胞嘧啶上第5位碳原子的甲基化过程,作为一种对稳定的修饰状态,在DNA甲基转移酶的作用下,可随DNA的复制过程遗传给新生的子代DNA,是一种重要的表观遗传机制,DNA甲基化时,基因启动子区的甲基化可导致抑癌基因转录沉寂,因此它与肿瘤的发生关系密切。异常甲基化包括抑癌基因和DNA修复基因的高甲基化、重复序列DNA的低甲基化、某些基因的印记丢失,其与多种肿瘤的发生有关。

在本文中,ROC曲线一定程度上可以反映分类器的分类效果。AUC实际上就是ROC曲线下的面积。AUC直观地反映了ROC曲线表达的分类能力。

PPV和NPV的计算,我们首先需要介绍混淆矩阵(Confusion Matrix)。在统计分类模型的评估过程中分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来的表格就是混淆矩阵。

在混淆矩阵中:

TP代表的是真实值是positive,模型分类为positive的样本数量。

FP代表的是真实值是negative,模型分类为positive的样本数量。

TN代表的是真实值是negative,模型分类为negative的样本数量。

FN代表的是真实值是positive,模型分类为negative的样本数量。

PPV(Positive Predictive Value),阳性预测值,被分类为阳性样本中分对为阳性的,计算公式PPV=TP/(TP+FP),可以用来评价分类为阳性的效果。

NPV(Negative Predictive Value),阴性预测值,被分类为阴性样本中分对为阴性的,计算公式NPV=TN/(TN+FN),可以用来评价分类为阴性的效果。

准确度(accuracy)也称效率(efficiency),用TP与TN人数之和占受试人数的百分率表示。

特异性

特异性是指没有特定临床疾病的患者的样本,其检测结果呈阴性的比率。

灵敏度

灵敏度是指患有明确临床疾病的患者的样本,其检测结果呈阳性的比率。

本发明提供了一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下一种或两种以上的甲基化标志物中的一种或两种以上:

第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

进一步的,

第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,

第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及

第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。

上述五个标志物中的甲基化水平在肺癌患者和正常人中具有明显差异,因此可以用于检测肺癌。

用于检测肺癌的标志物可以包括上述5个标志物中的任意一个或多个,例如可以包括1个、2个、3个、4个或五个。

在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物、第三标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物和第二标志物。

在一个具体的实施方式中,所述标志物包括第一标志物和第三标志物。

在一个具体的实施方式中,所述标志物包括第一标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第一标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第二标志物和第三标志物。

在一个具体的实施方式中,所述标志物包括第二标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第二标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第三标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第三标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第三标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第二标志物、第三标志物和第四标志物。

在一个具体的实施方式中,所述标志物包括第二标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第三标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第二标志物、第三标志物、第四标志物和第五标志物。

在一个具体的实施方式中,所述标志物包括第一标志物。

在一个具体的实施方式中,所述标志物包括第二标志物。

在一个具体的实施方式中,所述标志物包括第三标志物。

在一个具体的实施方式中,所述标志物包括第四标志物。

在一个具体的实施方式中,所述标志物包括第五标志物。

本发明还提供包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第一标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第二标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第三标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第四标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第五标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。

本发明的试剂盒可以是例如基于标志物甲基化的数据来进行肺癌诊断、早期筛查的任何试剂盒,只要其涵盖用于检测本发明所述标志物的甲基化水平的试剂即可。

本发明还提供一种用于检测肺癌的系统,其中所述系统包括:

样品采集模块,其用于采集受试者的样品;

样品处理模块其用于提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;测序模块,其对样品处理模块处理后的样品进行测序;

分析模块,其用于分析测序结果以确定样品中甲基化标志物的综合甲基化水平;

判定模块,其用于根据分析得到的综合甲基化水平判定受试者是否患有肺癌。

在样品采集模块中,其用于采集受试者的样品,例如可以为血液样品。

在样品处理模块中,提取cfDNA的步骤可以采用现有技术已知的方法。使用重亚硫酸盐处理能将C碱基转化成U碱基,而甲基化修饰后的C碱基不会和重亚硫酸盐发生反应,能够在重亚硫酸盐处理中,一直保持C碱基的状态。因此在对测序数据的比对中,但凡检测到的C碱基均表明该位置的C为甲基化修饰过的C。

测序模块中的测序优选采用二代测序技术进行测序。

在分析模块中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。比如,如果选择5个甲基化标志物用于检测肺癌的系统,则可以得到5个标志物中每一个的甲基化水平,然后通过对这5个甲基化标志物建模后确定的算法得到相应的公式,将五个标志物的甲基化水平输入相应的公式,计算得到针对这5个甲基化标志物的综合甲基化水平。同理,如果选择两个甲基化标志物用于检测肺癌的系统,则可以得到2个标志物中每一个的甲基化水平,然后通过对这2个甲基化标志物建模后确定的算法,计算得到针对这2个甲基化标志物的综合甲基化水平。

进一步地,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的。

在一个具体的实施方式中,所述综合甲基化水平基于第一标志物、第二标志物、第三标志物、第四标志物和第五标志物的甲基化水平确定。

在一个具体的实施方式中,综合甲基化水平基于第一标志物和第二标志物的甲基化水平确定。

在一个具体的实施方式中,综合甲基化水平基于第一标志物、第二标志物和第四标志物的甲基化水平确定。

在一个具体的实施方式中,所述综合甲基化水平基于第一标志物、第二标志物、第四标志物和第五标志物的甲基化水平确定。

在一个具体的实施方式中,所述综合甲基化水平基于第五标志物的甲基化水平确定。

其中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。

对于每个window,统计每个window中的CG位点个数。因为已知每个CG位点的甲基化胞嘧啶的深度和位点的总深度,进而可以计算出整个window的甲基化水平,即为所有CG位点的甲基化胞嘧啶的深度的总和除以所有CG位点的总深度之和的比值。每个window会通过上述计算方式,得到相应的一个甲基化水平。其中,每个CG位点的甲基化胞嘧啶的深度为测序检测结果显示该位点为甲基化的胞嘧啶的reads的个数,即测序结果显示测得的该位点结果为C(胞嘧啶)的reads的个数,位点的总深度为涵盖该位点的全部测序reads的总数,即测得结果显示该位点为C或T(胸腺嘧啶)的reads总数。甲基化胞嘧啶的深度和位点的总深度可以通过测序软件分析后直接提供。

具体地,可以通过以下方法分析测序结果并计算甲基化水平:

使用fastp等质控软件查看原始测序数据质量,并进行过滤、截取或去除低质量的reads,得到对应的clean data;采用Bismark bowtie2比对软件将质控后的clean data数据比对到参考基因组(hg19)上;利用deduplicate_bismark对初次比对的bam文件进行去重分析;利用Bismark_methylation_extractor提取对应的甲基化位点信息,得到最终的甲基化CG文件(包括所有CG位点信息文件);最后,利用sliding window的方法对参考基因组进行滑窗,计算出每个window区间中的CG位点的整体甲基化水平。

在判定模块中,所述标志物综合甲基化水平大于指定阈值则判定受试者患有肺癌,所述综合标志物甲基化水平小于等于指定阈值则判定受试者正常。其中,指定阈值是基于所选用的甲基化标志物,根据一定量的样本训练集(包含每个样本的类型和甲基化水平)构建模型后,根据得到的ROC曲线上的截断(cutoff)值确定的。其中在一个具体的实施方式中,构建模型为利用R中的randomForest包构建的随机森林模型。

在一个具体的实施方式中,所述指定阈值为0.4-0.6。在一个具体的实施方式中,所述指定阈值为0.442-0.501。

本发明还提供一种用于检测肺癌的方法,所述方法包括:

样品采集步骤,其采集受试者的样品;

样品处理步骤,其提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;

测序步骤,其对样品处理步骤处理后的样品进行测序;

分析步骤,其分析测序结果以确定样品中甲基化标志物的综合甲基化水平;

判定步骤,其根据分析得到的综合甲基化水平判定受试者是否患有肺癌。

所述标志物、甲基化标志物的综合甲基化水平、每个甲基化标志物的甲基化水平、受试者患有肺癌的描述如上针对用于检测肺癌的系统部分的描述。

实施例

本发明对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。

实施例1

1.1 cfDNA提取纯化

1.1.1血浆样本制备:

4℃、2000g离心血液样本10min,将血浆转移到一个新的离心管中。4℃、16000g离心血浆样本10min,如表1所示,根据使用的收集管类型,执行下一步,本实验中使用的收集管类型为其他。

表1

1.1.2裂解和结合

1.1.2.1.按照表2准备Binding Solution/Beads Mix,然后彻底混匀。

表2

加入适量体积的血浆样品。

1.1.2.2.彻底混匀血浆样品和结合溶液/磁珠混合物。

1.1.2.3.在旋转混匀仪上充分的结合10min,使cfDNA结合到磁珠上。

1.1.2.4.将结合管放在磁力架上5min,直到溶液变得澄清,磁珠完全吸附在磁力架上。

1.1.2.5.用移液管小心的弃去上清,继续保持管子在磁力架上几分钟,用移液管移去残留上清。

1.1.3洗涤

1.1.3.1.将珠子重悬在1ml洗涤液中。

1.1.3.2.将重悬液转移到新的无吸附1.5ml离心管中。保留结合管。

1.1.3.3.将含有珠子重悬液的离心管置于磁力架上,20s。

1.1.3.4.将分离得到的上清,吸出洗涤结合管,将清洗后的残留珠子再次收集到重悬液中,弃掉裂解/结合管。

1.1.3.5.管子置于磁力架上2min,直到溶液变得澄清,珠子聚集在磁力架,用1ml移液器移除上清。

1.1.3.6.管子留在磁力架上,用200μL移液器尽可能移除残留的液体。

1.1.3.7.将管子从磁力架取下来,加入1ml洗涤液,涡旋30s。

1.1.3.8.置于磁力架2min,直到溶液澄清,珠子聚集在磁力架上,用1ml移液管移除上清。

1.1.3.9.管子留在磁力架上,用200μL移液器彻底移除残留液体。

1.1.3.10.将管子从磁力架取下,加入1ml 80%乙醇,涡旋30s。

1.1.3.11.置于磁力架上2min,溶液变得澄清,用1ml移液器移去上清。

1.1.3.12.管子留在磁力架上,用200μL移液器移去残留液体。

1.1.3.13.用80%乙醇重复上述10-12步骤一次,尽可能除去上清。

1.1.3.14.管子留在磁力架上,空气中干燥珠子3~5分钟。

1.1.4洗脱cfDNA

1.1.4.1.按照表3加入稀释溶液。

表3

1.1.4.2.涡旋5min,置于磁力架上2min,溶液变得澄清,吸取上清液中的cfDNA。

1.1.4.3.纯化的cfDNA立即使用,或者将上清转移至新的离心管中,-20℃保存。

1.2 DNA打断与纯化:

1.2.1.按照Qubit浓度,取2μg DNA,加水补至125μl,加入到covaris 130μl打断管中,设置程序:50W,20%,200cycles,250s。

1.2.2打断结束后取1μl样品使用Agilent2100进行片段检测,正常打断后样品检测主峰约在150bp-200bp。

对于cfDNA样品,Agilent2100进行片段检测,直接Qubit用于后续的实验。

1.3末端修复、3‘端加“A”:

1.3.1.取50ng打断后的gDNA或cfDNA至PCR管中,用无核酸酶水补至50μl,加入表4试剂,涡旋混匀:

表4

1.3.2.设置以下程序在PCR仪上进行反应:

具体程序如表5所示,热盖温度85℃。

表5

1.4接头连接及纯化:

1.4.1.参照表6将接头提前稀释成合适的浓度:

表6

1.4.2.按表7配制以下试剂,轻轻吸打混匀,短暂离心:

表7

1.4.3.设置表8所示以下程序在PCR仪上进行反应:

无热盖。

表8

1.4.4.按照表9所示体系,加入纯化磁珠进行实验(Agencourt AMPure XP磁珠提前拿至室温震荡混合均匀备用):

表9

1.4.4.1.轻轻吸打混匀6次。

1.4.4.2.室温静置孵育5-15min,将PCR管置于磁力架上3min使溶液澄清。

1.4.4.3.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl 80%乙醇溶液,静置30s。

1.4.4.4.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。

1.4.4.5.室温静置3-5min,使残留乙醇彻底挥发。

1.4.4.6.加入22μl的Nuclease-freewater,把PCR管从磁力架取下,轻轻吸打重悬磁珠,避免产生气泡,室温静置2min。

1.4.4.7.将PCR管置于磁力架上2min使溶液澄清。

1.4.4.8.用移液器吸取20μl上清液,转移到新的PCR管。

1.5重亚硫酸盐处理及纯化:

1.5.1.预先拿出所需要的试剂,并溶解。根据表10加入各试剂:

表10

1.5.2.DNA保护缓冲液加入液体变成蓝色。轻轻吸打混匀,然后分成两管至于PCR仪上。

1.5.3.设置以下表11所示程序,并运行:

热盖105℃。

表11

1.5.4.简短离心将两管相同样本合并至同一个干净的1.5ml离心管中。

1.5.5.每个样本中加入310μl Buffer BL(样本量少于100ng加入1μl的CarrierRNA(1μg/μl)),涡旋混匀,简短离心。

1.5.6.加入250μl无水乙醇到每个样本中,涡旋混匀15s,简短离心,将混合液加入到准备好的对应的离心柱中。

1.5.7.静置1min,离心1min,将收集管中的液体重新转移到离心柱中,离心1min,弃去离心管的液体。

1.5.8.加入500μl buffer BW(注意是否加入无水乙醇),离心1min,弃去废液。1.5.9.加入500μl buffer BD(注意是否加入无水乙醇),盖好管盖,室温放置15min。离心1min,弃去离心下的液体。

1.5.10.加入500μl buffer BW(注意是否加入无水乙醇),离心1min,弃去离下来的液体,在重复一次,共2次。

1.5.11.加入250μl无水乙醇,离心1min,将离心柱放置到新的2ml收集管中,弃掉全部剩余液体。

1.5.12.将离心柱放置到干净的1.5ml离心管中,加入20μl无核酸酶水到离心柱膜中心,轻轻盖上管盖,室温放置1min,离心1min。

1.5.13.将收集管中的液体重新转移至离心柱中,室温放置1min,离心1min。

1.6扩增及纯化:

1.6.1.按表12所示配制反应体系,吹打混匀,短暂离心:

表12

1.6.2.设置以下表13所示程序并启动PCR程序:

热盖105℃

表13

1.6.3.PCR循环数根据投入DNA的量不同进行调整,参考数据如表14所示:

表14

1.6.4.向反应结束后的PCR管中加入50μl Agencourt AMPure XP磁珠,用移液器吹打混匀,避免产生气泡(Agencourt AMPure XP提前室温混匀并平衡)。

1.6.5.室温孵育5-15min,把PCR管置于磁力架上3min使溶液澄清。

1.6.6.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl 80%乙醇溶液,静置30s。

1.6.7.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。

1.6.8.室温静置5min,使残留乙醇彻底挥发。

1.6.9.加入30μl的无核酸酶水,将离心管从磁力架取下,使用移液器,轻轻吸打重悬磁珠。

1.6.10.室温静置2min,将200μl PCR管置于磁力架上2min使溶液澄清。

1.6.11.用移液器将上清液转移到新的200μl PCR管中(置于冰盒上),在反应管上标记好样本号,准备下一步反应。

1.6.12.取1μl样品使用Qubit进行文库浓度测定,记录文库浓度。

1.6.13.取1μl样品使用安捷伦2100进行文库片段长度测定,文库长度约在270bp-320bp间。

1.6.14.使用Illumina高通量测序平台(Illumina novaseq 6000)进行测序。

1.6.15.甲基化生信分析流程。流程如下:使用fastp等质控软件查看原始测序数据质量,并进行过滤、截取或去除低质量的reads,得到对应的clean data;采用Bismarkbowtie2比对软件将质控后的clean data数据比对到参考基因组(hg19)上;利用deduplicate_bismark对初次比对的bam文件进行去重;利用Bismark_methylation_extractor提取对应的甲基化位点信息,得到最终的甲基化CG文件(包括所有单个CG位点信息文件);最后,利用sliding window的方法在参考基因组上进行划窗,计算出每个window区间中的CG位点的整体甲基化水平;对于每个样本统计对应window的甲基化水平,根据不同样本的组别找出差异甲基化window。

实施例2

基于14个肺癌患者cfDNA和22个健康人cfDNA训练集(见图1),利用实施例1所述的方法检测14个肺癌患者和22个健康人的1583个初始标志物的甲基化水平,筛选出5个最显著区分肺癌和健康人cfDNA的甲基化区域作为用于肺癌检测相关的备选生物标志物。如表15所示,相应的标志物信息如下:第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点;第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点;第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点;第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点;第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点。

将检测到的14个肺癌患者和22个健康人将各备选标志物的、基于实施例1方法检测到的每个上述标志物的甲基化水平数据输入R软件,并利用R软件的randomForest包构建随机森林模型进行模型回归。回归结果显示,在训练集中,能够用于预测肺癌结果的基于5个标志物的综合甲基化水平的cutoff值为0.442,即指定阈值为0.442(大于0.442即判读为肺癌患者),最终模型得到的AUC达到1,准确度100%,灵敏度100%,特异性为100%,PPV为100%,NPV为100%,具体信息见表15和图2。

表15

实施例3

基于实施例2的中5个甲基化标志物,使用R软件中的pROC,根据每个甲基化标志物的甲基化水平,,计算得到5个甲基化标志物分别在测试集中(10个肺癌患者cfDNA和16个健康人cfDNA)的能够用于预测肺癌结果的综合甲基化水平的cutoff和AUC值,见表16。

表16

实施例4

基于实施例2中构建的模型,在10个肺癌患者cfDNA和16个健康人cfDNA的测试集中,能够用于预测肺癌结果的基于5个标志物的综合甲基化水平的cutoff为0.442,即指定阈值为0.442(大于0.442即判读为肺癌患者),AUC达到0.919,准确度84.62%,灵敏度90%,特异性为81.25%,PPV为75%,NPV为92.86%,具体信息见表17和图3。

表17

实施例5

使用上述5个甲基化标志物中的2个标志物(第一标志物和第二标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于2个标志物的综合甲基化水平的cutoff为0.465,即指定阈值为0.465(大于0.465即判读为肺癌患者)。在测试集(10个肺癌患者cfDNA和16个健康人cfDNA)中,AUC达到0.869,准确度84.62%,灵敏度100%,特异性为75%,PPV为71.43%,NPV为100%,详情见表15和图4。

实施例6

同实施例5,使用上述5个甲基化标志物中的3个标志物(第一标志物、第二标志物、第四标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于3个标志物的综合甲基化水平的cutoff为0.501,即指定阈值为0.501(大于0.501即判读为肺癌患者)。在测试集(10个肺癌患者cfDNA和16个健康人cfDNA)中,AUC达到0.894,准确度80.77%,灵敏度70%,特异性为87.5%,PPV为77.78%,NPV为82.35%,详情见表15和图5。

实施例7

同实施例5,使用上述5个甲基化标志物中的4个标志物(第一标志物、第二标志物、第四标志物、第五标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于4个标志物的综合甲基化水平的cutoff为0.461,即指定阈值为0.461(大于0.461即判读为肺癌患者)。在测试集中,AUC达到0.906,准确度80.77%,灵敏度90%,特异性为75%,PPV为69.23%,NPV为92.31%,详情见表15和图6。

综上可见,利用该方法在cfDNA中筛选出来的区域和肺癌的筛查有非常高的相关性。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权力要求为准。

序列表

SEQ ID NO:1:GCTCCGTTGCCCAAGCTGGAGTGCAGTGGCTTATAAAACATGGCTCACTGCAGCCTTGAACTCCTGGGCTCATGCAATCCTCCTGCCTCAGCCTCTGGAGTAGCTGGGACCACAGAAGTGCACCACCACACCCGGCTAGTTTTATTTTTATTTGTAGAGATGGGATCTCCCTATGTTGCCCAGTCTGGTCTCCAACCTGGGGCCTCAAGTGTTCCCCCTGCCTCGGCCTCCCAAAGTGCAGGGATTACAGCTTGGGCCACTGTGCCCAGCCCTTTCTTCCATCATTCCGTCCTCTCCTTCCTTCTTAATACTGCTTGTCAAACTGATTTTGCCACCCAGTTTGAAAAAGAAGGTCTAGAGGATTATCCCAATCATTAACTATTTCTGCAGGTTAGCTTACCTTTCCAGAATACAGAATAGAATTCAGCAAACTGCCTCAAAGAGCAGTTTCTAGATTTGACTTCTTCCTCTAGGGTTTATGAAGTCATCATACTGAAGTGACCTGGATTTCCCTATACGTGAACCTCATGACGTGGGAGCCCGGGGTAGGGAGGGACAGATAACATGAGAATCAATAGAAAGAACTGCAAGGTCTGAAGACAAGAACCATTTGTCTAGTGGAGTCTATTTTATATCCATTTTTTAAAAATCTCCATTTAAGATATTTAGCTTCAACGTGCACCTTGACCAATTAATCCAACAAACAAAACTCTGGCTTGGGGGCCCAGTTACTCACTTTCATGGAAAGAGACCTCTGTTTTTAGAACCAGGGATCTTGTGAGTCCCTCCCACGTCCCCAGCCCTTCTCTGGCCTCGGGTAACTTTTCCCTCCAGTTTGGTGGAAGGTTACATTAGAAGAAAATAGTCCCTACCGTCTAGAAAGTTTTCGGGGGGGGAAAAAAGGGCGTTGGACGTGCGGGTGGGTGGGTATACCGGGAGGGGACAGCTGGAGCCGCGAAGGCGCGGGGGCCCGCGGCGCGTGGGTGTGGAGGCCGCGGGGCGGCAGGAGGCACTGGGAAGCGGGGTGAAGAGCACCGAAGTCCAGAAAAGGGCAGTGTCCGCCCTGCGCTCCTCTGCTGGCGCCCGCAACCCGGGAGGGAGCGGCGAGGCTCCGAAGGGTGGGATTCGAGGTCTGAACCCTCGAGTGGGCTTGGGTTTTCAGGAGCCGCCTTTTCTTATTGATCATTTCTCTTTTGTCATCATAATCTCTTGGCCTCAGACTGAGTTAAGGGAGCCATAGTAGGAGTGCAGAAAATGAAGTGGAGGAAAAAAAAATGTGATATTTAAAATATAGTTTTTCCTACTTTCTTTTTCTCTCTCAAATTAATTTAGATGTAAATAACATTTTAACAGGGCCCAACATCAGGCTCCTAGGCTCTGGCTGCTGGTCTCACTTGACACCAGAATAAGATTTTGGTGTGCTAGTAATTTTGCCAAATGGAGGCCTACTCCCCAAAACATCACCGTGGTGCATGATGAACATTTCTGTAGGTGATGACGTGGAGTTTTTGTTTTACTTCATTCTAATACATGTCCCTGCTTCAAGTGGGTAAAATTATACCTAGCTCAGCCCAGGTTTAATTCAGATTATTTAAAAAATTTCAGTGGCAAGTAATTTACGAGCTTCTCTTTATTAAGATTTAGGAAATTTTGCTTTATTGCGCATGCATTTTAAGTATTTTTTTGCTGTGTTCCTAGTGTAGATAGAAAACAACCTGTCACTGTCTCCTAGTTGGCCCTGTCAACAAACATTTGAGAAGTGCTTAGATCAGAATGCTGTTGAGTACTACAAATTAAACAATCTGATGTACTTGTTAATTTCATTACAAACAGCAGTTAGGATTTCATATACATATAGTCTGTACCATGCTATATATCAGAAATCTTTGTAAATATAAACTCCTTAAATATAGGGACCCAGTTTTATTCTTCAGCGAAAGGGAGTTAATCTTTTGGTGTTGTGCATTTAGAAGGATCTCGGATGTAAGAGGCTCATTAAATGATAGCTGTTAGTATTATTTATCTTGGTATCTTCCAAAGGGCTTTGCACATGGCTAACACTAAGAAATATTGGTTGAATGAATGAAGGTGCCATGCCCATACTGTGATATACACAGAGAAAAGACCAGGATGGGGACACTAGCACAGTGATTTCATTTCATCAGTGAAGCTTTGTGTGGAAGTGTCCCTCCTGCAGCCCTTTTACCAGATGCAGGCTCCCTTGACCTTGGATTGTGGACCACTTAAAATTTTCAGGGGAAAAAGTGTGCCTAATTAGCTAGTAGGGCCTAACCTCTTGTCAAGATGGAACTTGAGAAGTTTGTCTAAGTATGGAAAAGCTAAGCTCACTTGACACAGATCACGGGAAGAAAGATTTCTGCATGTTATTCAAGTTATTCACGTCAAAAGCGATTAGGGGGCCCCAGCTTCCATTACATCATTCATTAGGAAAATGTGTGCTGGGAGCTCTGCAAATCACATGATTTGATGGAGGCATTGAGACTGGGTTTCTTGTGTGTCTGCCCTTGGCCATATTCAGTTTTTAGTATGTTTGGAAAAGGCTGAAGCAGAACATGAAGATCTAGTTTATTTTAATGCTGTCAGACAGCTAAATGGTGGAAACTTGTTGAAGAGATTTACTGAGCTGTTTCCTTAGATTGAAGACTTTAGAGAATTAATTAACAGGGTTCTGAGAGATACAACATGCCAGACCCCTACTGACTCTAAGAGTGTACTTTCTTACTGATATGATGTGATAGCTGAGCACAGTATATGTGAAACTGCTGGGGAGTAATACAAGAGCAGTGCTGATGTGTTCTAAGACATGCAGGTGTTCAGATGAGAACTGGCCATGACAACTGAGTCAGCCAGGCACTGGACTCATTTCCTTTTGCTTAAGCACCATGAGCTCAGTAGAAGCACAGACTTTCACAAGGTGCTGAACTACTTGGTGAAAATGAAGTCACAATTTTGGAAGAGCTTCACTGATTTTGATGTGTAGGTATTGTTTCACGTTTTAGCTGTTGCTTTTAGAATGCATGCCTTAAGATGGTTCTCAGTTATCATGCTATATCTATGCCACGCCATTTCTAGAGCAAGTAACTTAGCTGAAAGTGACTATACCTATAAGAAAACAAATATCCCTGTAGAGACATTTGTAGATGAATTGTGGAAGTACTCTAAAATTTTTGGCCAGATTTTGGGGAATGTTTGAGTCTAGCTGGTACAGAAAGTACATTCTGTTTTATGAAAATAGCAACATTGAAGTGAAAAGATATCATTAATGTATACATGTAGTCAGAAATTGAATGTGCCCTGGCTGATTGCAATTTATTTATTCACTTAATGCGTATTTATTGAGTACAAGGCCTTAGAGTTTCCTCAGTTCTTATAGTCTGTAACAGTGCCATTCCATAGGAATGTAATGAGAGCCACATATATAATTTACAATTTTCTAGTAGCCACATTAAAAAATTAAAAAGAAACTGATAAAATTAATGTTAATATTAATATATTTTATTTCACCAAATATATCTAAAAATATATCTAAAATATTATCCTAATATGTAATTAATATACTTTTATTGGTTTTTTTTTTTTGTTTTTTTTTTTTTTTTGGGGACAGGGTCTCACTCTGTCACCCAGGCTGGAGTGCAGTGACACAATCATGGTTCATTGCAGCCTCAACCTTCTGGGCTCAGATGCTCCTCCCACCTCAGCCTCGTGAGTAGCTGAGACCACAGGCATTTGCCACCAGCTAATTTTTTGTATTTTTTTGTAGAGACAGGATTTCCCATGTTGCCCAGGCTGGTCTCCAACTCCTGGGCTCACGCGATCCACCCGCCTTGGTCTCCTGAAGTGCAGGGATTACAGGCATGAGCCACTAGAAATTATTAACAAATTATTTTACATTCTTCGTTTTGAATTAAGTTTCTCGAATTTACTTACAGCAAATCTCACATTGCACTAGCCACATTTCAGGTACTAAAAAACTACATGTGATTAATGGTTACCATACTGGGCAGTCCATGTCTAGAGAGAAATACAGATGTGTAATTTGTAAACAGGTAAACAGATAATTTCTTTTCTTTTTCTATTTTTCTTTTTTTTTTGAGACAAATTCTCACTCTCCCAGGCCGGAGTGCAGAGGCTCAGTGCAGCCTCCACCCCCTGGGCTCAAGCGATCCTCCCAGCTAACCTCCCCAACTCCCCACCCCAGCAGCTGGGACTACAGGTGGGTACCACCATGTCCAACTAATTTTTATAGAGATAGGTTTTCATCATGTTACCCAGACTAGATAATTTTAATTAAATGTAATAAAGGCTATGATGAGAAAAGTACACTCATCATACAATGAAAGCATAGAAAAGGGGCTTAGTTCCTCCAGTTTTTCCTCCTAAAATCTCATAATTCTCTCTGCTTCTCTGCATCCTGCCTGCCACGACTCTAATCTAAGCCAGATTATCTCTCTCCTAGACTTGCACAACAGCTTCCGAAATTGTCTACCTGCATCTATCCCTGCCCCTGTTTGCAGATAAAGTGAGCTTTTAAAAACGCCCATCAGATCATGTCATTCCTCTGTTTAAAACCTTAAATATATGATGAACACATTGGACAAGTGTGAGATGATGTACATAAAGCGCCCAGCCCAAAGGTTCTGCTCACTGAGTTTAGTTCTCCTCGTTTCTTCCTTTCACTCTCTTTTTTCTTCCTCTTACTTTCCTCCCCAGCTCCTTCCTCTTATCACCTATCAGTCTCTTATCATCTGAATTTCTTTTTTCTTTCTTCCTTCTCACTTGCTTTCCATTTTTTTCTTCCATCTTTACTTTCTCTCCTTTCTGCTTTAGTTTATTTTAATATAGAATTTAAATAGATTTAGAAATTCATTCTTTAATTATTTACTTCTGAGTTCCAAGCTCTTCATTTAAAAATCAAAAGAGTACTGGGCACTGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGCGGA

SEQ ID NO:2:TCTCCATGAGCTGGTGCAAGGACAACTAATTTTAAGGTATTAAAAAAACAAACAGAAAAGCAACTCTTAAATGTATAACAAAAATTTACTGAGAATTAGGTCTGTGGATACAGTGTTAGACATCTAGACACTTTCCCCTGAAACTATTCTTCTTAAGTCAAGGAAACACCTCCATCCCTTTTCAGGAAACCCAGAAGGCAAACTCTAAGGCTTAAAGAATCCAGTAATTTAAGTCGTCCTTATTTTAAAGAAATAAGGACGGTTCTCCCTTCAAGTGGGCGCAGCTGCTACCTGGTATGACAGTACAGGGCCAGGCAGTGGGCTGTTTAAGGCGCATGCAGCCTAAAGATGATGGCTACCAGATTTCCTAGGCTGAGCTCAAAGCGCAGTGAGGGGTACTTTCAAAAAGTTAAACAATGTTTGCAAACATGCTCCCCCATGCCACGTTAAATGTCCCTCAACACTAGCCTGAAAGTTCCAAATGCCTATACTGACGCTGCAGCCATGCAAGAAAGCTGAATAAAATCACACCACGGGCAGAGAGAGGTGCAGCAACTGGCAAAGCACCTGTGTGTGCTGGCTGCACAAAACATGCCGCACAGTTCCGCTAAGCTAAATCTGTCCGTGTCCCCAGACTGCACCCAACTTTTAAGAAAGGAAAGAAACTGAGGCCAAAAGAATTAAAGTCGTGTGGGGACAAGCCTGAATTAAGAGCCAGAGTGGCAGAAAACCAGAGTGCTGCTGCAAAGAAGATGCTAGAGGGAGAAAGGAAAGACAGGGACGGGGGCTGGGGCTTGGGGAGGGCCAAGGTTGGGGTCTCACAGCGGCGCCTCTGAGCGCGACTCGAAACTTCGAGGCCAGCAGTCTCCACCCCCGGCCCTTTTCCCACTGTGGCGAGTGCCGCTGAAGAGCCTGCCCTTGGCCCCTCGCTCTCTCACTCACCTCGACATGAGCCTCCACATCTCGCGCTGCCCCATCGCCAAACACTCCGAAGCTAAAGCAGCAGAGCGAGAATCTCCCGGACCGTTCCAGCGCCTCGCGTGAGCCCCGCCCACCGCCGTCCTGCGCCGCCGGGCACAGATGACAAGTCCTCCAGGAAGCCAGAGCGACCGTTTCCGCTACGCGACGGGGAAGGGCGGGGCAAGAACGACGCCTGGAGGAAATAGTTGAGGGAGAGGAAGGGATCGGGGACCGGGCCAGGGAGAAGGCGGAGAGCGAGCTGAGGCGGAGCGGGAAGAGGGAGGATAGAACGGACTAGGGCGGATTCGCAGGAAAGGAGATTGCCCTCTAGAGGCTGTCTTAGCCCAAAGCGCAACCTGTTGTCTAGGCTTGGCCTGCCAATTTGACCAGCAGGGACTGATGTGAAAGACTTTTCTGGAATTTTAGTAATTTTTTATTAAAACGTAAACTTAGTATTCTTTGAGACTCAAGTAGAGGAATTACAGTTGATAAAGGACATCGATGTAGTTTATTCATTCCTAACCCAATACAGCCGAATTCCTTTAATATTAGGATTGAGACATTTTCATTTTTCTTGGGAAAAGTTACAGATCTCCCACTCTTCCTCAAAGACACACAAGAGTTGTCTGATTAAGACATAATAGATATGTCTTCCCAACTAAAGTAAAAGTTGCTGTTATCAGTGGAAGCATAATTACATTCAGAAAGTAGCTTACTCTTAAATGAAACCAACATTTAACTCAACTACTAGGATCCACTGTTAAATTGAGGAAAACGTTCCTCCGCTTCCAGATCCACCCAGATGTGTAGCAGAAGACATTTCATCGCCACTATTAAGTATTGACACATTTATCAGAAAGAAGAAATCCGGTGACAAATTTCAGAGAGGACACATGAAAGGAGTTATTCTTAGTACCTTGATATTTAAAGAGATACACTGTTGAGACTTTGATCAAAAATTACGTTGCTAACCTAGGTCAAATGTAATAACCAAATGCCCACTGAGAAGAGGACAGACAACAGACATCACAGAAGGAACTCCTTACCTGCAATTTGGTTTTTAACTGGCTACAGGACATCACCATCTGACATCACCATCATGCCTCATTCACTGCGCACAGAAATGAACCATTCATCTGACCTAGCATGGTTTACTGGAAAAAGCATGGGCTTTCCTGTTAGTCAGACTGAGATTCAAATCTTCCTTGCCGCCCTAGCTTCATGTGTGTGAAACCTGAGTCTCACAAGGCCTCATCGTTAGAAGGGCCCTGTGCTTGTTTTAATGCTGTGCTATTAATAATTTTTGAACAAGGAAACACAAATTTTCATTTTACACTAGGCCTGCAAATTATGTAATCAGTCCTACCCCTAGCACACTAATAGTTTAATGACCTTGAACAAATTATATAGCTTTTCAGAACCTCCATTTTCTCATCTGAAAATGGATGTGCTGATGATTAGAGGTGTTTGTGAAGATCCATTGAAATATAGAAATATGTGCATAAATTACTTAGGACTTCGTAGGTATCAAGACCTGTCAGTTATGCCACACCTTCCACCAAGCTGTCCTTCCTATTCCTAAATTCTCTATTTCTTCTAATGATGCTATCGTCTTCTGGCTTCCCGCTCTAGAAACCTCAGTCCTTTAAAGAAAATTATCTTAACATTCTATTTTGAAGATTTTCAAACATATAGCAAAATTATAAAAATTTAAAGCAAACGCCTATGTGCTCACCACATAGATTCTACCTAGATTTACATTTTATCTTGCTTTATTCCTTATCCCAAATACCTTATTTTTAAATGCATTTCAAAGTTAATTACAAGCATCGTTTTACTTCTCCCAAAATATGGCATGTGTCTTACTACCTAGAGTTAAATATTTGTTTACATATTTTCCCTTTTGAGACAAAATTTACATACAACAAAATGCACAAATCTTAAGTGTACATTCACTGAGTTTGACAAATGTATACACTTGTGTAACCAAAATTCCTTAGATATAAACCATTGTCATCACCCCAAAAAGTTTCCTCTCACGATTTCCCAGACATTCTCTGCCTACCACTGCCTTCCCCACCCCAACCCCCGCCCCAGAAGCAACCACTGTTCTGTCTCGAGAACCACTGTTTGTTTTGAGACAGGGTCTCACTCTATCACCCAGGCTAGAGTACAGTGCCACAGTCATAGCTGACTGCAGCTTCAACCTCCCTGGGCTGAAGCAATCCTCCCACCTCAGCCTCCTGAGTAGATGGGACTACAGGCACATGCCACCACACCCAGCTAATTTTTGTATTTTTTTTTTTTTTGCGAGATAGAGTCTTGCCATGTTACTCAGGCTGGCCTCCAACTCCTGGGCTCAAAAGATCTCCCCGCCTCGATCTCCCAAAGTGCTAGGATTACAGGTGTTAAATACTGCACCCAGTCTGATTTTTCTCTACCATCAATTAGTTTTGCATCTTCTGAAAATTCATATAAAATGGAATCATACAGTGTGCGCTTTTTTTGTATAGCATTTTTCACTTAGCAAAATGTCCATATCGTGTGTATCGGTAGTTTCCTCCATTTTATTACTGAGTAGTATTTCATTATATGAATACCCCATAGTTTACTGATCTGTGCTCCTCCTGATAGATTCCTGGGCTGTTGCCAGTTGGGGCTATTATGAATAAAGCTGCTGTAAACATTCTTGTGTAAATCTATTGTAGACATATGTTTCCTATTCTCTTGGGTAAATATCTATAAATAGAATGTCTTGGTTATAGGGTACATCAATGTTTGGTTTTATGTGAAACAGCCAGACCCTTTTTTCAAGAGTTTGTATCATTTTGGAAAAGAATTCTGGTGGCATACAATCCACAGAATGAGGAATAATGTTTATAAATGATATATTTGATAAAAGGCTATCTAGAATATGTAAAGAACTATCACAATTTAAATAACCAAATTTTAAAATGGATGACAGATTTGAATATACTATACAGCTCTCCAAAAAAGATATATGAATGATCAATACTCATATGAAAAGATGCTCAACATTATTAGCCATCGGGAAATACACATCAAAACCACAATGACTTCACACCCACCATAATTTTTTAAAAAACAAGTGTTAGTGAGGAGAATTTGGAATCCTCAGACACCACTGGTGATGTACAACAGTACAGCTATCTTGGAAAAATGTCTGGCAGTTCCTCAAATGGCTAAACAGAGAGACCATATGACCCAACAATTCCATACCTAGGTATTTACCCAAAATAAATGAAAACATAGTCCTCACAAAAACTTGTACATAATGTTTATGGCAGCATAATTGCCAAGAAGTAGAAATAACTCAAATGTCCATCAACTGATGAATAGGTAAAAACAAAAGTTATATATCTGTACAATGAAGTATTATTTGGCAAGAAACAGAAATGAAGTATCGATACATGGTACAACATGAGCAAACATGGAAAACACTGTGCTAGATGAAAGAAGCCAGTCACAATAGACCACATATTATATGATGCCATTTACATGAGTGTCTAGAATAAGCAAATGTGTACAGATAGAAAGTAGACGAGAGGTTGCCTAAGGTTGGAGAGGAGGCAGGAGAATTGGAGAGTGACAGCTAAGCGGCACAGGGTTTTCTGGTAGAGTAATGAAAATATTCTAAAATGAATAGTGGTGATGGTTGGACTACACTGAAATGAAAATATTCTAAAATGGATAGTGCTGACAGTTGGCTGAATCATATACTTTATATGGGTGAATTGTGTGGTATGTAAATTGTATCTTAATTTTTAAATAAAGAATTCTGGTTGCTCCATATTCTCAGCCACATTTTGTATTATCAGGCTTTTAAATTTTAGTCATGCTGGTGTGTGTGTGGTGTTATCTCCTTGTGGTTTTAATTTTCATTTTCCTGGTGTCTAATGATGTTGAGCACTTTTTCATATGCTTATTATCTTCTTTTAATTTTCTTGCCCATTTTTAAATTGGGGTTTTTGTTGTTGTTGTTTTGTTTTTTGTTTTTTTTTTTAGACAAAGTTTTGCTCT

SEQ ID NO:3AGCCATGCAAGAAAGCTGAATAAAATCACACCACGGGCAGAGAGAGGTGCAGCAACTGGCAAAGCACCTGTGTGTGCTGGCTGCACAAAACATGCCGCACAGTTCCGCTAAGCTAAATCTGTCCGTGTCCCCAGACTGCACCCAACTTTTAAGAAAGGAAAGAAACTGAGGCCAAAAGAATTAAAGTCGTGTGGGGACAAGCCTGAATTAAGAGCCAGAGTGGCAGAAAACCAGAGTGCTGCTGCAAAGAAGATGCTAGAGGGAGAAAGGAAAGACAGGGACGGGGGCTGGGGCTTGGGGAGGGCCAAGGTTGGGGTCTCACAGCGGCGCCTCTGAGCGCGACTCGAAACTTCGAGGCCAGCAGTCTCCACCCCCGGCCCTTTTCCCACTGTGGCGAGTGCCGCTGAAGAGCCTGCCCTTGGCCCCTCGCTCTCTCACTCACCTCGACATGAGCCTCCACATCTCGCGCTGCCCCATCGCCAAACACTCCGAAGCTAAAGCAGCAGAGCGAGAATCTCCCGGACCGTTCCAGCGCCTCGCGTGAGCCCCGCCCACCGCCGTCCTGCGCCGCCGGGCACAGATGACAAGTCCTCCAGGAAGCCAGAGCGACCGTTTCCGCTACGCGACGGGGAAGGGCGGGGCAAGAACGACGCCTGGAGGAAATAGTTGAGGGAGAGGAAGGGATCGGGGACCGGGCCAGGGAGAAGGCGGAGAGCGAGCTGAGGCGGAGCGGGAAGAGGGAGGATAGAACGGACTAGGGCGGATTCGCAGGAAAGGAGATTGCCCTCTAGAGGCTGTCTTAGCCCAAAGCGCAACCTGTTGTCTAGGCTTGGCCTGCCAATTTGACCAGCAGGGACTGATGTGAAAGACTTTTCTGGAATTTTAGTAATTTTTTATTAAAACGTAAACTTAGTATTCTTTGAGACTCAAGTAGAGGAATTACAGTTGATAAAGGACATCGATGTAGTTTATTCATTCCTAACCCAATACAGCCGAATTCCTTTAATATTAGGATTGAGACATTTTCATTTTTCTTGGGAAAAGTTACAGATCTCCCACTCTTCCTCAAAGACACACAAGAGTTGTCTGATTAAGACATAATAGATATGTCTTCCCAACTAAAGTAAAAGTTGCTGTTATCAGTGGAAGCATAATTACATTCAGAAAGTAGCTTACTCTTAAATGAAACCAACATTTAACTCAACTACTAGGATCCACTGTTAAATTGAGGAAAACGTTCCTCCGCTTCCAGATCCACCCAGATGTGTAGCAGAAGACATTTCATCGCCACTATTAAGTATTGACACATTTATCAGAAAGAAGAAATCCGGTGACAAATTTCAGAGAGGACACATGAAAGGAGTTATTCTTAGTACCTTGATATTTAAAGAGATACACTGTTGAGACTTTGATCAAAAATTACGTTGCTAACCTAGGTCAAATGTAATAACCAAATGCCCACTGAGAAGAGGACAGACAACAGACATCACAGAAGGAACTCCTTACCTGCAATTTGGTTTTTAACTGGCTACAGGACATCACCATCTGACATCACCATCATGCCTCATTCACTGCGCACAGAAATGAACCATTCATCTGACCTAGCATGGTTTACTGGAAAAAGCATGGGCTTTCCTGTTAGTCAGACTGAGATTCAAATCTTCCTTGCCGCCCTAGCTTCATGTGTGTGAAACCTGAGTCTCACAAGGCCTCATCGTTAGAAGGGCCCTGTGCTTGTTTTAATGCTGTGCTATTAATAATTTTTGAACAAGGAAACACAAATTTTCATTTTACACTAGGCCTGCAAATTATGTAATCAGTCCTACCCCTAGCACACTAATAGTTTAATGACCTTGAACAAATTATATAGCTTTTCAGAACCTCCATTTTCTCATCTGAAAATGGATGTGCTGATGATTAGAGGTGTTTGTGAAGATCCATTGAAATATAGAAATATGTGCATAAATTACTTAGGACTTCGTAGGTATCAAGACCTGTCAGTTATGCCACACCTTCCACCAAGCTGTCCTTCCTATTCCTAAATTCTCTATTTCTTCTAATGATGCTATCGTCTTCTGGCTTCCCGCTCTAGAAACCTCAGTCCTTTAAAGAAAATTATCTTAACATTCTATTTTGAAGATTTTCAAACATATAGCAAAATTATAAAAATTTAAAGCAAACGCCTATGTGCTCACCACATAGATTCTACCTAGATTTACATTTTATCTTGCTTTATTCCTTATCCCAAATACCTTATTTTTAAATGCATTTCAAAGTTAATTACAAGCATCGTTTTACTTCTCCCAAAATATGGCATGTGTCTTACTACCTAGAGTTAAATATTTGTTTACATATTTTCCCTTTTGAGACAAAATTTACATACAACAAAATGCACAAATCTTAAGTGTACATTCACTGAGTTTGACAAATGTATACACTTGTGTAACCAAAATTCCTTAGATATAAACCATTGTCATCACCCCAAAAAGTTTCCTCTCACGATTTCCCAGACATTCTCTGCCTACCACTGCCTTCCCCACCCCAACCCCCGCCCCAGAAGCAACCACTGTTCTGTCTCGAGAACCACTGTTTGTTTTGAGACAGGGTCTCACTCTATCACCCAGGCTAGAGTACAGTGCCACAGTCATAGCTGACTGCAGCTTCAACCTCCCTGGGCTGAAGCAATCCTCCCACCTCAGCCTCCTGAGTAGATGGGACTACAGGCACATGCCACCACACCCAGCTAATTTTTGTATTTTTTTTTTTTTTGCGAGATAGAGTCTTGCCATGTTACTCAGGCTGGCCTCCAACTCCTGGGCTCAAAAGATCTCCCCGCCTCGATCTCCCAAAGTGCTAGGATTACAGGTGTTAAATACTGCACCCAGTCTGATTTTTCTCTACCATCAATTAGTTTTGCATCTTCTGAAAATTCATATAAAATGGAATCATACAGTGTGCGCTTTTTTTGTATAGCATTTTTCACTTAGCAAAATGTCCATATCGTGTGTATCGGTAGTTTCCTCCATTTTATTACTGAGTAGTATTTCATTATATGAATACCCCATAGTTTACTGATCTGTGCTCCTCCTGATAGATTCCTGGGCTGTTGCCAGTTGGGGCTATTATGAATAAAGCTGCTGTAAACATTCTTGTGTAAATCTATTGTAGACATATGTTTCCTATTCTCTTGGGTAAATATCTATAAATAGAATGTCTTGGTTATAGGGTACATCAATGTTTGGTTTTATGTGAAACAGCCAGACCCTTTTTTCAAGAGTTTGTATCATTTTGGAAAAGAATTCTGGTGGCATACAATCCACAGAATGAGGAATAATGTTTATAAATGATATATTTGATAAAAGGCTATCTAGAATATGTAAAGAACTATCACAATTTAAATAACCAAATTTTAAAATGGATGACAGATTTGAATATACTATACAGCTCTCCAAAAAAGATATATGAATGATCAATACTCATATGAAAAGATGCTCAACATTATTAGCCATCGGGAAATACACATCAAAACCACAATGACTTCACACCCACCATAATTTTTTAAAAAACAAGTGTTAGTGAGGAGAATTTGGAATCCTCAGACACCACTGGTGATGTACAACAGTACAGCTATCTTGGAAAAATGTCTGGCAGTTCCTCAAATGGCTAAACAGAGAGACCATATGACCCAACAATTCCATACCTAGGTATTTACCCAAAATAAATGAAAACATAGTCCTCACAAAAACTTGTACATAATGTTTATGGCAGCATAATTGCCAAGAAGTAGAAATAACTCAAATGTCCATCAACTGATGAATAGGTAAAAACAAAAGTTATATATCTGTACAATGAAGTATTATTTGGCAAGAAACAGAAATGAAGTATCGATACATGGTACAACATGAGCAAACATGGAAAACACTGTGCTAGATGAAAGAAGCCAGTCACAATAGACCACATATTATATGATGCCATTTACATGAGTGTCTAGAATAAGCAAATGTGTACAGATAGAAAGTAGACGAGAGGTTGCCTAAGGTTGGAGAGGAGGCAGGAGAATTGGAGAGTGACAGCTAAGCGGCACAGGGTTTTCTGGTAGAGTAATGAAAATATTCTAAAATGAATAGTGGTGATGGTTGGACTACACTGAAATGAAAATATTCTAAAATGGATAGTGCTGACAGTTGGCTGAATCATATACTTTATATGGGTGAATTGTGTGGTATGTAAATTGTATCTTAATTTTTAAATAAAGAATTCTGGTTGCTCCATATTCTCAGCCACATTTTGTATTATCAGGCTTTTAAATTTTAGTCATGCTGGTGTGTGTGTGGTGTTATCTCCTTGTGGTTTTAATTTTCATTTTCCTGGTGTCTAATGATGTTGAGCACTTTTTCATATGCTTATTATCTTCTTTTAATTTTCTTGCCCATTTTTAAATTGGGGTTTTTGTTGTTGTTGTTTTGTTTTTTGTTTTTTTTTTTAGACAAAGTTTTGCTCTTGTTTTCCAGGCTGCAGTGTAATAGCACAATCTGGGCTCACTGCAACCTCCACTTCTGGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATGTTGGTCAGGCTGGTCTCGACCTCCCAATCTCAGGTGATCCACCTGCCTCGGCCTCCCAAAGTGCTGGGATTATAGGCGTGAGTCACCGCACCTGGCCAAATTGGGTTATCTTTTTATTCGTGTTTGATATTGTCTTTTTTTAATTATTGTTCAATTATCTATTTCTGTTACAAATTACCCCTAAAATTTAGCAGCTTAAAGCAACCAACATTTATTGTTTCTCAGAGATTCCAAGGCTCAGGAATCAGGGAGAGACTTAGCCAGGTGGTTCTGGCTCAGGGTCTCTCATGAGGCTGCAAAGCGTTGGCTGGGATTGCAGTCATCTGAATGCTCAGCTTCCAAACTTATGTGGTTGTTGGCAGGTTACAGGTCCTTTCACGTGGGCCTCTCCATGGGGCTGCT

SEQ ID NO:4GGAAGGAGGATCCCGAATCCCAGCCAGAACTGAGAAAGCCCTCAAAGGTGCGGAAAGGGGACTTTTCCCTCAGGAAAGCCGGCAACAGCAGAGGCCCTAGCCCACGTCGCCACACCCACTCCGCGCGCGCCCCTCGCCTCCCAGGGCCGGCTCTGCTCGGCCCCGCGGCCTCTCGGGCGCCCCCAGCCCGCCGGAAAGAAAGAAGCAGAAACCCGGAGCCTGGGTCCCACCCGCGACCCCTCACCTTCGCCCTTCTCGTCCTCTCACCTGCCAGTCCCCCAGGAAGAACAGGACGCCTCTTCCCCCTGATGGGCGGCCACAGGCTCGGATCCTTCCATTGCCGCCTGAGACACCGCCGCCGGCTACTGGAAGGTAGGAAGGGGCGGGACCGTGGGGGGGTCAAGGGGCGGGCGGAGACGTCATCAGAGGGGGCGGGCCTGGGGAAGCTAGGAGCCCGGCAGCGCCTTCCCGTCAACCCTAGGGGCGTCCTGGTTTCCGGTTTGGGTGTGGCCGCATGGCGTGCTGTGGTGCAGGTGGCCGAAGGGGGCGTTACTGTTGCGACTGGCATCCGCATCCGGCAGATGTAGATGGAACCAAAGTCCAGAAGTTACGCGTCACCCTTGCTCTACAGCCAAACATGCAGGACTCTAGTAACCCGCGAAATGATGGGATAGCGTTGCAAATCCTTAAAAGAGTCTTAACGGTAAGAAGAGGAAACAGCTTTATTTTATAAATAAACTGAAGGCTGCTAATAGCTCCAGATTGTCAGTGAGGGGATACCACTTAAAGATGTTATACATTTAATAAATAATTTTGGGAGTCCACTACATGTGAGGCGCTGCCTCAGATTTAATAGAATCATGTGACTTTTAGTGCCATAGATGTCGTTAGATCATCCAGTTTGGTCCCTTAAATTTGTGGGTAAGGGAAAGGAACTTCCGGTCAGTGCAAGTGACTTGGTCAAGGTTATAGAGCTAGTCACTGTTAGATTACCAGAACACATATCTAAAAAGTTCTCATATAATTCTTTTTCATTTACTTCCGTGTCACCTTTCTTAGAAAGCAAAAATGAGTTGGACACAATAACATTAGGATTTGTCTTTCACTAAATAACACTGTATATTTGAATAAACATCTGCAGGATTTTTAAAATTAGCATATACTTTGGGTATTATGTAATTTTCTGTGATGTATCATATTTTTAATTAGAAATTTTTCCTCTCATATGGAGATGAGGGTCCAGGCAAAACTGTATTATCCTTCGTGCCCTCTATTCTCTTCAAAATTGCACATCTTAAAATACCTGGAAGCTTTATGTTGCTCACCTATAGCATTATCCGTGTTCCTCAATCCAGTTGTGAACCTTTTCCACATTAAAATGTTCTTGATCTGTGTTCTATTCTTTCAAGGCTCTGCTCTAGCACTAAGATAATGCTACAGGACTGAAGATAATGAAAAAGATTGAAGAAAGCAGAAACAGAACAAAAATCAGATTATTTCAAAGTTTCTTTCCTTGTAAAGGTTAAAACAGAGCATACTTCCTTATTATGCCCACTAGGTTAACTAGAATCTCCTGTTTTTTTAAAAAAAACTGGCTCATTTTTTCAAAATCCACTTTAATTACATGGTGCTTAGCACAAGCAACTCCATTCTGGTTTGATCTGATGGGGCCTAGTGTAGAAGGCTAGGCCAAAACAATGGCCTGCCATTACCCACGCTTCTTCATATTTTAACATCCATGAATAGAGGATGAATTTTTAAAAAATAAATACAGAAAACGATGCATCTTAAAATTGAGGGCATGTTAGATTTGATAAAATATGGTGTGAATTATTTCAGGCATGTAACAAGCAACCAGATTTAACAGATTTTAATGTTTTGTCACATATGTAAAATGGGAAAGAAAACTAGGCGATCACAGCTTTTTGACAGTGAGGCTTTATGTCATAAGAAAGTAGAATGACATATTGAGGAAACTTAAGGGAAAAATATGTAGGCCAAAGATTTTACATTCAGCAAAACTAATATACAAAAGGTACAAACTGTTATCAACAATTGATATATCAATTTGGTGAGACTAGTGTTTTCATGAGCCCCTCCTTAATAATTAATTGGAGAAAGTGTCTGACAATCAGAATTATTACAGAAACATTGATCTAAGGATTGACTCGGTTTCTTTACAGCAAATCATAATCTGTTGCATTTATTAGCTTTTGTGTTTCTTGTAGTTTATTCTTTATTACTAATTCTCCTGAGTTCTGTCACCTCATTTCTGAGGTTTTTCTAATTCAGAATCAAGTTCTTCCATATCTTTTATCATTTCTCTAATGTCATTTAGCTAGTTTCAAAATAATAAATTGTTTTGTAGTGCATCTTTCAGGCATGTTTTTATTATCTTTGATGATGATGTTATATTCCTTATTCTCTTCACATAATAACTGCATGGATTTGAACTTGATGCTTTTTTTGTTGCTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAGACAGAGCCTTGCTCTGTTGCCCAGGTTGGAGTGCAGTGGCGGGATCTTGGCTCACTGCAAGTTCTGCCTCCCGGATTCACGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAACTACAGGCACCTGCCACCACGCCCGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCCACCCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGTTATTGCTCATTTTTATGTGAAATTGGTGTTCCTGAACTAATATGAGACAGGCTTCTTAGCCCAATAAGCCTAAGTTTATCAGGAACAAAACTGTATTCCAAGAAAGTCAGGTATATTAGTCTGTTTTCACACTGCTATAAAGAAATACCCGAGACTGGGTAATTTATAAAGGAAAGAGATTTAGTTGACTCACAGTTCCACATGGCTGGGGAGTCCTCAGGAAACTTAAATCATAGCAGAAGGTGAAGGAGAAGCAAGACATATCTTACACGGTGGCAGGAGAGAAGTGAGATCGTGGGAAAACTGCCACTTTTAAAACCATCAGATCTCATGAGAACTCCCTCATTATCACAAGAATAGCATGGGGGAACTGCCCCCATAATCTAATCACCTCCCACCAGGTCTCTCCTTGCACACATGGGAATTAAAATTTGAAGTGAGATTTGGGTGGGGACACAGAGCAGACCATATCATCAGGTTTACTGGCTCATTGCAAGGAGGGAGCCCACATTCCAGAAGAACCATGGGGTACCTCACCAACAGAGGAAGAGATAGATTTATTGTAGGAATTTGGGGAAGTATGGAGTTTAGAAGGAATTGAAATGAAGTAGTGCTTTGATAGACTCAAAAGAAAGCAAGGCTGTTTGTAAAGAATTCTACACTACATCTAAACTATTACTAATGGCAAAAACTGCAATTACTTTTGCACCAACGTAATACAAGATGGACCCAGGGTTCTGTTTTTTGGAAATTGCAAAGTTCTGCCTCTCAGAAGTAGAAACTATTTCTCTGTGTCAATGTGACTTTAGATATTCTAGCCAAGAGTGAGATATTTCAATCTTAATAATAGGATTTAAACAGCAGAGTTTTTGACAATCTTTTGATATTGTCATAAATGTTCTATGATTTTAGAGAAAAGGGCATTGTGTGAGTAAAAAATCAGTTACTCTAAGGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTGAGACATTTTAAAGCATCTTCCAGAGAGAAATAGTATTTTCTGTTAATTTCACAGCTGGCTTTATTTATGCCTGTTATCCCATAGCTGATGAATGGCAAAGCAGATTTTTACTTTCTTATTCTATGCTTATTTGCTTTCTCACAGGTTTTGGGAAAACTTTTCTAATTTCAGAGAATTCCCTTTTCTGTTGCTTTTGTGTAATGTTCAGCAATATTATGGTTTTATTTCCTTTTTAAATTAATACATACATAATAAGCATATATTTATGGGGTATTTTGATATTTGCGTACAAGGTATAATGATAAAACCAAGGTAATTGTGATATCCATCACCTCAAACATTGTTTATTTCTTTGTGTTAGGAACATTTCACATCTTGCCTTCTAGCTATTTTGAAATATATGATAAATTATTGTTAACTATAGTCACCCTCTAGTGCTATCGAACACTAGAAATTGTTTCCTCTATCTAATTGTATTTTTGTACCCATTACGCAACCTTTTTCATCCTCCTTACCCCCAACCTTCCCAGCCTCTGGTAACCATCATTCTACTCTCTACTGCCATGAGATCCACTTTTTTAGCTCTCACTTATGAGTGAGAATATGTGCTATTTGTCTTTCTATGCCTGGCATTTCACTTAACATAATGACCTCCAGTTCCATCTATGGTGCTTCAAACTACATGATTTCATGTTTTTGTGTAGATGACACATTTTTAAAATCCATTCATCTGTTGATGGACACTTAGATTGATTCCATATCTTGGCTATTGTGAATAGTACTGTAATAAACATGGGCATGCAGATACCTTTTAAATTTATTGAATTCCGTTTTTGGATGTATACTCAGGAATGGGATTGTTGGATCATGTGGTAGATCTATTTTTAGATTTTTGAGAAACTTCCATACTGTTTTTCATAGTTTCTGTACTAATTTACGTTCCCACCAGCAATGCACTAGTGTTCTCCTTTTGCCACATCCTCACCAGCATCTGTTATTTTCTGCCTTTTTGGTAATAGTAATCTTAACTGAGGTGAGATGATGTCTTATTGTGGTTTTGATTTGCATTTCCCTGGTGACTGGTGATGTTGAGCATTTTTTCATATGTCTGTTGGCCATTTATATGTCTTCTTTTGATAAATGCCTGTTTAGATCATTTGCCCATTTTAAAATTGGATTATTTGGGGGTTTTTGCTATGGAGTTGTTTGAGTTCCTTATATATTCTGATTATTA

SEQ ID NO:5TAACCTCTCTGTTCTTTTCCGTTCTTATCTATAAATAGGGGCAACCAACCACCAGTCCTCAGAGGCTCTGAAAATCTAATTTCAATTGTGGTTGAAAGTGCTCTGAAAATTTGAAATGTTACACAGATGTATGGGATTCCTCCTGAGCTGTATTTGAAACCACAGATATCCATCTGATTTGTAAATCATTTACCTTTTAGTCTCCCTAGCAGAAGTTAATAGTGAATGCTTTTCTTTTTTTTCTTTTTATTTTCTTGATTGCTAATTTTGTTAAGTTCATAAGCGATACTTACATATGTACATGTGGAGGCTGGAATCTGCTCTGGTTGATGTTGTAGTGCGTGAATGCCTGGGTGGGGTTTGAGCTGTACTCATCCACCGTTATGGTAACTTTGCCTTGAGAAGGAATCCCATGTGCCATCCTTCCTCCCTATAGGCATGAGCAATTCACAACTTTACAGAGCAAAAGATGGAAGCAGGCATGGTGCGTTTCAGCCAACCTCTGAATCCAAGGATCTACTCATCAATACCGCTGTGCATTTCTGAAAGAAAAAAAAAATGTATATAAAATGAGAACAAAGAGAAAAAGGGTGTTCTAAGAGACATAAATTTAACATCTAGACATGAAACTAGTTCAGGGAAAATCTGAATATGTGTTGTTGGCTCATGGATACAACTGTTCCCAACTCTCTTCCCTTCATGCACTTCAAAGTGGATATTACACTCTATACATATTGCTGGGTGCTAGCAAATCTTCTCAATGGAGTTCAAACTAAGATTTCCTCTTTAATTATAATTATGGCACTTAGCGTGAATTACGGAAGGGGCATATCCACCGTTGCCATGGCATCTGGCTATACATGGTTTGTGCTCCAAGTGAAGAATCTTCCAAACCTGCCCTGCTAATTGGAATGTTTGGTCTTTACAAAGTTGGTGTCACGTAATCATTTGAAAGCTCCATGTTTAAAGCAGCTATATAACACAATGACAGATAAGAATTTAAAATGTTGTGCTTATAACAAATACATGTGTATTACTATAACATGCACATAATAACCACACATTACACATATTTTTTTCTTTCACAAGCAGCTCCCAAAATACACAGGTAGGCAATGCTTGGCATTCCTCACTGGCCCAGAACCTTATGGTAAGGCAAATCTTTCTTGTTAAATGTAGTGTCATTTTTTTCAACACTCCAGTCACTCAGGGGAAAACCAAACACCTCCAGGTCTGGACCACCACTTTGAATGCATTCATTACCTCCCTTCTTCAAGCCCCGATGGAGCGGTAAAGAAGGGCGGCCATTACATCTGCCACCTCATTCTTGGTGCAACGTAATTCTCAGTAATTGGTTTCATTTTTTAAAATTTCCATTAGTTCTGATTTTTTCATAAATGTCAATATATTATTTGCTGCACTGGGTTGAGAAATGAAGATGTCTATTTTTATGGTAGGTGTGCAAAGGCTGAGGGAAGCAAATTCTCATGTCCAAGTTGTTGCAATTGATCAGTGCGGTAGAGAAGAAGCCGTAGTACACTCCTTGGGTAACCCTTAGGTAACCCATGCTCTTACTTTAAGTGCACAACGTCAGAATAGGTTTGCCATGTGCACCATTAAGCTCTGAGAATCTTATCTGCTATTTCAAATAAAAATATTTAGAATAATAAGATGAGATTTAAAATTGGCATGAAACACCTTAAATATCGAGCAAAAGGCAGATGGCCTGCCATAGGCCATTTATTTTATTATTTTACAACCCGGGGCTTGAGTAATCCCCCATATGCTAGCTGGGCTAAGAAATTCCAGAGTGTTCTACTCAAATCATTGCCTTCTTCATATTAGCAAAGCAAGCTAAATAACACCCACCTTGCCTGCCTTCCTAATGTCAAGTGCACTGCCAAGAGATGAATCCCCGTGCTCTGGCATTTTAAACAAAGTGTCACTTTGGGTTCTCTTTCTTTTTCCTGACTTCATGGGAGGTATGAGTCTTTTAAGCGCCAGATGATAGACAACCAGGCCAGTAGGATTAACTAAATTAAAATCTTTCCCTGCTCCTCTGATGTAAGATATCTATAAGAACTGCTTACAAATCATAATGTAGCAGTTTTCATACCAAGTTTGCAGCTGTTTCCTTAATTTCTCCCACAATTATATTTTACTGTTATTTTGCATAACAGTAAAACACAACACCTGCTTCAAATTGCAGTCCTGTTCTAAGTACTGTAATTCTCTTTTGAGACACAAAGTACCGAGACACTACTGAAGCGCAAAACTGCATAATTGCGTCGCGCTGAAAAGTAAATACAAATGAAAACATCTTCCTGTTATAGAAATGACTGTCATTAAAAAGAATGTTAGCCATCAAAGCACAGAGGGGGAAAAATTCACATTTTCAGACTGTGAGAAGTTAGTGTTTGCATAAATTAGAGAGTGGTGTAAAAATTACTTGACAATTCTTATGTTCATTCTTCCATCAATGTCTATTGTGTGAAATACTGAACATTAAGAAGCAAAGGAAATCAAATTCATGTCTAGACCGCTGTGACCTCTGAGTAACAATCTCTGCACCCAGTACTAGAAAGATTTTAAATGTTTCTGGAGTAAACACACTAATTAAACCAAGCAAATGTGGCCTAGAAATAAAATATACATACCTAATATTTAAACATCTAGGTAATGACTTGTAGCAGTTAGCATGATACCCACCCAAGTTCTACTATTTGAAGCTAAGAAGAGACAGAATTTAGCAGCTGATCAATTTGCACTTCTACATGGTCCGCTTGATCCTAATGTCAACCTTCTCTATCACTGAACATCTATGCCTCTTTGCACCTTTGCCCCAGTAAGACAAATAGAACATCTTTTCATCAGCAAGCACAGGCCCCTGTAACTCTGAAAGGCTAAATGGGTGGCTGGCACCTCATTTGAATTCATCTTTGCCATGTTCCCTTTCAAATGTTTCATCGAAACAGTGCACCTGCAGCGTCTATCTTCTTTAATCTGGAGTCCTTTGAAGAAAATGTCAGACTGAGGCAGAGAGCTTCAAAACTTTCACAGCACCTTTACAGACAAGTCAAGAAAAGGCTTATTTTTTAAAATGCTATGTTCATCCCCACCCGTATCTCAAAATGAACACATCTTAAGAATTTTAAACACAAACACCTGGAAAAGACTTTTTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTAAACTCTCAGAGACAAGGGACAATAGACAAAACCACTTCCTATAACCTGAGAAATTTGGAGAGAGCTTGAAACAAGACAGAAGGATACACTGCTTACAACTATCAAGAAGATGTATATTTAGGCAGTAAAACCTTCCAAATGATCAGATTTTCGTGCATCTCACCCTCTTCACACTTACTTTAACTTTTTACACACAATATTTAAAGACAGCACTATTCTTTTCATAAATTTTCATTTTATACTTCAACACACTTTCCACAAAACAAAGGAACCCAGGACGAAATATCAAGAAGCCGAAAGAAAAATCTAAAAGGGACTGACACTGCCAAACATTCATGCTGGTGCTAGTTTGATTTTTCTCTTTAAAAAGAAAATCATGTGAGTACATTTTGCATTTCCTAGACAGCAATCACTTCTGTCCTTTAAGCTGTACAACTAGCAATATTCTTTTCCAGGAATCTAGTTGGAAAACCTTTTAAAGTCGGCTGGCAATGAAGGGATTAAAAGCTGAGGAATTAAATAACTGTCTCCACCTCCTAGACACCAGAAGTCCAATTTACCAAAACTTTCAAAGCAACAACTCATGACCTCTCTACCCCTGCACTGCCCAGCACAGCCTATGAGAAAAGAGCCCGCGGTTTTCTCGTTTCAACAAGGATGCTCATTTTAATCACTTGCCCCAAGATCTCCAGACCGAGCCTGGCGGGACTTTGGAACTTGCCTGCTCCAAATCCGCCAAATTTCGCTCTCTCCTCCCTCTGCCGCGCAGATCCAGTGCGTTCTTAATTCACGCCCCTACTCTTTTATGCCCACTTCCAGTTACTCATCCCTGTATCTGGGAGCGATGCCCACACGCCTTCCCGGCGGGCTTCTCCGCCAGGGTTTTTTTGGGGGAGGCTGACATAAAGTTCCACGTGCTTCTGTCCACCGAGCGCCCTCCCTCCCACCGCACTTACACCTGAACTTGTCTCCAGCACTGCGGACACCCGGGTGACACATTCTTTCGGAGAGGGAGGGCAAGACTTTTCTCCGGAGCCTCTGGCAACTCGTGGAGTCTATATAAGGTGGGGCGGTGGGGGGCGCGGAATTCTCTACTTTGGATTGGTTTGTTTGTTTTAAATCTAGGGTGGTGGGCAGTTGCGCGAGGCGGGGTGGGGGGTGCTTTATGAACTACACACACACACACACACACACACACACACACACACCACATACACTCGCCCTGCCCTTCTAGGCTCACGGCTGGCTCTTCCCGGCTACAACTTCCCCTTCCTTCCTGAAACACCAGCGCCTTACTCGCTCAGTCCCCCGTTGCCACCTCCGTCACCTCCTCGGCCGCCGCTCCTGCTGGCACTGCTGGCGCTAGCGCTGGCGGCCCCGGGCTCCGCTGGACGCCTATCTTTTTTCTCTCCCTCTTCCCTAGCTCTGGATTGATTGATGACCACCGGCGGCCAATGGCTCTGACACCACGCCATCCTCGGTCGGGCATCACAGCCCCACGTCCCCGACCTCAGCCTCCCGGGCGCGTTGGCATCCCCGAACCCACAGCGCTGAGCCCGAGCCCGGGGCCGCCGCCTCCTCCCTGCTCTACGCCTGGGCGCTGCCAGGTTCCTTCCCTGGAACGGCGGAGAAAGGAAGGGAGGGAGCCAGCGAGCGTTGGAAGGGGGTGTGGAGGCCACGGGATCTCCCCCTCTTCTGACATCTTTTTTCACTTAAACTTTTGTTTGTCCCACCCCCCCGACCTGTTTGTGTTTGTTTGCAGCATCTCAAATCAATTATACATT。

SEQUENCE LISTING

<110> 博尔诚(北京)科技有限公司

<120> 用于检测肺癌的标志物及其用途和系统

<130> PE01733

<160> 5

<170> PatentIn version 3.5

<210> 1

<211> 5001

<212> DNA

<213> 人工序列

<220>

<223> 人工序列描述: 人工合成的序列

<400> 1

gctccgttgc ccaagctgga gtgcagtggc ttataaaaca tggctcactg cagccttgaa 60

ctcctgggct catgcaatcc tcctgcctca gcctctggag tagctgggac cacagaagtg 120

caccaccaca cccggctagt tttattttta tttgtagaga tgggatctcc ctatgttgcc 180

cagtctggtc tccaacctgg ggcctcaagt gttccccctg cctcggcctc ccaaagtgca 240

gggattacag cttgggccac tgtgcccagc cctttcttcc atcattccgt cctctccttc 300

cttcttaata ctgcttgtca aactgatttt gccacccagt ttgaaaaaga aggtctagag 360

gattatccca atcattaact atttctgcag gttagcttac ctttccagaa tacagaatag 420

aattcagcaa actgcctcaa agagcagttt ctagatttga cttcttcctc tagggtttat 480

gaagtcatca tactgaagtg acctggattt ccctatacgt gaacctcatg acgtgggagc 540

ccggggtagg gagggacaga taacatgaga atcaatagaa agaactgcaa ggtctgaaga 600

caagaaccat ttgtctagtg gagtctattt tatatccatt ttttaaaaat ctccatttaa 660

gatatttagc ttcaacgtgc accttgacca attaatccaa caaacaaaac tctggcttgg 720

gggcccagtt actcactttc atggaaagag acctctgttt ttagaaccag ggatcttgtg 780

agtccctccc acgtccccag cccttctctg gcctcgggta acttttccct ccagtttggt 840

ggaaggttac attagaagaa aatagtccct accgtctaga aagttttcgg ggggggaaaa 900

aagggcgttg gacgtgcggg tgggtgggta taccgggagg ggacagctgg agccgcgaag 960

gcgcgggggc ccgcggcgcg tgggtgtgga ggccgcgggg cggcaggagg cactgggaag 1020

cggggtgaag agcaccgaag tccagaaaag ggcagtgtcc gccctgcgct cctctgctgg 1080

cgcccgcaac ccgggaggga gcggcgaggc tccgaagggt gggattcgag gtctgaaccc 1140

tcgagtgggc ttgggttttc aggagccgcc ttttcttatt gatcatttct cttttgtcat 1200

cataatctct tggcctcaga ctgagttaag ggagccatag taggagtgca gaaaatgaag 1260

tggaggaaaa aaaaatgtga tatttaaaat atagtttttc ctactttctt tttctctctc 1320

aaattaattt agatgtaaat aacattttaa cagggcccaa catcaggctc ctaggctctg 1380

gctgctggtc tcacttgaca ccagaataag attttggtgt gctagtaatt ttgccaaatg 1440

gaggcctact ccccaaaaca tcaccgtggt gcatgatgaa catttctgta ggtgatgacg 1500

tggagttttt gttttacttc attctaatac atgtccctgc ttcaagtggg taaaattata 1560

cctagctcag cccaggttta attcagatta tttaaaaaat ttcagtggca agtaatttac 1620

gagcttctct ttattaagat ttaggaaatt ttgctttatt gcgcatgcat tttaagtatt 1680

tttttgctgt gttcctagtg tagatagaaa acaacctgtc actgtctcct agttggccct 1740

gtcaacaaac atttgagaag tgcttagatc agaatgctgt tgagtactac aaattaaaca 1800

atctgatgta cttgttaatt tcattacaaa cagcagttag gatttcatat acatatagtc 1860

tgtaccatgc tatatatcag aaatctttgt aaatataaac tccttaaata tagggaccca 1920

gttttattct tcagcgaaag ggagttaatc ttttggtgtt gtgcatttag aaggatctcg 1980

gatgtaagag gctcattaaa tgatagctgt tagtattatt tatcttggta tcttccaaag 2040

ggctttgcac atggctaaca ctaagaaata ttggttgaat gaatgaaggt gccatgccca 2100

tactgtgata tacacagaga aaagaccagg atggggacac tagcacagtg atttcatttc 2160

atcagtgaag ctttgtgtgg aagtgtccct cctgcagccc ttttaccaga tgcaggctcc 2220

cttgaccttg gattgtggac cacttaaaat tttcagggga aaaagtgtgc ctaattagct 2280

agtagggcct aacctcttgt caagatggaa cttgagaagt ttgtctaagt atggaaaagc 2340

taagctcact tgacacagat cacgggaaga aagatttctg catgttattc aagttattca 2400

cgtcaaaagc gattaggggg ccccagcttc cattacatca ttcattagga aaatgtgtgc 2460

tgggagctct gcaaatcaca tgatttgatg gaggcattga gactgggttt cttgtgtgtc 2520

tgcccttggc catattcagt ttttagtatg tttggaaaag gctgaagcag aacatgaaga 2580

tctagtttat tttaatgctg tcagacagct aaatggtgga aacttgttga agagatttac 2640

tgagctgttt ccttagattg aagactttag agaattaatt aacagggttc tgagagatac 2700

aacatgccag acccctactg actctaagag tgtactttct tactgatatg atgtgatagc 2760

tgagcacagt atatgtgaaa ctgctgggga gtaatacaag agcagtgctg atgtgttcta 2820

agacatgcag gtgttcagat gagaactggc catgacaact gagtcagcca ggcactggac 2880

tcatttcctt ttgcttaagc accatgagct cagtagaagc acagactttc acaaggtgct 2940

gaactacttg gtgaaaatga agtcacaatt ttggaagagc ttcactgatt ttgatgtgta 3000

ggtattgttt cacgttttag ctgttgcttt tagaatgcat gccttaagat ggttctcagt 3060

tatcatgcta tatctatgcc acgccatttc tagagcaagt aacttagctg aaagtgacta 3120

tacctataag aaaacaaata tccctgtaga gacatttgta gatgaattgt ggaagtactc 3180

taaaattttt ggccagattt tggggaatgt ttgagtctag ctggtacaga aagtacattc 3240

tgttttatga aaatagcaac attgaagtga aaagatatca ttaatgtata catgtagtca 3300

gaaattgaat gtgccctggc tgattgcaat ttatttattc acttaatgcg tatttattga 3360

gtacaaggcc ttagagtttc ctcagttctt atagtctgta acagtgccat tccataggaa 3420

tgtaatgaga gccacatata taatttacaa ttttctagta gccacattaa aaaattaaaa 3480

agaaactgat aaaattaatg ttaatattaa tatattttat ttcaccaaat atatctaaaa 3540

atatatctaa aatattatcc taatatgtaa ttaatatact tttattggtt tttttttttt 3600

gttttttttt tttttttggg gacagggtct cactctgtca cccaggctgg agtgcagtga 3660

cacaatcatg gttcattgca gcctcaacct tctgggctca gatgctcctc ccacctcagc 3720

ctcgtgagta gctgagacca caggcatttg ccaccagcta attttttgta tttttttgta 3780

gagacaggat ttcccatgtt gcccaggctg gtctccaact cctgggctca cgcgatccac 3840

ccgccttggt ctcctgaagt gcagggatta caggcatgag ccactagaaa ttattaacaa 3900

attattttac attcttcgtt ttgaattaag tttctcgaat ttacttacag caaatctcac 3960

attgcactag ccacatttca ggtactaaaa aactacatgt gattaatggt taccatactg 4020

ggcagtccat gtctagagag aaatacagat gtgtaatttg taaacaggta aacagataat 4080

ttcttttctt tttctatttt tctttttttt ttgagacaaa ttctcactct cccaggccgg 4140

agtgcagagg ctcagtgcag cctccacccc ctgggctcaa gcgatcctcc cagctaacct 4200

ccccaactcc ccaccccagc agctgggact acaggtgggt accaccatgt ccaactaatt 4260

tttatagaga taggttttca tcatgttacc cagactagat aattttaatt aaatgtaata 4320

aaggctatga tgagaaaagt acactcatca tacaatgaaa gcatagaaaa ggggcttagt 4380

tcctccagtt tttcctccta aaatctcata attctctctg cttctctgca tcctgcctgc 4440

cacgactcta atctaagcca gattatctct ctcctagact tgcacaacag cttccgaaat 4500

tgtctacctg catctatccc tgcccctgtt tgcagataaa gtgagctttt aaaaacgccc 4560

atcagatcat gtcattcctc tgtttaaaac cttaaatata tgatgaacac attggacaag 4620

tgtgagatga tgtacataaa gcgcccagcc caaaggttct gctcactgag tttagttctc 4680

ctcgtttctt cctttcactc tcttttttct tcctcttact ttcctcccca gctccttcct 4740

cttatcacct atcagtctct tatcatctga atttcttttt tctttcttcc ttctcacttg 4800

ctttccattt ttttcttcca tctttacttt ctctcctttc tgctttagtt tattttaata 4860

tagaatttaa atagatttag aaattcattc tttaattatt tacttctgag ttccaagctc 4920

ttcatttaaa aatcaaaaga gtactgggca ctgtggctca cgcctgtaat cccagcactt 4980

tgggaggccg aggtgggcgg a 5001

<210> 2

<211> 5001

<212> DNA

<213> 人工序列

<220>

<223> 人工序列描述: 人工合成的序列

<400> 2

tctccatgag ctggtgcaag gacaactaat tttaaggtat taaaaaaaca aacagaaaag 60

caactcttaa atgtataaca aaaatttact gagaattagg tctgtggata cagtgttaga 120

catctagaca ctttcccctg aaactattct tcttaagtca aggaaacacc tccatccctt 180

ttcaggaaac ccagaaggca aactctaagg cttaaagaat ccagtaattt aagtcgtcct 240

tattttaaag aaataaggac ggttctccct tcaagtgggc gcagctgcta cctggtatga 300

cagtacaggg ccaggcagtg ggctgtttaa ggcgcatgca gcctaaagat gatggctacc 360

agatttccta ggctgagctc aaagcgcagt gaggggtact ttcaaaaagt taaacaatgt 420

ttgcaaacat gctcccccat gccacgttaa atgtccctca acactagcct gaaagttcca 480

aatgcctata ctgacgctgc agccatgcaa gaaagctgaa taaaatcaca ccacgggcag 540

agagaggtgc agcaactggc aaagcacctg tgtgtgctgg ctgcacaaaa catgccgcac 600

agttccgcta agctaaatct gtccgtgtcc ccagactgca cccaactttt aagaaaggaa 660

agaaactgag gccaaaagaa ttaaagtcgt gtggggacaa gcctgaatta agagccagag 720

tggcagaaaa ccagagtgct gctgcaaaga agatgctaga gggagaaagg aaagacaggg 780

acgggggctg gggcttgggg agggccaagg ttggggtctc acagcggcgc ctctgagcgc 840

gactcgaaac ttcgaggcca gcagtctcca cccccggccc ttttcccact gtggcgagtg 900

ccgctgaaga gcctgccctt ggcccctcgc tctctcactc acctcgacat gagcctccac 960

atctcgcgct gccccatcgc caaacactcc gaagctaaag cagcagagcg agaatctccc 1020

ggaccgttcc agcgcctcgc gtgagccccg cccaccgccg tcctgcgccg ccgggcacag 1080

atgacaagtc ctccaggaag ccagagcgac cgtttccgct acgcgacggg gaagggcggg 1140

gcaagaacga cgcctggagg aaatagttga gggagaggaa gggatcgggg accgggccag 1200

ggagaaggcg gagagcgagc tgaggcggag cgggaagagg gaggatagaa cggactaggg 1260

cggattcgca ggaaaggaga ttgccctcta gaggctgtct tagcccaaag cgcaacctgt 1320

tgtctaggct tggcctgcca atttgaccag cagggactga tgtgaaagac ttttctggaa 1380

ttttagtaat tttttattaa aacgtaaact tagtattctt tgagactcaa gtagaggaat 1440

tacagttgat aaaggacatc gatgtagttt attcattcct aacccaatac agccgaattc 1500

ctttaatatt aggattgaga cattttcatt tttcttggga aaagttacag atctcccact 1560

cttcctcaaa gacacacaag agttgtctga ttaagacata atagatatgt cttcccaact 1620

aaagtaaaag ttgctgttat cagtggaagc ataattacat tcagaaagta gcttactctt 1680

aaatgaaacc aacatttaac tcaactacta ggatccactg ttaaattgag gaaaacgttc 1740

ctccgcttcc agatccaccc agatgtgtag cagaagacat ttcatcgcca ctattaagta 1800

ttgacacatt tatcagaaag aagaaatccg gtgacaaatt tcagagagga cacatgaaag 1860

gagttattct tagtaccttg atatttaaag agatacactg ttgagacttt gatcaaaaat 1920

tacgttgcta acctaggtca aatgtaataa ccaaatgccc actgagaaga ggacagacaa 1980

cagacatcac agaaggaact ccttacctgc aatttggttt ttaactggct acaggacatc 2040

accatctgac atcaccatca tgcctcattc actgcgcaca gaaatgaacc attcatctga 2100

cctagcatgg tttactggaa aaagcatggg ctttcctgtt agtcagactg agattcaaat 2160

cttccttgcc gccctagctt catgtgtgtg aaacctgagt ctcacaaggc ctcatcgtta 2220

gaagggccct gtgcttgttt taatgctgtg ctattaataa tttttgaaca aggaaacaca 2280

aattttcatt ttacactagg cctgcaaatt atgtaatcag tcctacccct agcacactaa 2340

tagtttaatg accttgaaca aattatatag cttttcagaa cctccatttt ctcatctgaa 2400

aatggatgtg ctgatgatta gaggtgtttg tgaagatcca ttgaaatata gaaatatgtg 2460

cataaattac ttaggacttc gtaggtatca agacctgtca gttatgccac accttccacc 2520

aagctgtcct tcctattcct aaattctcta tttcttctaa tgatgctatc gtcttctggc 2580

ttcccgctct agaaacctca gtcctttaaa gaaaattatc ttaacattct attttgaaga 2640

ttttcaaaca tatagcaaaa ttataaaaat ttaaagcaaa cgcctatgtg ctcaccacat 2700

agattctacc tagatttaca ttttatcttg ctttattcct tatcccaaat accttatttt 2760

taaatgcatt tcaaagttaa ttacaagcat cgttttactt ctcccaaaat atggcatgtg 2820

tcttactacc tagagttaaa tatttgttta catattttcc cttttgagac aaaatttaca 2880

tacaacaaaa tgcacaaatc ttaagtgtac attcactgag tttgacaaat gtatacactt 2940

gtgtaaccaa aattccttag atataaacca ttgtcatcac cccaaaaagt ttcctctcac 3000

gatttcccag acattctctg cctaccactg ccttccccac cccaaccccc gccccagaag 3060

caaccactgt tctgtctcga gaaccactgt ttgttttgag acagggtctc actctatcac 3120

ccaggctaga gtacagtgcc acagtcatag ctgactgcag cttcaacctc cctgggctga 3180

agcaatcctc ccacctcagc ctcctgagta gatgggacta caggcacatg ccaccacacc 3240

cagctaattt ttgtattttt tttttttttg cgagatagag tcttgccatg ttactcaggc 3300

tggcctccaa ctcctgggct caaaagatct ccccgcctcg atctcccaaa gtgctaggat 3360

tacaggtgtt aaatactgca cccagtctga tttttctcta ccatcaatta gttttgcatc 3420

ttctgaaaat tcatataaaa tggaatcata cagtgtgcgc tttttttgta tagcattttt 3480

cacttagcaa aatgtccata tcgtgtgtat cggtagtttc ctccatttta ttactgagta 3540

gtatttcatt atatgaatac cccatagttt actgatctgt gctcctcctg atagattcct 3600

gggctgttgc cagttggggc tattatgaat aaagctgctg taaacattct tgtgtaaatc 3660

tattgtagac atatgtttcc tattctcttg ggtaaatatc tataaataga atgtcttggt 3720

tatagggtac atcaatgttt ggttttatgt gaaacagcca gacccttttt tcaagagttt 3780

gtatcatttt ggaaaagaat tctggtggca tacaatccac agaatgagga ataatgttta 3840

taaatgatat atttgataaa aggctatcta gaatatgtaa agaactatca caatttaaat 3900

aaccaaattt taaaatggat gacagatttg aatatactat acagctctcc aaaaaagata 3960

tatgaatgat caatactcat atgaaaagat gctcaacatt attagccatc gggaaataca 4020

catcaaaacc acaatgactt cacacccacc ataatttttt aaaaaacaag tgttagtgag 4080

gagaatttgg aatcctcaga caccactggt gatgtacaac agtacagcta tcttggaaaa 4140

atgtctggca gttcctcaaa tggctaaaca gagagaccat atgacccaac aattccatac 4200

ctaggtattt acccaaaata aatgaaaaca tagtcctcac aaaaacttgt acataatgtt 4260

tatggcagca taattgccaa gaagtagaaa taactcaaat gtccatcaac tgatgaatag 4320

gtaaaaacaa aagttatata tctgtacaat gaagtattat ttggcaagaa acagaaatga 4380

agtatcgata catggtacaa catgagcaaa catggaaaac actgtgctag atgaaagaag 4440

ccagtcacaa tagaccacat attatatgat gccatttaca tgagtgtcta gaataagcaa 4500

atgtgtacag atagaaagta gacgagaggt tgcctaaggt tggagaggag gcaggagaat 4560

tggagagtga cagctaagcg gcacagggtt ttctggtaga gtaatgaaaa tattctaaaa 4620

tgaatagtgg tgatggttgg actacactga aatgaaaata ttctaaaatg gatagtgctg 4680

acagttggct gaatcatata ctttatatgg gtgaattgtg tggtatgtaa attgtatctt 4740

aatttttaaa taaagaattc tggttgctcc atattctcag ccacattttg tattatcagg 4800

cttttaaatt ttagtcatgc tggtgtgtgt gtggtgttat ctccttgtgg ttttaatttt 4860

cattttcctg gtgtctaatg atgttgagca ctttttcata tgcttattat cttcttttaa 4920

ttttcttgcc catttttaaa ttggggtttt tgttgttgtt gttttgtttt ttgttttttt 4980

ttttagacaa agttttgctc t 5001

<210> 3

<211> 5001

<212> DNA

<213> 人工序列

<220>

<223> 人工序列描述: 人工合成的序列

<400> 3

agccatgcaa gaaagctgaa taaaatcaca ccacgggcag agagaggtgc agcaactggc 60

aaagcacctg tgtgtgctgg ctgcacaaaa catgccgcac agttccgcta agctaaatct 120

gtccgtgtcc ccagactgca cccaactttt aagaaaggaa agaaactgag gccaaaagaa 180

ttaaagtcgt gtggggacaa gcctgaatta agagccagag tggcagaaaa ccagagtgct 240

gctgcaaaga agatgctaga gggagaaagg aaagacaggg acgggggctg gggcttgggg 300

agggccaagg ttggggtctc acagcggcgc ctctgagcgc gactcgaaac ttcgaggcca 360

gcagtctcca cccccggccc ttttcccact gtggcgagtg ccgctgaaga gcctgccctt 420

ggcccctcgc tctctcactc acctcgacat gagcctccac atctcgcgct gccccatcgc 480

caaacactcc gaagctaaag cagcagagcg agaatctccc ggaccgttcc agcgcctcgc 540

gtgagccccg cccaccgccg tcctgcgccg ccgggcacag atgacaagtc ctccaggaag 600

ccagagcgac cgtttccgct acgcgacggg gaagggcggg gcaagaacga cgcctggagg 660

aaatagttga gggagaggaa gggatcgggg accgggccag ggagaaggcg gagagcgagc 720

tgaggcggag cgggaagagg gaggatagaa cggactaggg cggattcgca ggaaaggaga 780

ttgccctcta gaggctgtct tagcccaaag cgcaacctgt tgtctaggct tggcctgcca 840

atttgaccag cagggactga tgtgaaagac ttttctggaa ttttagtaat tttttattaa 900

aacgtaaact tagtattctt tgagactcaa gtagaggaat tacagttgat aaaggacatc 960

gatgtagttt attcattcct aacccaatac agccgaattc ctttaatatt aggattgaga 1020

cattttcatt tttcttggga aaagttacag atctcccact cttcctcaaa gacacacaag 1080

agttgtctga ttaagacata atagatatgt cttcccaact aaagtaaaag ttgctgttat 1140

cagtggaagc ataattacat tcagaaagta gcttactctt aaatgaaacc aacatttaac 1200

tcaactacta ggatccactg ttaaattgag gaaaacgttc ctccgcttcc agatccaccc 1260

agatgtgtag cagaagacat ttcatcgcca ctattaagta ttgacacatt tatcagaaag 1320

aagaaatccg gtgacaaatt tcagagagga cacatgaaag gagttattct tagtaccttg 1380

atatttaaag agatacactg ttgagacttt gatcaaaaat tacgttgcta acctaggtca 1440

aatgtaataa ccaaatgccc actgagaaga ggacagacaa cagacatcac agaaggaact 1500

ccttacctgc aatttggttt ttaactggct acaggacatc accatctgac atcaccatca 1560

tgcctcattc actgcgcaca gaaatgaacc attcatctga cctagcatgg tttactggaa 1620

aaagcatggg ctttcctgtt agtcagactg agattcaaat cttccttgcc gccctagctt 1680

catgtgtgtg aaacctgagt ctcacaaggc ctcatcgtta gaagggccct gtgcttgttt 1740

taatgctgtg ctattaataa tttttgaaca aggaaacaca aattttcatt ttacactagg 1800

cctgcaaatt atgtaatcag tcctacccct agcacactaa tagtttaatg accttgaaca 1860

aattatatag cttttcagaa cctccatttt ctcatctgaa aatggatgtg ctgatgatta 1920

gaggtgtttg tgaagatcca ttgaaatata gaaatatgtg cataaattac ttaggacttc 1980

gtaggtatca agacctgtca gttatgccac accttccacc aagctgtcct tcctattcct 2040

aaattctcta tttcttctaa tgatgctatc gtcttctggc ttcccgctct agaaacctca 2100

gtcctttaaa gaaaattatc ttaacattct attttgaaga ttttcaaaca tatagcaaaa 2160

ttataaaaat ttaaagcaaa cgcctatgtg ctcaccacat agattctacc tagatttaca 2220

ttttatcttg ctttattcct tatcccaaat accttatttt taaatgcatt tcaaagttaa 2280

ttacaagcat cgttttactt ctcccaaaat atggcatgtg tcttactacc tagagttaaa 2340

tatttgttta catattttcc cttttgagac aaaatttaca tacaacaaaa tgcacaaatc 2400

ttaagtgtac attcactgag tttgacaaat gtatacactt gtgtaaccaa aattccttag 2460

atataaacca ttgtcatcac cccaaaaagt ttcctctcac gatttcccag acattctctg 2520

cctaccactg ccttccccac cccaaccccc gccccagaag caaccactgt tctgtctcga 2580

gaaccactgt ttgttttgag acagggtctc actctatcac ccaggctaga gtacagtgcc 2640

acagtcatag ctgactgcag cttcaacctc cctgggctga agcaatcctc ccacctcagc 2700

ctcctgagta gatgggacta caggcacatg ccaccacacc cagctaattt ttgtattttt 2760

tttttttttg cgagatagag tcttgccatg ttactcaggc tggcctccaa ctcctgggct 2820

caaaagatct ccccgcctcg atctcccaaa gtgctaggat tacaggtgtt aaatactgca 2880

cccagtctga tttttctcta ccatcaatta gttttgcatc ttctgaaaat tcatataaaa 2940

tggaatcata cagtgtgcgc tttttttgta tagcattttt cacttagcaa aatgtccata 3000

tcgtgtgtat cggtagtttc ctccatttta ttactgagta gtatttcatt atatgaatac 3060

cccatagttt actgatctgt gctcctcctg atagattcct gggctgttgc cagttggggc 3120

tattatgaat aaagctgctg taaacattct tgtgtaaatc tattgtagac atatgtttcc 3180

tattctcttg ggtaaatatc tataaataga atgtcttggt tatagggtac atcaatgttt 3240

ggttttatgt gaaacagcca gacccttttt tcaagagttt gtatcatttt ggaaaagaat 3300

tctggtggca tacaatccac agaatgagga ataatgttta taaatgatat atttgataaa 3360

aggctatcta gaatatgtaa agaactatca caatttaaat aaccaaattt taaaatggat 3420

gacagatttg aatatactat acagctctcc aaaaaagata tatgaatgat caatactcat 3480

atgaaaagat gctcaacatt attagccatc gggaaataca catcaaaacc acaatgactt 3540

cacacccacc ataatttttt aaaaaacaag tgttagtgag gagaatttgg aatcctcaga 3600

caccactggt gatgtacaac agtacagcta tcttggaaaa atgtctggca gttcctcaaa 3660

tggctaaaca gagagaccat atgacccaac aattccatac ctaggtattt acccaaaata 3720

aatgaaaaca tagtcctcac aaaaacttgt acataatgtt tatggcagca taattgccaa 3780

gaagtagaaa taactcaaat gtccatcaac tgatgaatag gtaaaaacaa aagttatata 3840

tctgtacaat gaagtattat ttggcaagaa acagaaatga agtatcgata catggtacaa 3900

catgagcaaa catggaaaac actgtgctag atgaaagaag ccagtcacaa tagaccacat 3960

attatatgat gccatttaca tgagtgtcta gaataagcaa atgtgtacag atagaaagta 4020

gacgagaggt tgcctaaggt tggagaggag gcaggagaat tggagagtga cagctaagcg 4080

gcacagggtt ttctggtaga gtaatgaaaa tattctaaaa tgaatagtgg tgatggttgg 4140

actacactga aatgaaaata ttctaaaatg gatagtgctg acagttggct gaatcatata 4200

ctttatatgg gtgaattgtg tggtatgtaa attgtatctt aatttttaaa taaagaattc 4260

tggttgctcc atattctcag ccacattttg tattatcagg cttttaaatt ttagtcatgc 4320

tggtgtgtgt gtggtgttat ctccttgtgg ttttaatttt cattttcctg gtgtctaatg 4380

atgttgagca ctttttcata tgcttattat cttcttttaa ttttcttgcc catttttaaa 4440

ttggggtttt tgttgttgtt gttttgtttt ttgttttttt ttttagacaa agttttgctc 4500

ttgttttcca ggctgcagtg taatagcaca atctgggctc actgcaacct ccacttctgg 4560

ctaattttgt atttttagta gagatggggt ttctccatgt tggtcaggct ggtctcgacc 4620

tcccaatctc aggtgatcca cctgcctcgg cctcccaaag tgctgggatt ataggcgtga 4680

gtcaccgcac ctggccaaat tgggttatct ttttattcgt gtttgatatt gtcttttttt 4740

aattattgtt caattatcta tttctgttac aaattacccc taaaatttag cagcttaaag 4800

caaccaacat ttattgtttc tcagagattc caaggctcag gaatcaggga gagacttagc 4860

caggtggttc tggctcaggg tctctcatga ggctgcaaag cgttggctgg gattgcagtc 4920

atctgaatgc tcagcttcca aacttatgtg gttgttggca ggttacaggt cctttcacgt 4980

gggcctctcc atggggctgc t 5001

<210> 4

<211> 5001

<212> DNA

<213> 人工序列

<220>

<223> 人工序列描述: 人工合成的序列

<400> 4

ggaaggagga tcccgaatcc cagccagaac tgagaaagcc ctcaaaggtg cggaaagggg 60

acttttccct caggaaagcc ggcaacagca gaggccctag cccacgtcgc cacacccact 120

ccgcgcgcgc ccctcgcctc ccagggccgg ctctgctcgg ccccgcggcc tctcgggcgc 180

ccccagcccg ccggaaagaa agaagcagaa acccggagcc tgggtcccac ccgcgacccc 240

tcaccttcgc ccttctcgtc ctctcacctg ccagtccccc aggaagaaca ggacgcctct 300

tccccctgat gggcggccac aggctcggat ccttccattg ccgcctgaga caccgccgcc 360

ggctactgga aggtaggaag gggcgggacc gtgggggggt caaggggcgg gcggagacgt 420

catcagaggg ggcgggcctg gggaagctag gagcccggca gcgccttccc gtcaacccta 480

ggggcgtcct ggtttccggt ttgggtgtgg ccgcatggcg tgctgtggtg caggtggccg 540

aagggggcgt tactgttgcg actggcatcc gcatccggca gatgtagatg gaaccaaagt 600

ccagaagtta cgcgtcaccc ttgctctaca gccaaacatg caggactcta gtaacccgcg 660

aaatgatggg atagcgttgc aaatccttaa aagagtctta acggtaagaa gaggaaacag 720

ctttatttta taaataaact gaaggctgct aatagctcca gattgtcagt gaggggatac 780

cacttaaaga tgttatacat ttaataaata attttgggag tccactacat gtgaggcgct 840

gcctcagatt taatagaatc atgtgacttt tagtgccata gatgtcgtta gatcatccag 900

tttggtccct taaatttgtg ggtaagggaa aggaacttcc ggtcagtgca agtgacttgg 960

tcaaggttat agagctagtc actgttagat taccagaaca catatctaaa aagttctcat 1020

ataattcttt ttcatttact tccgtgtcac ctttcttaga aagcaaaaat gagttggaca 1080

caataacatt aggatttgtc tttcactaaa taacactgta tatttgaata aacatctgca 1140

ggatttttaa aattagcata tactttgggt attatgtaat tttctgtgat gtatcatatt 1200

tttaattaga aatttttcct ctcatatgga gatgagggtc caggcaaaac tgtattatcc 1260

ttcgtgccct ctattctctt caaaattgca catcttaaaa tacctggaag ctttatgttg 1320

ctcacctata gcattatccg tgttcctcaa tccagttgtg aaccttttcc acattaaaat 1380

gttcttgatc tgtgttctat tctttcaagg ctctgctcta gcactaagat aatgctacag 1440

gactgaagat aatgaaaaag attgaagaaa gcagaaacag aacaaaaatc agattatttc 1500

aaagtttctt tccttgtaaa ggttaaaaca gagcatactt ccttattatg cccactaggt 1560

taactagaat ctcctgtttt tttaaaaaaa actggctcat tttttcaaaa tccactttaa 1620

ttacatggtg cttagcacaa gcaactccat tctggtttga tctgatgggg cctagtgtag 1680

aaggctaggc caaaacaatg gcctgccatt acccacgctt cttcatattt taacatccat 1740

gaatagagga tgaattttta aaaaataaat acagaaaacg atgcatctta aaattgaggg 1800

catgttagat ttgataaaat atggtgtgaa ttatttcagg catgtaacaa gcaaccagat 1860

ttaacagatt ttaatgtttt gtcacatatg taaaatggga aagaaaacta ggcgatcaca 1920

gctttttgac agtgaggctt tatgtcataa gaaagtagaa tgacatattg aggaaactta 1980

agggaaaaat atgtaggcca aagattttac attcagcaaa actaatatac aaaaggtaca 2040

aactgttatc aacaattgat atatcaattt ggtgagacta gtgttttcat gagcccctcc 2100

ttaataatta attggagaaa gtgtctgaca atcagaatta ttacagaaac attgatctaa 2160

ggattgactc ggtttcttta cagcaaatca taatctgttg catttattag cttttgtgtt 2220

tcttgtagtt tattctttat tactaattct cctgagttct gtcacctcat ttctgaggtt 2280

tttctaattc agaatcaagt tcttccatat cttttatcat ttctctaatg tcatttagct 2340

agtttcaaaa taataaattg ttttgtagtg catctttcag gcatgttttt attatctttg 2400

atgatgatgt tatattcctt attctcttca cataataact gcatggattt gaacttgatg 2460

ctttttttgt tgctcttttt tttttttttt tttttttttt tttgagacag agccttgctc 2520

tgttgcccag gttggagtgc agtggcggga tcttggctca ctgcaagttc tgcctcccgg 2580

attcacgcca ttctcctgcc tcagcctccc gagtagctgg aactacaggc acctgccacc 2640

acgcccggct aattttttgt atttttagta gagacggggt ttcaccgtgt tagccaggat 2700

ggtctcgatc tcctgacctc gtgatccacc ccttggcctc ccaaagtgct gggattacag 2760

gcgtgagtta ttgctcattt ttatgtgaaa ttggtgttcc tgaactaata tgagacaggc 2820

ttcttagccc aataagccta agtttatcag gaacaaaact gtattccaag aaagtcaggt 2880

atattagtct gttttcacac tgctataaag aaatacccga gactgggtaa tttataaagg 2940

aaagagattt agttgactca cagttccaca tggctgggga gtcctcagga aacttaaatc 3000

atagcagaag gtgaaggaga agcaagacat atcttacacg gtggcaggag agaagtgaga 3060

tcgtgggaaa actgccactt ttaaaaccat cagatctcat gagaactccc tcattatcac 3120

aagaatagca tgggggaact gcccccataa tctaatcacc tcccaccagg tctctccttg 3180

cacacatggg aattaaaatt tgaagtgaga tttgggtggg gacacagagc agaccatatc 3240

atcaggttta ctggctcatt gcaaggaggg agcccacatt ccagaagaac catggggtac 3300

ctcaccaaca gaggaagaga tagatttatt gtaggaattt ggggaagtat ggagtttaga 3360

aggaattgaa atgaagtagt gctttgatag actcaaaaga aagcaaggct gtttgtaaag 3420

aattctacac tacatctaaa ctattactaa tggcaaaaac tgcaattact tttgcaccaa 3480

cgtaatacaa gatggaccca gggttctgtt ttttggaaat tgcaaagttc tgcctctcag 3540

aagtagaaac tatttctctg tgtcaatgtg actttagata ttctagccaa gagtgagata 3600

tttcaatctt aataatagga tttaaacagc agagtttttg acaatctttt gatattgtca 3660

taaatgttct atgattttag agaaaagggc attgtgtgag taaaaaatca gttactctaa 3720

gggtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtttgaga cattttaaag 3780

catcttccag agagaaatag tattttctgt taatttcaca gctggcttta tttatgcctg 3840

ttatcccata gctgatgaat ggcaaagcag atttttactt tcttattcta tgcttatttg 3900

ctttctcaca ggttttggga aaacttttct aatttcagag aattcccttt tctgttgctt 3960

ttgtgtaatg ttcagcaata ttatggtttt atttcctttt taaattaata catacataat 4020

aagcatatat ttatggggta ttttgatatt tgcgtacaag gtataatgat aaaaccaagg 4080

taattgtgat atccatcacc tcaaacattg tttatttctt tgtgttagga acatttcaca 4140

tcttgccttc tagctatttt gaaatatatg ataaattatt gttaactata gtcaccctct 4200

agtgctatcg aacactagaa attgtttcct ctatctaatt gtatttttgt acccattacg 4260

caaccttttt catcctcctt acccccaacc ttcccagcct ctggtaacca tcattctact 4320

ctctactgcc atgagatcca cttttttagc tctcacttat gagtgagaat atgtgctatt 4380

tgtctttcta tgcctggcat ttcacttaac ataatgacct ccagttccat ctatggtgct 4440

tcaaactaca tgatttcatg tttttgtgta gatgacacat ttttaaaatc cattcatctg 4500

ttgatggaca cttagattga ttccatatct tggctattgt gaatagtact gtaataaaca 4560

tgggcatgca gatacctttt aaatttattg aattccgttt ttggatgtat actcaggaat 4620

gggattgttg gatcatgtgg tagatctatt tttagatttt tgagaaactt ccatactgtt 4680

tttcatagtt tctgtactaa tttacgttcc caccagcaat gcactagtgt tctccttttg 4740

ccacatcctc accagcatct gttattttct gcctttttgg taatagtaat cttaactgag 4800

gtgagatgat gtcttattgt ggttttgatt tgcatttccc tggtgactgg tgatgttgag 4860

cattttttca tatgtctgtt ggccatttat atgtcttctt ttgataaatg cctgtttaga 4920

tcatttgccc attttaaaat tggattattt gggggttttt gctatggagt tgtttgagtt 4980

ccttatatat tctgattatt a 5001

<210> 5

<211> 5001

<212> DNA

<213> 人工序列

<220>

<223> 人工序列描述: 人工合成的序列

<400> 5

taacctctct gttcttttcc gttcttatct ataaataggg gcaaccaacc accagtcctc 60

agaggctctg aaaatctaat ttcaattgtg gttgaaagtg ctctgaaaat ttgaaatgtt 120

acacagatgt atgggattcc tcctgagctg tatttgaaac cacagatatc catctgattt 180

gtaaatcatt taccttttag tctccctagc agaagttaat agtgaatgct tttctttttt 240

ttctttttat tttcttgatt gctaattttg ttaagttcat aagcgatact tacatatgta 300

catgtggagg ctggaatctg ctctggttga tgttgtagtg cgtgaatgcc tgggtggggt 360

ttgagctgta ctcatccacc gttatggtaa ctttgccttg agaaggaatc ccatgtgcca 420

tccttcctcc ctataggcat gagcaattca caactttaca gagcaaaaga tggaagcagg 480

catggtgcgt ttcagccaac ctctgaatcc aaggatctac tcatcaatac cgctgtgcat 540

ttctgaaaga aaaaaaaaat gtatataaaa tgagaacaaa gagaaaaagg gtgttctaag 600

agacataaat ttaacatcta gacatgaaac tagttcaggg aaaatctgaa tatgtgttgt 660

tggctcatgg atacaactgt tcccaactct cttcccttca tgcacttcaa agtggatatt 720

acactctata catattgctg ggtgctagca aatcttctca atggagttca aactaagatt 780

tcctctttaa ttataattat ggcacttagc gtgaattacg gaaggggcat atccaccgtt 840

gccatggcat ctggctatac atggtttgtg ctccaagtga agaatcttcc aaacctgccc 900

tgctaattgg aatgtttggt ctttacaaag ttggtgtcac gtaatcattt gaaagctcca 960

tgtttaaagc agctatataa cacaatgaca gataagaatt taaaatgttg tgcttataac 1020

aaatacatgt gtattactat aacatgcaca taataaccac acattacaca tatttttttc 1080

tttcacaagc agctcccaaa atacacaggt aggcaatgct tggcattcct cactggccca 1140

gaaccttatg gtaaggcaaa tctttcttgt taaatgtagt gtcatttttt tcaacactcc 1200

agtcactcag gggaaaacca aacacctcca ggtctggacc accactttga atgcattcat 1260

tacctccctt cttcaagccc cgatggagcg gtaaagaagg gcggccatta catctgccac 1320

ctcattcttg gtgcaacgta attctcagta attggtttca ttttttaaaa tttccattag 1380

ttctgatttt ttcataaatg tcaatatatt atttgctgca ctgggttgag aaatgaagat 1440

gtctattttt atggtaggtg tgcaaaggct gagggaagca aattctcatg tccaagttgt 1500

tgcaattgat cagtgcggta gagaagaagc cgtagtacac tccttgggta acccttaggt 1560

aacccatgct cttactttaa gtgcacaacg tcagaatagg tttgccatgt gcaccattaa 1620

gctctgagaa tcttatctgc tatttcaaat aaaaatattt agaataataa gatgagattt 1680

aaaattggca tgaaacacct taaatatcga gcaaaaggca gatggcctgc cataggccat 1740

ttattttatt attttacaac ccggggcttg agtaatcccc catatgctag ctgggctaag 1800

aaattccaga gtgttctact caaatcattg ccttcttcat attagcaaag caagctaaat 1860

aacacccacc ttgcctgcct tcctaatgtc aagtgcactg ccaagagatg aatccccgtg 1920

ctctggcatt ttaaacaaag tgtcactttg ggttctcttt ctttttcctg acttcatggg 1980

aggtatgagt cttttaagcg ccagatgata gacaaccagg ccagtaggat taactaaatt 2040

aaaatctttc cctgctcctc tgatgtaaga tatctataag aactgcttac aaatcataat 2100

gtagcagttt tcataccaag tttgcagctg tttccttaat ttctcccaca attatatttt 2160

actgttattt tgcataacag taaaacacaa cacctgcttc aaattgcagt cctgttctaa 2220

gtactgtaat tctcttttga gacacaaagt accgagacac tactgaagcg caaaactgca 2280

taattgcgtc gcgctgaaaa gtaaatacaa atgaaaacat cttcctgtta tagaaatgac 2340

tgtcattaaa aagaatgtta gccatcaaag cacagagggg gaaaaattca cattttcaga 2400

ctgtgagaag ttagtgtttg cataaattag agagtggtgt aaaaattact tgacaattct 2460

tatgttcatt cttccatcaa tgtctattgt gtgaaatact gaacattaag aagcaaagga 2520

aatcaaattc atgtctagac cgctgtgacc tctgagtaac aatctctgca cccagtacta 2580

gaaagatttt aaatgtttct ggagtaaaca cactaattaa accaagcaaa tgtggcctag 2640

aaataaaata tacataccta atatttaaac atctaggtaa tgacttgtag cagttagcat 2700

gatacccacc caagttctac tatttgaagc taagaagaga cagaatttag cagctgatca 2760

atttgcactt ctacatggtc cgcttgatcc taatgtcaac cttctctatc actgaacatc 2820

tatgcctctt tgcacctttg ccccagtaag acaaatagaa catcttttca tcagcaagca 2880

caggcccctg taactctgaa aggctaaatg ggtggctggc acctcatttg aattcatctt 2940

tgccatgttc cctttcaaat gtttcatcga aacagtgcac ctgcagcgtc tatcttcttt 3000

aatctggagt cctttgaaga aaatgtcaga ctgaggcaga gagcttcaaa actttcacag 3060

cacctttaca gacaagtcaa gaaaaggctt attttttaaa atgctatgtt catccccacc 3120

cgtatctcaa aatgaacaca tcttaagaat tttaaacaca aacacctgga aaagactttt 3180

tctttttttt tttttttttt tttttttttt tttggtaaac tctcagagac aagggacaat 3240

agacaaaacc acttcctata acctgagaaa tttggagaga gcttgaaaca agacagaagg 3300

atacactgct tacaactatc aagaagatgt atatttaggc agtaaaacct tccaaatgat 3360

cagattttcg tgcatctcac cctcttcaca cttactttaa ctttttacac acaatattta 3420

aagacagcac tattcttttc ataaattttc attttatact tcaacacact ttccacaaaa 3480

caaaggaacc caggacgaaa tatcaagaag ccgaaagaaa aatctaaaag ggactgacac 3540

tgccaaacat tcatgctggt gctagtttga tttttctctt taaaaagaaa atcatgtgag 3600

tacattttgc atttcctaga cagcaatcac ttctgtcctt taagctgtac aactagcaat 3660

attcttttcc aggaatctag ttggaaaacc ttttaaagtc ggctggcaat gaagggatta 3720

aaagctgagg aattaaataa ctgtctccac ctcctagaca ccagaagtcc aatttaccaa 3780

aactttcaaa gcaacaactc atgacctctc tacccctgca ctgcccagca cagcctatga 3840

gaaaagagcc cgcggttttc tcgtttcaac aaggatgctc attttaatca cttgccccaa 3900

gatctccaga ccgagcctgg cgggactttg gaacttgcct gctccaaatc cgccaaattt 3960

cgctctctcc tccctctgcc gcgcagatcc agtgcgttct taattcacgc ccctactctt 4020

ttatgcccac ttccagttac tcatccctgt atctgggagc gatgcccaca cgccttcccg 4080

gcgggcttct ccgccagggt ttttttgggg gaggctgaca taaagttcca cgtgcttctg 4140

tccaccgagc gccctccctc ccaccgcact tacacctgaa cttgtctcca gcactgcgga 4200

cacccgggtg acacattctt tcggagaggg agggcaagac ttttctccgg agcctctggc 4260

aactcgtgga gtctatataa ggtggggcgg tggggggcgc ggaattctct actttggatt 4320

ggtttgtttg ttttaaatct agggtggtgg gcagttgcgc gaggcggggt ggggggtgct 4380

ttatgaacta cacacacaca cacacacaca cacacacaca cacaccacat acactcgccc 4440

tgcccttcta ggctcacggc tggctcttcc cggctacaac ttccccttcc ttcctgaaac 4500

accagcgcct tactcgctca gtcccccgtt gccacctccg tcacctcctc ggccgccgct 4560

cctgctggca ctgctggcgc tagcgctggc ggccccgggc tccgctggac gcctatcttt 4620

tttctctccc tcttccctag ctctggattg attgatgacc accggcggcc aatggctctg 4680

acaccacgcc atcctcggtc gggcatcaca gccccacgtc cccgacctca gcctcccggg 4740

cgcgttggca tccccgaacc cacagcgctg agcccgagcc cggggccgcc gcctcctccc 4800

tgctctacgc ctgggcgctg ccaggttcct tccctggaac ggcggagaaa ggaagggagg 4860

gagccagcga gcgttggaag ggggtgtgga ggccacggga tctccccctc ttctgacatc 4920

ttttttcact taaacttttg tttgtcccac ccccccgacc tgtttgtgtt tgtttgcagc 4980

atctcaaatc aattatacat t 5001

相关技术
  • 一种用于肺癌早期诊断的外泌体ecDNA生物标志物检测试剂及其用途
  • 用于检测肺癌的基因标志物、试剂盒及肺癌检测方法
技术分类

06120115924529