用于检测肺癌的标志物及其用途和系统
文献发布时间:2023-06-19 19:28:50
技术领域
本发明涉及生物技术领域,尤其涉及一种用于检测肺癌的标志物及其用途和系统。
背景技术
肺癌是全球发病率最高、死亡率最高的癌症之一。在我国,肺癌发病率、死亡率也居首位。预计至2025年,我国每年新发肺癌患者将达到100万。其中,绝大多数患者位于肺癌晚期,失去了手术治疗机会,同时肺癌的预后特别差,而我国肺癌的5年生存率仅为16.1%。常规的筛查肺癌的手段除了低剂量螺旋CT(LDCT),还有一些蛋白标志物,例如:癌胚抗原(CEA)、鳞状细胞癌抗原(SCC)、神经元特异性烯醇化酶(NSE)等。但这些手段在灵敏性和特异性方面各参差不齐。目前,DNA甲基化已被证明具有组织特异性,可用于早期癌症检测,并可根据循环肿瘤DNA(ctDNA)甲基化特征追踪到肿瘤原发部位。
cfDNA(cell-free DNA)是外周血中游离的核酸小片段DNA,源于正常细胞或肿瘤细胞与代谢,包含体细胞突变和DNA甲基化等遗传信息。其中,ctDNA甲基化可在肿瘤发生的早期被检测到,而且具有较好的稳定性,因此ctDNA甲基化成为肿瘤液体活检中一个极具价值的标志物。
附图说明
图1为本发明生物标志物研究的流程图(N表示健康样本,C表示肺癌样本)。
图2为基于5个标志物构建模型在训练集中的ROC曲线。
图3为基于5个标志物构建模型在测试集中的ROC曲线。
图4为基于5个中的2个标志物构建模型在测试集中的ROC曲线。
图5为基于5个中的3个标志物构建模型在测试集中的ROC曲线。
图6为基于5个中的4个标志物构建模型在测试集中的ROC曲线。
发明内容
本发明的目的在于提供了一种用于检测肺癌的标志物及其用途和系统。
本发明具体技术方案如下:
1.一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下甲基化标志物中的一种或两种以上:
第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
2.根据项1所述的标志物,其特征在于,
第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
3.包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第一标志物;或
包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第二标志物;或
包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第三标志物;或
包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第四标志物;或
包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第五标志物,
在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
4.根据项3所述的用途,其特征在于,
第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
5.一种用于检测肺癌的系统,其特征在于,所述系统包括:
样品采集模块,其用于采集受试者的样品;
样品处理模块,其用于提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;
测序模块,其对样品处理模块处理后的样品进行测序;
分析模块,其用于分析测序结果以确定样品中甲基化标志物的综合甲基化水平;
判定模块,其用于根据分析得到的综合甲基化水平判定受试者是否患有肺癌。
6.根据项5所述的系统,其特征在于,
所述标志物包括以下甲基化标志物中的一种或两种以上:
第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
7.根据项6所述的系统,其特征在于,
第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
8.根据项6或7所述的系统,其特征在于,在分析模块中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。
9.根据项8所述的系统,其特征在于,在分析模块中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。
10.根据项9所述的系统,其特征在于,在判定模块中,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的,
其中所述阈值是基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个在给定肺癌受试者或健康受试者人群中的甲基化水平检测数据确定的;
所述综合甲基化标志物大于指定阈值则判定为受试者患有肺癌,所述综合甲基化水平标志物小于等于指定阈值则判定为受试者正常。
11.根据项5所述的系统,其特征在于,所述受试者样品为血液样品。
12.一种用于检测肺癌的方法,其特征在于,所述方法包括:
样品采集步骤,其采集受试者的样品;
样品处理步骤,其提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;
测序步骤,其对样品处理步骤处理后的样品进行测序;
分析步骤,其分析测序结果以确定样品中甲基化标志物的综合甲基化水平;
判定步骤,其根据分析得到的综合甲基化水平判定受试者是否患有肺癌。
13.根据项12所述的方法,其特征在于,
所述标志物包括以下甲基化标志物中的一种或两种以上:
第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
14.根据项13所述的方法,其特征在于,
第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
15.根据项13或14所述的方法,其特征在于,在分析步骤中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。
16.根据项15所述的方法,其特征在于,在分析步骤中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。
17.根据项16所述的方法,其特征在于,在判定步骤中,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的,
其中所述阈值是基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个在给定肺癌受试者或健康受试者人群中的甲基化水平检测数据确定的;
所述综合甲基化标志物大于指定阈值则判定为受试者患有肺癌,所述综合甲基化水平标志物小于等于指定阈值则判定为受试者正常。
18.根据项12所述的方法,其特征在于,所述受试者样品为血液样品。
本发明的标志物和系统可以:1)以非侵入性的方式用于无症状人群的早期筛查,以及癌症患者的预后检测,降低了侵入性检测造成的危害,2)具有更高的灵敏度和准确性,能够实现实时监测。
具体实施方式
下面对本发明做以详细说明。虽然显示了本发明的具体实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
需要说明的是,在说明书及权利要求当中使用了某些词汇来指称特定组件。本领域技术人员应可以理解,技术人员可能会用不同名词来称呼同一个组件。本说明书及权利要求并不以名词的差异作为区分组件的方式,而是以组件在功能上的差异作为区分的准则。如在通篇说明书及权利要求当中所提及的“包含”或“包括”为开放式用语,故应解释成“包含但不限定于”。说明书后续描述为实施本发明的较佳实施方式,然而所述描述乃以说明书的一般原则为目的,并非用以限定本发明的范围。本发明的保护范围当视所附权利要求所界定者为准。
定义
除非在本文的其他地方具体限定,否则本文使用的所有其他技术和科学术语具有本申请所属领域的普通技术人员通常理解的含义。
甲基化
甲基化是蛋白质和核酸的一种重要的修饰,调节基因的表达和关闭,与癌症、衰老、老年痴呆等许多疾病密切相关,是表观遗传学的重要研究内容之一。最常见的甲基化修饰有DNA甲基化和组蛋白甲基化。
DNA甲基化是指发生在CpG二核苷酸中胞嘧啶上第5位碳原子的甲基化过程,作为一种对稳定的修饰状态,在DNA甲基转移酶的作用下,可随DNA的复制过程遗传给新生的子代DNA,是一种重要的表观遗传机制,DNA甲基化时,基因启动子区的甲基化可导致抑癌基因转录沉寂,因此它与肿瘤的发生关系密切。异常甲基化包括抑癌基因和DNA修复基因的高甲基化、重复序列DNA的低甲基化、某些基因的印记丢失,其与多种肿瘤的发生有关。
在本文中,ROC曲线一定程度上可以反映分类器的分类效果。AUC实际上就是ROC曲线下的面积。AUC直观地反映了ROC曲线表达的分类能力。
PPV和NPV的计算,我们首先需要介绍混淆矩阵(Confusion Matrix)。在统计分类模型的评估过程中分别统计分类模型归错类,归对类的观测值个数,然后把结果放在一个表里展示出来的表格就是混淆矩阵。
在混淆矩阵中:
TP代表的是真实值是positive,模型分类为positive的样本数量。
FP代表的是真实值是negative,模型分类为positive的样本数量。
TN代表的是真实值是negative,模型分类为negative的样本数量。
FN代表的是真实值是positive,模型分类为negative的样本数量。
PPV(Positive Predictive Value),阳性预测值,被分类为阳性样本中分对为阳性的,计算公式PPV=TP/(TP+FP),可以用来评价分类为阳性的效果。
NPV(Negative Predictive Value),阴性预测值,被分类为阴性样本中分对为阴性的,计算公式NPV=TN/(TN+FN),可以用来评价分类为阴性的效果。
准确度(accuracy)也称效率(efficiency),用TP与TN人数之和占受试人数的百分率表示。
特异性
特异性是指没有特定临床疾病的患者的样本,其检测结果呈阴性的比率。
灵敏度
灵敏度是指患有明确临床疾病的患者的样本,其检测结果呈阳性的比率。
本发明提供了一种用于检测肺癌的标志物,其特征在于,所述标志物包括以下一种或两种以上的甲基化标志物中的一种或两种以上:
第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
进一步的,
第一标志物包括核苷酸序列如SEQ ID NO:1所示或与SEQ ID NO:1所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第二标志物包括核苷酸序列如SEQ ID NO:2所示或与SEQ ID NO:2所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第三标志物包括核苷酸序列如SEQ ID NO:3所示或与SEQ ID NO:3所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,
第四标志物包括核苷酸序列如SEQ ID NO:4所示或与SEQ ID NO:4所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点,以及
第五标志物包括核苷酸序列如SEQ ID NO:5所示或与SEQ ID NO:5所示的序列反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点。
上述五个标志物中的甲基化水平在肺癌患者和正常人中具有明显差异,因此可以用于检测肺癌。
用于检测肺癌的标志物可以包括上述5个标志物中的任意一个或多个,例如可以包括1个、2个、3个、4个或五个。
在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物、第三标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物和第二标志物。
在一个具体的实施方式中,所述标志物包括第一标志物和第三标志物。
在一个具体的实施方式中,所述标志物包括第一标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第一标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第二标志物和第三标志物。
在一个具体的实施方式中,所述标志物包括第二标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第二标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第三标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第三标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第三标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第二标志物、第三标志物和第四标志物。
在一个具体的实施方式中,所述标志物包括第二标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第三标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第二标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物、第三标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第二标志物、第三标志物、第四标志物和第五标志物。
在一个具体的实施方式中,所述标志物包括第一标志物。
在一个具体的实施方式中,所述标志物包括第二标志物。
在一个具体的实施方式中,所述标志物包括第三标志物。
在一个具体的实施方式中,所述标志物包括第四标志物。
在一个具体的实施方式中,所述标志物包括第五标志物。
本发明还提供包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第一标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第二标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第三标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第四标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点的80%以上,优选90%以上,优选包括全部CG位点的第五标志物,在用于检测肺癌或在用于制备用于检测肺癌的试剂盒中的用途。
本发明的试剂盒可以是例如基于标志物甲基化的数据来进行肺癌诊断、早期筛查的任何试剂盒,只要其涵盖用于检测本发明所述标志物的甲基化水平的试剂即可。
本发明还提供一种用于检测肺癌的系统,其中所述系统包括:
样品采集模块,其用于采集受试者的样品;
样品处理模块其用于提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;测序模块,其对样品处理模块处理后的样品进行测序;
分析模块,其用于分析测序结果以确定样品中甲基化标志物的综合甲基化水平;
判定模块,其用于根据分析得到的综合甲基化水平判定受试者是否患有肺癌。
在样品采集模块中,其用于采集受试者的样品,例如可以为血液样品。
在样品处理模块中,提取cfDNA的步骤可以采用现有技术已知的方法。使用重亚硫酸盐处理能将C碱基转化成U碱基,而甲基化修饰后的C碱基不会和重亚硫酸盐发生反应,能够在重亚硫酸盐处理中,一直保持C碱基的状态。因此在对测序数据的比对中,但凡检测到的C碱基均表明该位置的C为甲基化修饰过的C。
测序模块中的测序优选采用二代测序技术进行测序。
在分析模块中,所述甲基化标志物的综合甲基化水平是指基于所选择的一个或两个以上甲基化标志物的甲基化水平计算得到的。比如,如果选择5个甲基化标志物用于检测肺癌的系统,则可以得到5个标志物中每一个的甲基化水平,然后通过对这5个甲基化标志物建模后确定的算法得到相应的公式,将五个标志物的甲基化水平输入相应的公式,计算得到针对这5个甲基化标志物的综合甲基化水平。同理,如果选择两个甲基化标志物用于检测肺癌的系统,则可以得到2个标志物中每一个的甲基化水平,然后通过对这2个甲基化标志物建模后确定的算法,计算得到针对这2个甲基化标志物的综合甲基化水平。
进一步地,所述综合甲基化水平是指基于第一标志物、第二标志物、第三标志物、第四标志物或第五标志物中的一个或两个或三个或四个或五个的甲基化水平确定的。
在一个具体的实施方式中,所述综合甲基化水平基于第一标志物、第二标志物、第三标志物、第四标志物和第五标志物的甲基化水平确定。
在一个具体的实施方式中,综合甲基化水平基于第一标志物和第二标志物的甲基化水平确定。
在一个具体的实施方式中,综合甲基化水平基于第一标志物、第二标志物和第四标志物的甲基化水平确定。
在一个具体的实施方式中,所述综合甲基化水平基于第一标志物、第二标志物、第四标志物和第五标志物的甲基化水平确定。
在一个具体的实施方式中,所述综合甲基化水平基于第五标志物的甲基化水平确定。
其中,每个甲基化标志物的甲基化水平是基于该甲基化标志物中每一个CG位点的甲基化水平来计算的,其中所述CG位点的甲基化水平为在所有检测到的该位点的序列结果中检测到该位点为发生了甲基化的胞嘧啶与为发生了甲基化的胞嘧啶和未发生甲基化的胞嘧啶之和的比值。
对于每个window,统计每个window中的CG位点个数。因为已知每个CG位点的甲基化胞嘧啶的深度和位点的总深度,进而可以计算出整个window的甲基化水平,即为所有CG位点的甲基化胞嘧啶的深度的总和除以所有CG位点的总深度之和的比值。每个window会通过上述计算方式,得到相应的一个甲基化水平。其中,每个CG位点的甲基化胞嘧啶的深度为测序检测结果显示该位点为甲基化的胞嘧啶的reads的个数,即测序结果显示测得的该位点结果为C(胞嘧啶)的reads的个数,位点的总深度为涵盖该位点的全部测序reads的总数,即测得结果显示该位点为C或T(胸腺嘧啶)的reads总数。甲基化胞嘧啶的深度和位点的总深度可以通过测序软件分析后直接提供。
具体地,可以通过以下方法分析测序结果并计算甲基化水平:
使用fastp等质控软件查看原始测序数据质量,并进行过滤、截取或去除低质量的reads,得到对应的clean data;采用Bismark bowtie2比对软件将质控后的clean data数据比对到参考基因组(hg19)上;利用deduplicate_bismark对初次比对的bam文件进行去重分析;利用Bismark_methylation_extractor提取对应的甲基化位点信息,得到最终的甲基化CG文件(包括所有CG位点信息文件);最后,利用sliding window的方法对参考基因组进行滑窗,计算出每个window区间中的CG位点的整体甲基化水平。
在判定模块中,所述标志物综合甲基化水平大于指定阈值则判定受试者患有肺癌,所述综合标志物甲基化水平小于等于指定阈值则判定受试者正常。其中,指定阈值是基于所选用的甲基化标志物,根据一定量的样本训练集(包含每个样本的类型和甲基化水平)构建模型后,根据得到的ROC曲线上的截断(cutoff)值确定的。其中在一个具体的实施方式中,构建模型为利用R中的randomForest包构建的随机森林模型。
在一个具体的实施方式中,所述指定阈值为0.4-0.6。在一个具体的实施方式中,所述指定阈值为0.442-0.501。
本发明还提供一种用于检测肺癌的方法,所述方法包括:
样品采集步骤,其采集受试者的样品;
样品处理步骤,其提取样品中的cfDNA并进行甲基化处理以用于测序;优选所述甲基化处理是用重亚硫酸盐来进行处理;
测序步骤,其对样品处理步骤处理后的样品进行测序;
分析步骤,其分析测序结果以确定样品中甲基化标志物的综合甲基化水平;
判定步骤,其根据分析得到的综合甲基化水平判定受试者是否患有肺癌。
所述标志物、甲基化标志物的综合甲基化水平、每个甲基化标志物的甲基化水平、受试者患有肺癌的描述如上针对用于检测肺癌的系统部分的描述。
实施例
本发明对试验中所用到的材料以及试验方法进行一般性和/或具体的描述,在下面的实施例中,如果无其他特别的说明,%表示wt%,即重量百分数。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规试剂产品。
实施例1
1.1 cfDNA提取纯化
1.1.1血浆样本制备:
4℃、2000g离心血液样本10min,将血浆转移到一个新的离心管中。4℃、16000g离心血浆样本10min,如表1所示,根据使用的收集管类型,执行下一步,本实验中使用的收集管类型为其他。
表1
1.1.2裂解和结合
1.1.2.1.按照表2准备Binding Solution/Beads Mix,然后彻底混匀。
表2
加入适量体积的血浆样品。
1.1.2.2.彻底混匀血浆样品和结合溶液/磁珠混合物。
1.1.2.3.在旋转混匀仪上充分的结合10min,使cfDNA结合到磁珠上。
1.1.2.4.将结合管放在磁力架上5min,直到溶液变得澄清,磁珠完全吸附在磁力架上。
1.1.2.5.用移液管小心的弃去上清,继续保持管子在磁力架上几分钟,用移液管移去残留上清。
1.1.3洗涤
1.1.3.1.将珠子重悬在1ml洗涤液中。
1.1.3.2.将重悬液转移到新的无吸附1.5ml离心管中。保留结合管。
1.1.3.3.将含有珠子重悬液的离心管置于磁力架上,20s。
1.1.3.4.将分离得到的上清,吸出洗涤结合管,将清洗后的残留珠子再次收集到重悬液中,弃掉裂解/结合管。
1.1.3.5.管子置于磁力架上2min,直到溶液变得澄清,珠子聚集在磁力架,用1ml移液器移除上清。
1.1.3.6.管子留在磁力架上,用200μL移液器尽可能移除残留的液体。
1.1.3.7.将管子从磁力架取下来,加入1ml洗涤液,涡旋30s。
1.1.3.8.置于磁力架2min,直到溶液澄清,珠子聚集在磁力架上,用1ml移液管移除上清。
1.1.3.9.管子留在磁力架上,用200μL移液器彻底移除残留液体。
1.1.3.10.将管子从磁力架取下,加入1ml 80%乙醇,涡旋30s。
1.1.3.11.置于磁力架上2min,溶液变得澄清,用1ml移液器移去上清。
1.1.3.12.管子留在磁力架上,用200μL移液器移去残留液体。
1.1.3.13.用80%乙醇重复上述10-12步骤一次,尽可能除去上清。
1.1.3.14.管子留在磁力架上,空气中干燥珠子3~5分钟。
1.1.4洗脱cfDNA
1.1.4.1.按照表3加入稀释溶液。
表3
1.1.4.2.涡旋5min,置于磁力架上2min,溶液变得澄清,吸取上清液中的cfDNA。
1.1.4.3.纯化的cfDNA立即使用,或者将上清转移至新的离心管中,-20℃保存。
1.2 DNA打断与纯化:
1.2.1.按照Qubit浓度,取2μg DNA,加水补至125μl,加入到covaris 130μl打断管中,设置程序:50W,20%,200cycles,250s。
1.2.2打断结束后取1μl样品使用Agilent2100进行片段检测,正常打断后样品检测主峰约在150bp-200bp。
对于cfDNA样品,Agilent2100进行片段检测,直接Qubit用于后续的实验。
1.3末端修复、3‘端加“A”:
1.3.1.取50ng打断后的gDNA或cfDNA至PCR管中,用无核酸酶水补至50μl,加入表4试剂,涡旋混匀:
表4
1.3.2.设置以下程序在PCR仪上进行反应:
具体程序如表5所示,热盖温度85℃。
表5
1.4接头连接及纯化:
1.4.1.参照表6将接头提前稀释成合适的浓度:
表6
1.4.2.按表7配制以下试剂,轻轻吸打混匀,短暂离心:
表7
1.4.3.设置表8所示以下程序在PCR仪上进行反应:
无热盖。
表8
1.4.4.按照表9所示体系,加入纯化磁珠进行实验(Agencourt AMPure XP磁珠提前拿至室温震荡混合均匀备用):
表9
1.4.4.1.轻轻吸打混匀6次。
1.4.4.2.室温静置孵育5-15min,将PCR管置于磁力架上3min使溶液澄清。
1.4.4.3.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl 80%乙醇溶液,静置30s。
1.4.4.4.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。
1.4.4.5.室温静置3-5min,使残留乙醇彻底挥发。
1.4.4.6.加入22μl的Nuclease-freewater,把PCR管从磁力架取下,轻轻吸打重悬磁珠,避免产生气泡,室温静置2min。
1.4.4.7.将PCR管置于磁力架上2min使溶液澄清。
1.4.4.8.用移液器吸取20μl上清液,转移到新的PCR管。
1.5重亚硫酸盐处理及纯化:
1.5.1.预先拿出所需要的试剂,并溶解。根据表10加入各试剂:
表10
1.5.2.DNA保护缓冲液加入液体变成蓝色。轻轻吸打混匀,然后分成两管至于PCR仪上。
1.5.3.设置以下表11所示程序,并运行:
热盖105℃。
表11
1.5.4.简短离心将两管相同样本合并至同一个干净的1.5ml离心管中。
1.5.5.每个样本中加入310μl Buffer BL(样本量少于100ng加入1μl的CarrierRNA(1μg/μl)),涡旋混匀,简短离心。
1.5.6.加入250μl无水乙醇到每个样本中,涡旋混匀15s,简短离心,将混合液加入到准备好的对应的离心柱中。
1.5.7.静置1min,离心1min,将收集管中的液体重新转移到离心柱中,离心1min,弃去离心管的液体。
1.5.8.加入500μl buffer BW(注意是否加入无水乙醇),离心1min,弃去废液。1.5.9.加入500μl buffer BD(注意是否加入无水乙醇),盖好管盖,室温放置15min。离心1min,弃去离心下的液体。
1.5.10.加入500μl buffer BW(注意是否加入无水乙醇),离心1min,弃去离下来的液体,在重复一次,共2次。
1.5.11.加入250μl无水乙醇,离心1min,将离心柱放置到新的2ml收集管中,弃掉全部剩余液体。
1.5.12.将离心柱放置到干净的1.5ml离心管中,加入20μl无核酸酶水到离心柱膜中心,轻轻盖上管盖,室温放置1min,离心1min。
1.5.13.将收集管中的液体重新转移至离心柱中,室温放置1min,离心1min。
1.6扩增及纯化:
1.6.1.按表12所示配制反应体系,吹打混匀,短暂离心:
表12
1.6.2.设置以下表13所示程序并启动PCR程序:
热盖105℃
表13
1.6.3.PCR循环数根据投入DNA的量不同进行调整,参考数据如表14所示:
表14
1.6.4.向反应结束后的PCR管中加入50μl Agencourt AMPure XP磁珠,用移液器吹打混匀,避免产生气泡(Agencourt AMPure XP提前室温混匀并平衡)。
1.6.5.室温孵育5-15min,把PCR管置于磁力架上3min使溶液澄清。
1.6.6.移除上清,PCR管继续放置在磁力架上,向PCR管内加入200μl 80%乙醇溶液,静置30s。
1.6.7.移除上清,再向PCR管内加入200μl 80%乙醇溶液,静置30s后彻底移除上清(建议使用10μl移液器移除底部残留乙醇溶液)。
1.6.8.室温静置5min,使残留乙醇彻底挥发。
1.6.9.加入30μl的无核酸酶水,将离心管从磁力架取下,使用移液器,轻轻吸打重悬磁珠。
1.6.10.室温静置2min,将200μl PCR管置于磁力架上2min使溶液澄清。
1.6.11.用移液器将上清液转移到新的200μl PCR管中(置于冰盒上),在反应管上标记好样本号,准备下一步反应。
1.6.12.取1μl样品使用Qubit进行文库浓度测定,记录文库浓度。
1.6.13.取1μl样品使用安捷伦2100进行文库片段长度测定,文库长度约在270bp-320bp间。
1.6.14.使用Illumina高通量测序平台(Illumina novaseq 6000)进行测序。
1.6.15.甲基化生信分析流程。流程如下:使用fastp等质控软件查看原始测序数据质量,并进行过滤、截取或去除低质量的reads,得到对应的clean data;采用Bismarkbowtie2比对软件将质控后的clean data数据比对到参考基因组(hg19)上;利用deduplicate_bismark对初次比对的bam文件进行去重;利用Bismark_methylation_extractor提取对应的甲基化位点信息,得到最终的甲基化CG文件(包括所有单个CG位点信息文件);最后,利用sliding window的方法在参考基因组上进行划窗,计算出每个window区间中的CG位点的整体甲基化水平;对于每个样本统计对应window的甲基化水平,根据不同样本的组别找出差异甲基化window。
实施例2
基于14个肺癌患者cfDNA和22个健康人cfDNA训练集(见图1),利用实施例1所述的方法检测14个肺癌患者和22个健康人的1583个初始标志物的甲基化水平,筛选出5个最显著区分肺癌和健康人cfDNA的甲基化区域作为用于肺癌检测相关的备选生物标志物。如表15所示,相应的标志物信息如下:第一标志物,其包括与1号染色体151445000-151450000位上的核苷酸序列相同或反向互补序列中的全部CG位点;第二标志物,其包括与2号染色体191183500-191188500位上的核苷酸序列相同或反向互补序列中的全部CG位点;第三标志物,其包括与位于2号染色体191184000-191189000位上的核苷酸序列相同或反向互补序列中的全部CG位点;第四标志物,其包括与位于4号染色体68566500-68571500位上的核苷酸序列相同或反向互补序列中的全部CG位点;第五标志物,其包括与位于11号染色体30601500-30606500位上的核苷酸序列相同或反向互补序列中的全部CG位点。
将检测到的14个肺癌患者和22个健康人将各备选标志物的、基于实施例1方法检测到的每个上述标志物的甲基化水平数据输入R软件,并利用R软件的randomForest包构建随机森林模型进行模型回归。回归结果显示,在训练集中,能够用于预测肺癌结果的基于5个标志物的综合甲基化水平的cutoff值为0.442,即指定阈值为0.442(大于0.442即判读为肺癌患者),最终模型得到的AUC达到1,准确度100%,灵敏度100%,特异性为100%,PPV为100%,NPV为100%,具体信息见表15和图2。
表15
实施例3
基于实施例2的中5个甲基化标志物,使用R软件中的pROC,根据每个甲基化标志物的甲基化水平,,计算得到5个甲基化标志物分别在测试集中(10个肺癌患者cfDNA和16个健康人cfDNA)的能够用于预测肺癌结果的综合甲基化水平的cutoff和AUC值,见表16。
表16
实施例4
基于实施例2中构建的模型,在10个肺癌患者cfDNA和16个健康人cfDNA的测试集中,能够用于预测肺癌结果的基于5个标志物的综合甲基化水平的cutoff为0.442,即指定阈值为0.442(大于0.442即判读为肺癌患者),AUC达到0.919,准确度84.62%,灵敏度90%,特异性为81.25%,PPV为75%,NPV为92.86%,具体信息见表17和图3。
表17
实施例5
使用上述5个甲基化标志物中的2个标志物(第一标志物和第二标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于2个标志物的综合甲基化水平的cutoff为0.465,即指定阈值为0.465(大于0.465即判读为肺癌患者)。在测试集(10个肺癌患者cfDNA和16个健康人cfDNA)中,AUC达到0.869,准确度84.62%,灵敏度100%,特异性为75%,PPV为71.43%,NPV为100%,详情见表15和图4。
实施例6
同实施例5,使用上述5个甲基化标志物中的3个标志物(第一标志物、第二标志物、第四标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于3个标志物的综合甲基化水平的cutoff为0.501,即指定阈值为0.501(大于0.501即判读为肺癌患者)。在测试集(10个肺癌患者cfDNA和16个健康人cfDNA)中,AUC达到0.894,准确度80.77%,灵敏度70%,特异性为87.5%,PPV为77.78%,NPV为82.35%,详情见表15和图5。
实施例7
同实施例5,使用上述5个甲基化标志物中的4个标志物(第一标志物、第二标志物、第四标志物、第五标志物)在训练集中构建随机森林模型,能够用于预测肺癌结果的基于4个标志物的综合甲基化水平的cutoff为0.461,即指定阈值为0.461(大于0.461即判读为肺癌患者)。在测试集中,AUC达到0.906,准确度80.77%,灵敏度90%,特异性为75%,PPV为69.23%,NPV为92.31%,详情见表15和图6。
综上可见,利用该方法在cfDNA中筛选出来的区域和肺癌的筛查有非常高的相关性。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权力要求为准。
序列表
SEQ ID NO:1:GCTCCGTTGCCCAAGCTGGAGTGCAGTGGCTTATAAAACATGGCTCACTGCAGCCTTGAACTCCTGGGCTCATGCAATCCTCCTGCCTCAGCCTCTGGAGTAGCTGGGACCACAGAAGTGCACCACCACACCCGGCTAGTTTTATTTTTATTTGTAGAGATGGGATCTCCCTATGTTGCCCAGTCTGGTCTCCAACCTGGGGCCTCAAGTGTTCCCCCTGCCTCGGCCTCCCAAAGTGCAGGGATTACAGCTTGGGCCACTGTGCCCAGCCCTTTCTTCCATCATTCCGTCCTCTCCTTCCTTCTTAATACTGCTTGTCAAACTGATTTTGCCACCCAGTTTGAAAAAGAAGGTCTAGAGGATTATCCCAATCATTAACTATTTCTGCAGGTTAGCTTACCTTTCCAGAATACAGAATAGAATTCAGCAAACTGCCTCAAAGAGCAGTTTCTAGATTTGACTTCTTCCTCTAGGGTTTATGAAGTCATCATACTGAAGTGACCTGGATTTCCCTATACGTGAACCTCATGACGTGGGAGCCCGGGGTAGGGAGGGACAGATAACATGAGAATCAATAGAAAGAACTGCAAGGTCTGAAGACAAGAACCATTTGTCTAGTGGAGTCTATTTTATATCCATTTTTTAAAAATCTCCATTTAAGATATTTAGCTTCAACGTGCACCTTGACCAATTAATCCAACAAACAAAACTCTGGCTTGGGGGCCCAGTTACTCACTTTCATGGAAAGAGACCTCTGTTTTTAGAACCAGGGATCTTGTGAGTCCCTCCCACGTCCCCAGCCCTTCTCTGGCCTCGGGTAACTTTTCCCTCCAGTTTGGTGGAAGGTTACATTAGAAGAAAATAGTCCCTACCGTCTAGAAAGTTTTCGGGGGGGGAAAAAAGGGCGTTGGACGTGCGGGTGGGTGGGTATACCGGGAGGGGACAGCTGGAGCCGCGAAGGCGCGGGGGCCCGCGGCGCGTGGGTGTGGAGGCCGCGGGGCGGCAGGAGGCACTGGGAAGCGGGGTGAAGAGCACCGAAGTCCAGAAAAGGGCAGTGTCCGCCCTGCGCTCCTCTGCTGGCGCCCGCAACCCGGGAGGGAGCGGCGAGGCTCCGAAGGGTGGGATTCGAGGTCTGAACCCTCGAGTGGGCTTGGGTTTTCAGGAGCCGCCTTTTCTTATTGATCATTTCTCTTTTGTCATCATAATCTCTTGGCCTCAGACTGAGTTAAGGGAGCCATAGTAGGAGTGCAGAAAATGAAGTGGAGGAAAAAAAAATGTGATATTTAAAATATAGTTTTTCCTACTTTCTTTTTCTCTCTCAAATTAATTTAGATGTAAATAACATTTTAACAGGGCCCAACATCAGGCTCCTAGGCTCTGGCTGCTGGTCTCACTTGACACCAGAATAAGATTTTGGTGTGCTAGTAATTTTGCCAAATGGAGGCCTACTCCCCAAAACATCACCGTGGTGCATGATGAACATTTCTGTAGGTGATGACGTGGAGTTTTTGTTTTACTTCATTCTAATACATGTCCCTGCTTCAAGTGGGTAAAATTATACCTAGCTCAGCCCAGGTTTAATTCAGATTATTTAAAAAATTTCAGTGGCAAGTAATTTACGAGCTTCTCTTTATTAAGATTTAGGAAATTTTGCTTTATTGCGCATGCATTTTAAGTATTTTTTTGCTGTGTTCCTAGTGTAGATAGAAAACAACCTGTCACTGTCTCCTAGTTGGCCCTGTCAACAAACATTTGAGAAGTGCTTAGATCAGAATGCTGTTGAGTACTACAAATTAAACAATCTGATGTACTTGTTAATTTCATTACAAACAGCAGTTAGGATTTCATATACATATAGTCTGTACCATGCTATATATCAGAAATCTTTGTAAATATAAACTCCTTAAATATAGGGACCCAGTTTTATTCTTCAGCGAAAGGGAGTTAATCTTTTGGTGTTGTGCATTTAGAAGGATCTCGGATGTAAGAGGCTCATTAAATGATAGCTGTTAGTATTATTTATCTTGGTATCTTCCAAAGGGCTTTGCACATGGCTAACACTAAGAAATATTGGTTGAATGAATGAAGGTGCCATGCCCATACTGTGATATACACAGAGAAAAGACCAGGATGGGGACACTAGCACAGTGATTTCATTTCATCAGTGAAGCTTTGTGTGGAAGTGTCCCTCCTGCAGCCCTTTTACCAGATGCAGGCTCCCTTGACCTTGGATTGTGGACCACTTAAAATTTTCAGGGGAAAAAGTGTGCCTAATTAGCTAGTAGGGCCTAACCTCTTGTCAAGATGGAACTTGAGAAGTTTGTCTAAGTATGGAAAAGCTAAGCTCACTTGACACAGATCACGGGAAGAAAGATTTCTGCATGTTATTCAAGTTATTCACGTCAAAAGCGATTAGGGGGCCCCAGCTTCCATTACATCATTCATTAGGAAAATGTGTGCTGGGAGCTCTGCAAATCACATGATTTGATGGAGGCATTGAGACTGGGTTTCTTGTGTGTCTGCCCTTGGCCATATTCAGTTTTTAGTATGTTTGGAAAAGGCTGAAGCAGAACATGAAGATCTAGTTTATTTTAATGCTGTCAGACAGCTAAATGGTGGAAACTTGTTGAAGAGATTTACTGAGCTGTTTCCTTAGATTGAAGACTTTAGAGAATTAATTAACAGGGTTCTGAGAGATACAACATGCCAGACCCCTACTGACTCTAAGAGTGTACTTTCTTACTGATATGATGTGATAGCTGAGCACAGTATATGTGAAACTGCTGGGGAGTAATACAAGAGCAGTGCTGATGTGTTCTAAGACATGCAGGTGTTCAGATGAGAACTGGCCATGACAACTGAGTCAGCCAGGCACTGGACTCATTTCCTTTTGCTTAAGCACCATGAGCTCAGTAGAAGCACAGACTTTCACAAGGTGCTGAACTACTTGGTGAAAATGAAGTCACAATTTTGGAAGAGCTTCACTGATTTTGATGTGTAGGTATTGTTTCACGTTTTAGCTGTTGCTTTTAGAATGCATGCCTTAAGATGGTTCTCAGTTATCATGCTATATCTATGCCACGCCATTTCTAGAGCAAGTAACTTAGCTGAAAGTGACTATACCTATAAGAAAACAAATATCCCTGTAGAGACATTTGTAGATGAATTGTGGAAGTACTCTAAAATTTTTGGCCAGATTTTGGGGAATGTTTGAGTCTAGCTGGTACAGAAAGTACATTCTGTTTTATGAAAATAGCAACATTGAAGTGAAAAGATATCATTAATGTATACATGTAGTCAGAAATTGAATGTGCCCTGGCTGATTGCAATTTATTTATTCACTTAATGCGTATTTATTGAGTACAAGGCCTTAGAGTTTCCTCAGTTCTTATAGTCTGTAACAGTGCCATTCCATAGGAATGTAATGAGAGCCACATATATAATTTACAATTTTCTAGTAGCCACATTAAAAAATTAAAAAGAAACTGATAAAATTAATGTTAATATTAATATATTTTATTTCACCAAATATATCTAAAAATATATCTAAAATATTATCCTAATATGTAATTAATATACTTTTATTGGTTTTTTTTTTTTGTTTTTTTTTTTTTTTTGGGGACAGGGTCTCACTCTGTCACCCAGGCTGGAGTGCAGTGACACAATCATGGTTCATTGCAGCCTCAACCTTCTGGGCTCAGATGCTCCTCCCACCTCAGCCTCGTGAGTAGCTGAGACCACAGGCATTTGCCACCAGCTAATTTTTTGTATTTTTTTGTAGAGACAGGATTTCCCATGTTGCCCAGGCTGGTCTCCAACTCCTGGGCTCACGCGATCCACCCGCCTTGGTCTCCTGAAGTGCAGGGATTACAGGCATGAGCCACTAGAAATTATTAACAAATTATTTTACATTCTTCGTTTTGAATTAAGTTTCTCGAATTTACTTACAGCAAATCTCACATTGCACTAGCCACATTTCAGGTACTAAAAAACTACATGTGATTAATGGTTACCATACTGGGCAGTCCATGTCTAGAGAGAAATACAGATGTGTAATTTGTAAACAGGTAAACAGATAATTTCTTTTCTTTTTCTATTTTTCTTTTTTTTTTGAGACAAATTCTCACTCTCCCAGGCCGGAGTGCAGAGGCTCAGTGCAGCCTCCACCCCCTGGGCTCAAGCGATCCTCCCAGCTAACCTCCCCAACTCCCCACCCCAGCAGCTGGGACTACAGGTGGGTACCACCATGTCCAACTAATTTTTATAGAGATAGGTTTTCATCATGTTACCCAGACTAGATAATTTTAATTAAATGTAATAAAGGCTATGATGAGAAAAGTACACTCATCATACAATGAAAGCATAGAAAAGGGGCTTAGTTCCTCCAGTTTTTCCTCCTAAAATCTCATAATTCTCTCTGCTTCTCTGCATCCTGCCTGCCACGACTCTAATCTAAGCCAGATTATCTCTCTCCTAGACTTGCACAACAGCTTCCGAAATTGTCTACCTGCATCTATCCCTGCCCCTGTTTGCAGATAAAGTGAGCTTTTAAAAACGCCCATCAGATCATGTCATTCCTCTGTTTAAAACCTTAAATATATGATGAACACATTGGACAAGTGTGAGATGATGTACATAAAGCGCCCAGCCCAAAGGTTCTGCTCACTGAGTTTAGTTCTCCTCGTTTCTTCCTTTCACTCTCTTTTTTCTTCCTCTTACTTTCCTCCCCAGCTCCTTCCTCTTATCACCTATCAGTCTCTTATCATCTGAATTTCTTTTTTCTTTCTTCCTTCTCACTTGCTTTCCATTTTTTTCTTCCATCTTTACTTTCTCTCCTTTCTGCTTTAGTTTATTTTAATATAGAATTTAAATAGATTTAGAAATTCATTCTTTAATTATTTACTTCTGAGTTCCAAGCTCTTCATTTAAAAATCAAAAGAGTACTGGGCACTGTGGCTCACGCCTGTAATCCCAGCACTTTGGGAGGCCGAGGTGGGCGGA
SEQ ID NO:2:TCTCCATGAGCTGGTGCAAGGACAACTAATTTTAAGGTATTAAAAAAACAAACAGAAAAGCAACTCTTAAATGTATAACAAAAATTTACTGAGAATTAGGTCTGTGGATACAGTGTTAGACATCTAGACACTTTCCCCTGAAACTATTCTTCTTAAGTCAAGGAAACACCTCCATCCCTTTTCAGGAAACCCAGAAGGCAAACTCTAAGGCTTAAAGAATCCAGTAATTTAAGTCGTCCTTATTTTAAAGAAATAAGGACGGTTCTCCCTTCAAGTGGGCGCAGCTGCTACCTGGTATGACAGTACAGGGCCAGGCAGTGGGCTGTTTAAGGCGCATGCAGCCTAAAGATGATGGCTACCAGATTTCCTAGGCTGAGCTCAAAGCGCAGTGAGGGGTACTTTCAAAAAGTTAAACAATGTTTGCAAACATGCTCCCCCATGCCACGTTAAATGTCCCTCAACACTAGCCTGAAAGTTCCAAATGCCTATACTGACGCTGCAGCCATGCAAGAAAGCTGAATAAAATCACACCACGGGCAGAGAGAGGTGCAGCAACTGGCAAAGCACCTGTGTGTGCTGGCTGCACAAAACATGCCGCACAGTTCCGCTAAGCTAAATCTGTCCGTGTCCCCAGACTGCACCCAACTTTTAAGAAAGGAAAGAAACTGAGGCCAAAAGAATTAAAGTCGTGTGGGGACAAGCCTGAATTAAGAGCCAGAGTGGCAGAAAACCAGAGTGCTGCTGCAAAGAAGATGCTAGAGGGAGAAAGGAAAGACAGGGACGGGGGCTGGGGCTTGGGGAGGGCCAAGGTTGGGGTCTCACAGCGGCGCCTCTGAGCGCGACTCGAAACTTCGAGGCCAGCAGTCTCCACCCCCGGCCCTTTTCCCACTGTGGCGAGTGCCGCTGAAGAGCCTGCCCTTGGCCCCTCGCTCTCTCACTCACCTCGACATGAGCCTCCACATCTCGCGCTGCCCCATCGCCAAACACTCCGAAGCTAAAGCAGCAGAGCGAGAATCTCCCGGACCGTTCCAGCGCCTCGCGTGAGCCCCGCCCACCGCCGTCCTGCGCCGCCGGGCACAGATGACAAGTCCTCCAGGAAGCCAGAGCGACCGTTTCCGCTACGCGACGGGGAAGGGCGGGGCAAGAACGACGCCTGGAGGAAATAGTTGAGGGAGAGGAAGGGATCGGGGACCGGGCCAGGGAGAAGGCGGAGAGCGAGCTGAGGCGGAGCGGGAAGAGGGAGGATAGAACGGACTAGGGCGGATTCGCAGGAAAGGAGATTGCCCTCTAGAGGCTGTCTTAGCCCAAAGCGCAACCTGTTGTCTAGGCTTGGCCTGCCAATTTGACCAGCAGGGACTGATGTGAAAGACTTTTCTGGAATTTTAGTAATTTTTTATTAAAACGTAAACTTAGTATTCTTTGAGACTCAAGTAGAGGAATTACAGTTGATAAAGGACATCGATGTAGTTTATTCATTCCTAACCCAATACAGCCGAATTCCTTTAATATTAGGATTGAGACATTTTCATTTTTCTTGGGAAAAGTTACAGATCTCCCACTCTTCCTCAAAGACACACAAGAGTTGTCTGATTAAGACATAATAGATATGTCTTCCCAACTAAAGTAAAAGTTGCTGTTATCAGTGGAAGCATAATTACATTCAGAAAGTAGCTTACTCTTAAATGAAACCAACATTTAACTCAACTACTAGGATCCACTGTTAAATTGAGGAAAACGTTCCTCCGCTTCCAGATCCACCCAGATGTGTAGCAGAAGACATTTCATCGCCACTATTAAGTATTGACACATTTATCAGAAAGAAGAAATCCGGTGACAAATTTCAGAGAGGACACATGAAAGGAGTTATTCTTAGTACCTTGATATTTAAAGAGATACACTGTTGAGACTTTGATCAAAAATTACGTTGCTAACCTAGGTCAAATGTAATAACCAAATGCCCACTGAGAAGAGGACAGACAACAGACATCACAGAAGGAACTCCTTACCTGCAATTTGGTTTTTAACTGGCTACAGGACATCACCATCTGACATCACCATCATGCCTCATTCACTGCGCACAGAAATGAACCATTCATCTGACCTAGCATGGTTTACTGGAAAAAGCATGGGCTTTCCTGTTAGTCAGACTGAGATTCAAATCTTCCTTGCCGCCCTAGCTTCATGTGTGTGAAACCTGAGTCTCACAAGGCCTCATCGTTAGAAGGGCCCTGTGCTTGTTTTAATGCTGTGCTATTAATAATTTTTGAACAAGGAAACACAAATTTTCATTTTACACTAGGCCTGCAAATTATGTAATCAGTCCTACCCCTAGCACACTAATAGTTTAATGACCTTGAACAAATTATATAGCTTTTCAGAACCTCCATTTTCTCATCTGAAAATGGATGTGCTGATGATTAGAGGTGTTTGTGAAGATCCATTGAAATATAGAAATATGTGCATAAATTACTTAGGACTTCGTAGGTATCAAGACCTGTCAGTTATGCCACACCTTCCACCAAGCTGTCCTTCCTATTCCTAAATTCTCTATTTCTTCTAATGATGCTATCGTCTTCTGGCTTCCCGCTCTAGAAACCTCAGTCCTTTAAAGAAAATTATCTTAACATTCTATTTTGAAGATTTTCAAACATATAGCAAAATTATAAAAATTTAAAGCAAACGCCTATGTGCTCACCACATAGATTCTACCTAGATTTACATTTTATCTTGCTTTATTCCTTATCCCAAATACCTTATTTTTAAATGCATTTCAAAGTTAATTACAAGCATCGTTTTACTTCTCCCAAAATATGGCATGTGTCTTACTACCTAGAGTTAAATATTTGTTTACATATTTTCCCTTTTGAGACAAAATTTACATACAACAAAATGCACAAATCTTAAGTGTACATTCACTGAGTTTGACAAATGTATACACTTGTGTAACCAAAATTCCTTAGATATAAACCATTGTCATCACCCCAAAAAGTTTCCTCTCACGATTTCCCAGACATTCTCTGCCTACCACTGCCTTCCCCACCCCAACCCCCGCCCCAGAAGCAACCACTGTTCTGTCTCGAGAACCACTGTTTGTTTTGAGACAGGGTCTCACTCTATCACCCAGGCTAGAGTACAGTGCCACAGTCATAGCTGACTGCAGCTTCAACCTCCCTGGGCTGAAGCAATCCTCCCACCTCAGCCTCCTGAGTAGATGGGACTACAGGCACATGCCACCACACCCAGCTAATTTTTGTATTTTTTTTTTTTTTGCGAGATAGAGTCTTGCCATGTTACTCAGGCTGGCCTCCAACTCCTGGGCTCAAAAGATCTCCCCGCCTCGATCTCCCAAAGTGCTAGGATTACAGGTGTTAAATACTGCACCCAGTCTGATTTTTCTCTACCATCAATTAGTTTTGCATCTTCTGAAAATTCATATAAAATGGAATCATACAGTGTGCGCTTTTTTTGTATAGCATTTTTCACTTAGCAAAATGTCCATATCGTGTGTATCGGTAGTTTCCTCCATTTTATTACTGAGTAGTATTTCATTATATGAATACCCCATAGTTTACTGATCTGTGCTCCTCCTGATAGATTCCTGGGCTGTTGCCAGTTGGGGCTATTATGAATAAAGCTGCTGTAAACATTCTTGTGTAAATCTATTGTAGACATATGTTTCCTATTCTCTTGGGTAAATATCTATAAATAGAATGTCTTGGTTATAGGGTACATCAATGTTTGGTTTTATGTGAAACAGCCAGACCCTTTTTTCAAGAGTTTGTATCATTTTGGAAAAGAATTCTGGTGGCATACAATCCACAGAATGAGGAATAATGTTTATAAATGATATATTTGATAAAAGGCTATCTAGAATATGTAAAGAACTATCACAATTTAAATAACCAAATTTTAAAATGGATGACAGATTTGAATATACTATACAGCTCTCCAAAAAAGATATATGAATGATCAATACTCATATGAAAAGATGCTCAACATTATTAGCCATCGGGAAATACACATCAAAACCACAATGACTTCACACCCACCATAATTTTTTAAAAAACAAGTGTTAGTGAGGAGAATTTGGAATCCTCAGACACCACTGGTGATGTACAACAGTACAGCTATCTTGGAAAAATGTCTGGCAGTTCCTCAAATGGCTAAACAGAGAGACCATATGACCCAACAATTCCATACCTAGGTATTTACCCAAAATAAATGAAAACATAGTCCTCACAAAAACTTGTACATAATGTTTATGGCAGCATAATTGCCAAGAAGTAGAAATAACTCAAATGTCCATCAACTGATGAATAGGTAAAAACAAAAGTTATATATCTGTACAATGAAGTATTATTTGGCAAGAAACAGAAATGAAGTATCGATACATGGTACAACATGAGCAAACATGGAAAACACTGTGCTAGATGAAAGAAGCCAGTCACAATAGACCACATATTATATGATGCCATTTACATGAGTGTCTAGAATAAGCAAATGTGTACAGATAGAAAGTAGACGAGAGGTTGCCTAAGGTTGGAGAGGAGGCAGGAGAATTGGAGAGTGACAGCTAAGCGGCACAGGGTTTTCTGGTAGAGTAATGAAAATATTCTAAAATGAATAGTGGTGATGGTTGGACTACACTGAAATGAAAATATTCTAAAATGGATAGTGCTGACAGTTGGCTGAATCATATACTTTATATGGGTGAATTGTGTGGTATGTAAATTGTATCTTAATTTTTAAATAAAGAATTCTGGTTGCTCCATATTCTCAGCCACATTTTGTATTATCAGGCTTTTAAATTTTAGTCATGCTGGTGTGTGTGTGGTGTTATCTCCTTGTGGTTTTAATTTTCATTTTCCTGGTGTCTAATGATGTTGAGCACTTTTTCATATGCTTATTATCTTCTTTTAATTTTCTTGCCCATTTTTAAATTGGGGTTTTTGTTGTTGTTGTTTTGTTTTTTGTTTTTTTTTTTAGACAAAGTTTTGCTCT
SEQ ID NO:3AGCCATGCAAGAAAGCTGAATAAAATCACACCACGGGCAGAGAGAGGTGCAGCAACTGGCAAAGCACCTGTGTGTGCTGGCTGCACAAAACATGCCGCACAGTTCCGCTAAGCTAAATCTGTCCGTGTCCCCAGACTGCACCCAACTTTTAAGAAAGGAAAGAAACTGAGGCCAAAAGAATTAAAGTCGTGTGGGGACAAGCCTGAATTAAGAGCCAGAGTGGCAGAAAACCAGAGTGCTGCTGCAAAGAAGATGCTAGAGGGAGAAAGGAAAGACAGGGACGGGGGCTGGGGCTTGGGGAGGGCCAAGGTTGGGGTCTCACAGCGGCGCCTCTGAGCGCGACTCGAAACTTCGAGGCCAGCAGTCTCCACCCCCGGCCCTTTTCCCACTGTGGCGAGTGCCGCTGAAGAGCCTGCCCTTGGCCCCTCGCTCTCTCACTCACCTCGACATGAGCCTCCACATCTCGCGCTGCCCCATCGCCAAACACTCCGAAGCTAAAGCAGCAGAGCGAGAATCTCCCGGACCGTTCCAGCGCCTCGCGTGAGCCCCGCCCACCGCCGTCCTGCGCCGCCGGGCACAGATGACAAGTCCTCCAGGAAGCCAGAGCGACCGTTTCCGCTACGCGACGGGGAAGGGCGGGGCAAGAACGACGCCTGGAGGAAATAGTTGAGGGAGAGGAAGGGATCGGGGACCGGGCCAGGGAGAAGGCGGAGAGCGAGCTGAGGCGGAGCGGGAAGAGGGAGGATAGAACGGACTAGGGCGGATTCGCAGGAAAGGAGATTGCCCTCTAGAGGCTGTCTTAGCCCAAAGCGCAACCTGTTGTCTAGGCTTGGCCTGCCAATTTGACCAGCAGGGACTGATGTGAAAGACTTTTCTGGAATTTTAGTAATTTTTTATTAAAACGTAAACTTAGTATTCTTTGAGACTCAAGTAGAGGAATTACAGTTGATAAAGGACATCGATGTAGTTTATTCATTCCTAACCCAATACAGCCGAATTCCTTTAATATTAGGATTGAGACATTTTCATTTTTCTTGGGAAAAGTTACAGATCTCCCACTCTTCCTCAAAGACACACAAGAGTTGTCTGATTAAGACATAATAGATATGTCTTCCCAACTAAAGTAAAAGTTGCTGTTATCAGTGGAAGCATAATTACATTCAGAAAGTAGCTTACTCTTAAATGAAACCAACATTTAACTCAACTACTAGGATCCACTGTTAAATTGAGGAAAACGTTCCTCCGCTTCCAGATCCACCCAGATGTGTAGCAGAAGACATTTCATCGCCACTATTAAGTATTGACACATTTATCAGAAAGAAGAAATCCGGTGACAAATTTCAGAGAGGACACATGAAAGGAGTTATTCTTAGTACCTTGATATTTAAAGAGATACACTGTTGAGACTTTGATCAAAAATTACGTTGCTAACCTAGGTCAAATGTAATAACCAAATGCCCACTGAGAAGAGGACAGACAACAGACATCACAGAAGGAACTCCTTACCTGCAATTTGGTTTTTAACTGGCTACAGGACATCACCATCTGACATCACCATCATGCCTCATTCACTGCGCACAGAAATGAACCATTCATCTGACCTAGCATGGTTTACTGGAAAAAGCATGGGCTTTCCTGTTAGTCAGACTGAGATTCAAATCTTCCTTGCCGCCCTAGCTTCATGTGTGTGAAACCTGAGTCTCACAAGGCCTCATCGTTAGAAGGGCCCTGTGCTTGTTTTAATGCTGTGCTATTAATAATTTTTGAACAAGGAAACACAAATTTTCATTTTACACTAGGCCTGCAAATTATGTAATCAGTCCTACCCCTAGCACACTAATAGTTTAATGACCTTGAACAAATTATATAGCTTTTCAGAACCTCCATTTTCTCATCTGAAAATGGATGTGCTGATGATTAGAGGTGTTTGTGAAGATCCATTGAAATATAGAAATATGTGCATAAATTACTTAGGACTTCGTAGGTATCAAGACCTGTCAGTTATGCCACACCTTCCACCAAGCTGTCCTTCCTATTCCTAAATTCTCTATTTCTTCTAATGATGCTATCGTCTTCTGGCTTCCCGCTCTAGAAACCTCAGTCCTTTAAAGAAAATTATCTTAACATTCTATTTTGAAGATTTTCAAACATATAGCAAAATTATAAAAATTTAAAGCAAACGCCTATGTGCTCACCACATAGATTCTACCTAGATTTACATTTTATCTTGCTTTATTCCTTATCCCAAATACCTTATTTTTAAATGCATTTCAAAGTTAATTACAAGCATCGTTTTACTTCTCCCAAAATATGGCATGTGTCTTACTACCTAGAGTTAAATATTTGTTTACATATTTTCCCTTTTGAGACAAAATTTACATACAACAAAATGCACAAATCTTAAGTGTACATTCACTGAGTTTGACAAATGTATACACTTGTGTAACCAAAATTCCTTAGATATAAACCATTGTCATCACCCCAAAAAGTTTCCTCTCACGATTTCCCAGACATTCTCTGCCTACCACTGCCTTCCCCACCCCAACCCCCGCCCCAGAAGCAACCACTGTTCTGTCTCGAGAACCACTGTTTGTTTTGAGACAGGGTCTCACTCTATCACCCAGGCTAGAGTACAGTGCCACAGTCATAGCTGACTGCAGCTTCAACCTCCCTGGGCTGAAGCAATCCTCCCACCTCAGCCTCCTGAGTAGATGGGACTACAGGCACATGCCACCACACCCAGCTAATTTTTGTATTTTTTTTTTTTTTGCGAGATAGAGTCTTGCCATGTTACTCAGGCTGGCCTCCAACTCCTGGGCTCAAAAGATCTCCCCGCCTCGATCTCCCAAAGTGCTAGGATTACAGGTGTTAAATACTGCACCCAGTCTGATTTTTCTCTACCATCAATTAGTTTTGCATCTTCTGAAAATTCATATAAAATGGAATCATACAGTGTGCGCTTTTTTTGTATAGCATTTTTCACTTAGCAAAATGTCCATATCGTGTGTATCGGTAGTTTCCTCCATTTTATTACTGAGTAGTATTTCATTATATGAATACCCCATAGTTTACTGATCTGTGCTCCTCCTGATAGATTCCTGGGCTGTTGCCAGTTGGGGCTATTATGAATAAAGCTGCTGTAAACATTCTTGTGTAAATCTATTGTAGACATATGTTTCCTATTCTCTTGGGTAAATATCTATAAATAGAATGTCTTGGTTATAGGGTACATCAATGTTTGGTTTTATGTGAAACAGCCAGACCCTTTTTTCAAGAGTTTGTATCATTTTGGAAAAGAATTCTGGTGGCATACAATCCACAGAATGAGGAATAATGTTTATAAATGATATATTTGATAAAAGGCTATCTAGAATATGTAAAGAACTATCACAATTTAAATAACCAAATTTTAAAATGGATGACAGATTTGAATATACTATACAGCTCTCCAAAAAAGATATATGAATGATCAATACTCATATGAAAAGATGCTCAACATTATTAGCCATCGGGAAATACACATCAAAACCACAATGACTTCACACCCACCATAATTTTTTAAAAAACAAGTGTTAGTGAGGAGAATTTGGAATCCTCAGACACCACTGGTGATGTACAACAGTACAGCTATCTTGGAAAAATGTCTGGCAGTTCCTCAAATGGCTAAACAGAGAGACCATATGACCCAACAATTCCATACCTAGGTATTTACCCAAAATAAATGAAAACATAGTCCTCACAAAAACTTGTACATAATGTTTATGGCAGCATAATTGCCAAGAAGTAGAAATAACTCAAATGTCCATCAACTGATGAATAGGTAAAAACAAAAGTTATATATCTGTACAATGAAGTATTATTTGGCAAGAAACAGAAATGAAGTATCGATACATGGTACAACATGAGCAAACATGGAAAACACTGTGCTAGATGAAAGAAGCCAGTCACAATAGACCACATATTATATGATGCCATTTACATGAGTGTCTAGAATAAGCAAATGTGTACAGATAGAAAGTAGACGAGAGGTTGCCTAAGGTTGGAGAGGAGGCAGGAGAATTGGAGAGTGACAGCTAAGCGGCACAGGGTTTTCTGGTAGAGTAATGAAAATATTCTAAAATGAATAGTGGTGATGGTTGGACTACACTGAAATGAAAATATTCTAAAATGGATAGTGCTGACAGTTGGCTGAATCATATACTTTATATGGGTGAATTGTGTGGTATGTAAATTGTATCTTAATTTTTAAATAAAGAATTCTGGTTGCTCCATATTCTCAGCCACATTTTGTATTATCAGGCTTTTAAATTTTAGTCATGCTGGTGTGTGTGTGGTGTTATCTCCTTGTGGTTTTAATTTTCATTTTCCTGGTGTCTAATGATGTTGAGCACTTTTTCATATGCTTATTATCTTCTTTTAATTTTCTTGCCCATTTTTAAATTGGGGTTTTTGTTGTTGTTGTTTTGTTTTTTGTTTTTTTTTTTAGACAAAGTTTTGCTCTTGTTTTCCAGGCTGCAGTGTAATAGCACAATCTGGGCTCACTGCAACCTCCACTTCTGGCTAATTTTGTATTTTTAGTAGAGATGGGGTTTCTCCATGTTGGTCAGGCTGGTCTCGACCTCCCAATCTCAGGTGATCCACCTGCCTCGGCCTCCCAAAGTGCTGGGATTATAGGCGTGAGTCACCGCACCTGGCCAAATTGGGTTATCTTTTTATTCGTGTTTGATATTGTCTTTTTTTAATTATTGTTCAATTATCTATTTCTGTTACAAATTACCCCTAAAATTTAGCAGCTTAAAGCAACCAACATTTATTGTTTCTCAGAGATTCCAAGGCTCAGGAATCAGGGAGAGACTTAGCCAGGTGGTTCTGGCTCAGGGTCTCTCATGAGGCTGCAAAGCGTTGGCTGGGATTGCAGTCATCTGAATGCTCAGCTTCCAAACTTATGTGGTTGTTGGCAGGTTACAGGTCCTTTCACGTGGGCCTCTCCATGGGGCTGCT
SEQ ID NO:4GGAAGGAGGATCCCGAATCCCAGCCAGAACTGAGAAAGCCCTCAAAGGTGCGGAAAGGGGACTTTTCCCTCAGGAAAGCCGGCAACAGCAGAGGCCCTAGCCCACGTCGCCACACCCACTCCGCGCGCGCCCCTCGCCTCCCAGGGCCGGCTCTGCTCGGCCCCGCGGCCTCTCGGGCGCCCCCAGCCCGCCGGAAAGAAAGAAGCAGAAACCCGGAGCCTGGGTCCCACCCGCGACCCCTCACCTTCGCCCTTCTCGTCCTCTCACCTGCCAGTCCCCCAGGAAGAACAGGACGCCTCTTCCCCCTGATGGGCGGCCACAGGCTCGGATCCTTCCATTGCCGCCTGAGACACCGCCGCCGGCTACTGGAAGGTAGGAAGGGGCGGGACCGTGGGGGGGTCAAGGGGCGGGCGGAGACGTCATCAGAGGGGGCGGGCCTGGGGAAGCTAGGAGCCCGGCAGCGCCTTCCCGTCAACCCTAGGGGCGTCCTGGTTTCCGGTTTGGGTGTGGCCGCATGGCGTGCTGTGGTGCAGGTGGCCGAAGGGGGCGTTACTGTTGCGACTGGCATCCGCATCCGGCAGATGTAGATGGAACCAAAGTCCAGAAGTTACGCGTCACCCTTGCTCTACAGCCAAACATGCAGGACTCTAGTAACCCGCGAAATGATGGGATAGCGTTGCAAATCCTTAAAAGAGTCTTAACGGTAAGAAGAGGAAACAGCTTTATTTTATAAATAAACTGAAGGCTGCTAATAGCTCCAGATTGTCAGTGAGGGGATACCACTTAAAGATGTTATACATTTAATAAATAATTTTGGGAGTCCACTACATGTGAGGCGCTGCCTCAGATTTAATAGAATCATGTGACTTTTAGTGCCATAGATGTCGTTAGATCATCCAGTTTGGTCCCTTAAATTTGTGGGTAAGGGAAAGGAACTTCCGGTCAGTGCAAGTGACTTGGTCAAGGTTATAGAGCTAGTCACTGTTAGATTACCAGAACACATATCTAAAAAGTTCTCATATAATTCTTTTTCATTTACTTCCGTGTCACCTTTCTTAGAAAGCAAAAATGAGTTGGACACAATAACATTAGGATTTGTCTTTCACTAAATAACACTGTATATTTGAATAAACATCTGCAGGATTTTTAAAATTAGCATATACTTTGGGTATTATGTAATTTTCTGTGATGTATCATATTTTTAATTAGAAATTTTTCCTCTCATATGGAGATGAGGGTCCAGGCAAAACTGTATTATCCTTCGTGCCCTCTATTCTCTTCAAAATTGCACATCTTAAAATACCTGGAAGCTTTATGTTGCTCACCTATAGCATTATCCGTGTTCCTCAATCCAGTTGTGAACCTTTTCCACATTAAAATGTTCTTGATCTGTGTTCTATTCTTTCAAGGCTCTGCTCTAGCACTAAGATAATGCTACAGGACTGAAGATAATGAAAAAGATTGAAGAAAGCAGAAACAGAACAAAAATCAGATTATTTCAAAGTTTCTTTCCTTGTAAAGGTTAAAACAGAGCATACTTCCTTATTATGCCCACTAGGTTAACTAGAATCTCCTGTTTTTTTAAAAAAAACTGGCTCATTTTTTCAAAATCCACTTTAATTACATGGTGCTTAGCACAAGCAACTCCATTCTGGTTTGATCTGATGGGGCCTAGTGTAGAAGGCTAGGCCAAAACAATGGCCTGCCATTACCCACGCTTCTTCATATTTTAACATCCATGAATAGAGGATGAATTTTTAAAAAATAAATACAGAAAACGATGCATCTTAAAATTGAGGGCATGTTAGATTTGATAAAATATGGTGTGAATTATTTCAGGCATGTAACAAGCAACCAGATTTAACAGATTTTAATGTTTTGTCACATATGTAAAATGGGAAAGAAAACTAGGCGATCACAGCTTTTTGACAGTGAGGCTTTATGTCATAAGAAAGTAGAATGACATATTGAGGAAACTTAAGGGAAAAATATGTAGGCCAAAGATTTTACATTCAGCAAAACTAATATACAAAAGGTACAAACTGTTATCAACAATTGATATATCAATTTGGTGAGACTAGTGTTTTCATGAGCCCCTCCTTAATAATTAATTGGAGAAAGTGTCTGACAATCAGAATTATTACAGAAACATTGATCTAAGGATTGACTCGGTTTCTTTACAGCAAATCATAATCTGTTGCATTTATTAGCTTTTGTGTTTCTTGTAGTTTATTCTTTATTACTAATTCTCCTGAGTTCTGTCACCTCATTTCTGAGGTTTTTCTAATTCAGAATCAAGTTCTTCCATATCTTTTATCATTTCTCTAATGTCATTTAGCTAGTTTCAAAATAATAAATTGTTTTGTAGTGCATCTTTCAGGCATGTTTTTATTATCTTTGATGATGATGTTATATTCCTTATTCTCTTCACATAATAACTGCATGGATTTGAACTTGATGCTTTTTTTGTTGCTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTGAGACAGAGCCTTGCTCTGTTGCCCAGGTTGGAGTGCAGTGGCGGGATCTTGGCTCACTGCAAGTTCTGCCTCCCGGATTCACGCCATTCTCCTGCCTCAGCCTCCCGAGTAGCTGGAACTACAGGCACCTGCCACCACGCCCGGCTAATTTTTTGTATTTTTAGTAGAGACGGGGTTTCACCGTGTTAGCCAGGATGGTCTCGATCTCCTGACCTCGTGATCCACCCCTTGGCCTCCCAAAGTGCTGGGATTACAGGCGTGAGTTATTGCTCATTTTTATGTGAAATTGGTGTTCCTGAACTAATATGAGACAGGCTTCTTAGCCCAATAAGCCTAAGTTTATCAGGAACAAAACTGTATTCCAAGAAAGTCAGGTATATTAGTCTGTTTTCACACTGCTATAAAGAAATACCCGAGACTGGGTAATTTATAAAGGAAAGAGATTTAGTTGACTCACAGTTCCACATGGCTGGGGAGTCCTCAGGAAACTTAAATCATAGCAGAAGGTGAAGGAGAAGCAAGACATATCTTACACGGTGGCAGGAGAGAAGTGAGATCGTGGGAAAACTGCCACTTTTAAAACCATCAGATCTCATGAGAACTCCCTCATTATCACAAGAATAGCATGGGGGAACTGCCCCCATAATCTAATCACCTCCCACCAGGTCTCTCCTTGCACACATGGGAATTAAAATTTGAAGTGAGATTTGGGTGGGGACACAGAGCAGACCATATCATCAGGTTTACTGGCTCATTGCAAGGAGGGAGCCCACATTCCAGAAGAACCATGGGGTACCTCACCAACAGAGGAAGAGATAGATTTATTGTAGGAATTTGGGGAAGTATGGAGTTTAGAAGGAATTGAAATGAAGTAGTGCTTTGATAGACTCAAAAGAAAGCAAGGCTGTTTGTAAAGAATTCTACACTACATCTAAACTATTACTAATGGCAAAAACTGCAATTACTTTTGCACCAACGTAATACAAGATGGACCCAGGGTTCTGTTTTTTGGAAATTGCAAAGTTCTGCCTCTCAGAAGTAGAAACTATTTCTCTGTGTCAATGTGACTTTAGATATTCTAGCCAAGAGTGAGATATTTCAATCTTAATAATAGGATTTAAACAGCAGAGTTTTTGACAATCTTTTGATATTGTCATAAATGTTCTATGATTTTAGAGAAAAGGGCATTGTGTGAGTAAAAAATCAGTTACTCTAAGGGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTGTTTGAGACATTTTAAAGCATCTTCCAGAGAGAAATAGTATTTTCTGTTAATTTCACAGCTGGCTTTATTTATGCCTGTTATCCCATAGCTGATGAATGGCAAAGCAGATTTTTACTTTCTTATTCTATGCTTATTTGCTTTCTCACAGGTTTTGGGAAAACTTTTCTAATTTCAGAGAATTCCCTTTTCTGTTGCTTTTGTGTAATGTTCAGCAATATTATGGTTTTATTTCCTTTTTAAATTAATACATACATAATAAGCATATATTTATGGGGTATTTTGATATTTGCGTACAAGGTATAATGATAAAACCAAGGTAATTGTGATATCCATCACCTCAAACATTGTTTATTTCTTTGTGTTAGGAACATTTCACATCTTGCCTTCTAGCTATTTTGAAATATATGATAAATTATTGTTAACTATAGTCACCCTCTAGTGCTATCGAACACTAGAAATTGTTTCCTCTATCTAATTGTATTTTTGTACCCATTACGCAACCTTTTTCATCCTCCTTACCCCCAACCTTCCCAGCCTCTGGTAACCATCATTCTACTCTCTACTGCCATGAGATCCACTTTTTTAGCTCTCACTTATGAGTGAGAATATGTGCTATTTGTCTTTCTATGCCTGGCATTTCACTTAACATAATGACCTCCAGTTCCATCTATGGTGCTTCAAACTACATGATTTCATGTTTTTGTGTAGATGACACATTTTTAAAATCCATTCATCTGTTGATGGACACTTAGATTGATTCCATATCTTGGCTATTGTGAATAGTACTGTAATAAACATGGGCATGCAGATACCTTTTAAATTTATTGAATTCCGTTTTTGGATGTATACTCAGGAATGGGATTGTTGGATCATGTGGTAGATCTATTTTTAGATTTTTGAGAAACTTCCATACTGTTTTTCATAGTTTCTGTACTAATTTACGTTCCCACCAGCAATGCACTAGTGTTCTCCTTTTGCCACATCCTCACCAGCATCTGTTATTTTCTGCCTTTTTGGTAATAGTAATCTTAACTGAGGTGAGATGATGTCTTATTGTGGTTTTGATTTGCATTTCCCTGGTGACTGGTGATGTTGAGCATTTTTTCATATGTCTGTTGGCCATTTATATGTCTTCTTTTGATAAATGCCTGTTTAGATCATTTGCCCATTTTAAAATTGGATTATTTGGGGGTTTTTGCTATGGAGTTGTTTGAGTTCCTTATATATTCTGATTATTA
SEQ ID NO:5TAACCTCTCTGTTCTTTTCCGTTCTTATCTATAAATAGGGGCAACCAACCACCAGTCCTCAGAGGCTCTGAAAATCTAATTTCAATTGTGGTTGAAAGTGCTCTGAAAATTTGAAATGTTACACAGATGTATGGGATTCCTCCTGAGCTGTATTTGAAACCACAGATATCCATCTGATTTGTAAATCATTTACCTTTTAGTCTCCCTAGCAGAAGTTAATAGTGAATGCTTTTCTTTTTTTTCTTTTTATTTTCTTGATTGCTAATTTTGTTAAGTTCATAAGCGATACTTACATATGTACATGTGGAGGCTGGAATCTGCTCTGGTTGATGTTGTAGTGCGTGAATGCCTGGGTGGGGTTTGAGCTGTACTCATCCACCGTTATGGTAACTTTGCCTTGAGAAGGAATCCCATGTGCCATCCTTCCTCCCTATAGGCATGAGCAATTCACAACTTTACAGAGCAAAAGATGGAAGCAGGCATGGTGCGTTTCAGCCAACCTCTGAATCCAAGGATCTACTCATCAATACCGCTGTGCATTTCTGAAAGAAAAAAAAAATGTATATAAAATGAGAACAAAGAGAAAAAGGGTGTTCTAAGAGACATAAATTTAACATCTAGACATGAAACTAGTTCAGGGAAAATCTGAATATGTGTTGTTGGCTCATGGATACAACTGTTCCCAACTCTCTTCCCTTCATGCACTTCAAAGTGGATATTACACTCTATACATATTGCTGGGTGCTAGCAAATCTTCTCAATGGAGTTCAAACTAAGATTTCCTCTTTAATTATAATTATGGCACTTAGCGTGAATTACGGAAGGGGCATATCCACCGTTGCCATGGCATCTGGCTATACATGGTTTGTGCTCCAAGTGAAGAATCTTCCAAACCTGCCCTGCTAATTGGAATGTTTGGTCTTTACAAAGTTGGTGTCACGTAATCATTTGAAAGCTCCATGTTTAAAGCAGCTATATAACACAATGACAGATAAGAATTTAAAATGTTGTGCTTATAACAAATACATGTGTATTACTATAACATGCACATAATAACCACACATTACACATATTTTTTTCTTTCACAAGCAGCTCCCAAAATACACAGGTAGGCAATGCTTGGCATTCCTCACTGGCCCAGAACCTTATGGTAAGGCAAATCTTTCTTGTTAAATGTAGTGTCATTTTTTTCAACACTCCAGTCACTCAGGGGAAAACCAAACACCTCCAGGTCTGGACCACCACTTTGAATGCATTCATTACCTCCCTTCTTCAAGCCCCGATGGAGCGGTAAAGAAGGGCGGCCATTACATCTGCCACCTCATTCTTGGTGCAACGTAATTCTCAGTAATTGGTTTCATTTTTTAAAATTTCCATTAGTTCTGATTTTTTCATAAATGTCAATATATTATTTGCTGCACTGGGTTGAGAAATGAAGATGTCTATTTTTATGGTAGGTGTGCAAAGGCTGAGGGAAGCAAATTCTCATGTCCAAGTTGTTGCAATTGATCAGTGCGGTAGAGAAGAAGCCGTAGTACACTCCTTGGGTAACCCTTAGGTAACCCATGCTCTTACTTTAAGTGCACAACGTCAGAATAGGTTTGCCATGTGCACCATTAAGCTCTGAGAATCTTATCTGCTATTTCAAATAAAAATATTTAGAATAATAAGATGAGATTTAAAATTGGCATGAAACACCTTAAATATCGAGCAAAAGGCAGATGGCCTGCCATAGGCCATTTATTTTATTATTTTACAACCCGGGGCTTGAGTAATCCCCCATATGCTAGCTGGGCTAAGAAATTCCAGAGTGTTCTACTCAAATCATTGCCTTCTTCATATTAGCAAAGCAAGCTAAATAACACCCACCTTGCCTGCCTTCCTAATGTCAAGTGCACTGCCAAGAGATGAATCCCCGTGCTCTGGCATTTTAAACAAAGTGTCACTTTGGGTTCTCTTTCTTTTTCCTGACTTCATGGGAGGTATGAGTCTTTTAAGCGCCAGATGATAGACAACCAGGCCAGTAGGATTAACTAAATTAAAATCTTTCCCTGCTCCTCTGATGTAAGATATCTATAAGAACTGCTTACAAATCATAATGTAGCAGTTTTCATACCAAGTTTGCAGCTGTTTCCTTAATTTCTCCCACAATTATATTTTACTGTTATTTTGCATAACAGTAAAACACAACACCTGCTTCAAATTGCAGTCCTGTTCTAAGTACTGTAATTCTCTTTTGAGACACAAAGTACCGAGACACTACTGAAGCGCAAAACTGCATAATTGCGTCGCGCTGAAAAGTAAATACAAATGAAAACATCTTCCTGTTATAGAAATGACTGTCATTAAAAAGAATGTTAGCCATCAAAGCACAGAGGGGGAAAAATTCACATTTTCAGACTGTGAGAAGTTAGTGTTTGCATAAATTAGAGAGTGGTGTAAAAATTACTTGACAATTCTTATGTTCATTCTTCCATCAATGTCTATTGTGTGAAATACTGAACATTAAGAAGCAAAGGAAATCAAATTCATGTCTAGACCGCTGTGACCTCTGAGTAACAATCTCTGCACCCAGTACTAGAAAGATTTTAAATGTTTCTGGAGTAAACACACTAATTAAACCAAGCAAATGTGGCCTAGAAATAAAATATACATACCTAATATTTAAACATCTAGGTAATGACTTGTAGCAGTTAGCATGATACCCACCCAAGTTCTACTATTTGAAGCTAAGAAGAGACAGAATTTAGCAGCTGATCAATTTGCACTTCTACATGGTCCGCTTGATCCTAATGTCAACCTTCTCTATCACTGAACATCTATGCCTCTTTGCACCTTTGCCCCAGTAAGACAAATAGAACATCTTTTCATCAGCAAGCACAGGCCCCTGTAACTCTGAAAGGCTAAATGGGTGGCTGGCACCTCATTTGAATTCATCTTTGCCATGTTCCCTTTCAAATGTTTCATCGAAACAGTGCACCTGCAGCGTCTATCTTCTTTAATCTGGAGTCCTTTGAAGAAAATGTCAGACTGAGGCAGAGAGCTTCAAAACTTTCACAGCACCTTTACAGACAAGTCAAGAAAAGGCTTATTTTTTAAAATGCTATGTTCATCCCCACCCGTATCTCAAAATGAACACATCTTAAGAATTTTAAACACAAACACCTGGAAAAGACTTTTTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGGTAAACTCTCAGAGACAAGGGACAATAGACAAAACCACTTCCTATAACCTGAGAAATTTGGAGAGAGCTTGAAACAAGACAGAAGGATACACTGCTTACAACTATCAAGAAGATGTATATTTAGGCAGTAAAACCTTCCAAATGATCAGATTTTCGTGCATCTCACCCTCTTCACACTTACTTTAACTTTTTACACACAATATTTAAAGACAGCACTATTCTTTTCATAAATTTTCATTTTATACTTCAACACACTTTCCACAAAACAAAGGAACCCAGGACGAAATATCAAGAAGCCGAAAGAAAAATCTAAAAGGGACTGACACTGCCAAACATTCATGCTGGTGCTAGTTTGATTTTTCTCTTTAAAAAGAAAATCATGTGAGTACATTTTGCATTTCCTAGACAGCAATCACTTCTGTCCTTTAAGCTGTACAACTAGCAATATTCTTTTCCAGGAATCTAGTTGGAAAACCTTTTAAAGTCGGCTGGCAATGAAGGGATTAAAAGCTGAGGAATTAAATAACTGTCTCCACCTCCTAGACACCAGAAGTCCAATTTACCAAAACTTTCAAAGCAACAACTCATGACCTCTCTACCCCTGCACTGCCCAGCACAGCCTATGAGAAAAGAGCCCGCGGTTTTCTCGTTTCAACAAGGATGCTCATTTTAATCACTTGCCCCAAGATCTCCAGACCGAGCCTGGCGGGACTTTGGAACTTGCCTGCTCCAAATCCGCCAAATTTCGCTCTCTCCTCCCTCTGCCGCGCAGATCCAGTGCGTTCTTAATTCACGCCCCTACTCTTTTATGCCCACTTCCAGTTACTCATCCCTGTATCTGGGAGCGATGCCCACACGCCTTCCCGGCGGGCTTCTCCGCCAGGGTTTTTTTGGGGGAGGCTGACATAAAGTTCCACGTGCTTCTGTCCACCGAGCGCCCTCCCTCCCACCGCACTTACACCTGAACTTGTCTCCAGCACTGCGGACACCCGGGTGACACATTCTTTCGGAGAGGGAGGGCAAGACTTTTCTCCGGAGCCTCTGGCAACTCGTGGAGTCTATATAAGGTGGGGCGGTGGGGGGCGCGGAATTCTCTACTTTGGATTGGTTTGTTTGTTTTAAATCTAGGGTGGTGGGCAGTTGCGCGAGGCGGGGTGGGGGGTGCTTTATGAACTACACACACACACACACACACACACACACACACACACCACATACACTCGCCCTGCCCTTCTAGGCTCACGGCTGGCTCTTCCCGGCTACAACTTCCCCTTCCTTCCTGAAACACCAGCGCCTTACTCGCTCAGTCCCCCGTTGCCACCTCCGTCACCTCCTCGGCCGCCGCTCCTGCTGGCACTGCTGGCGCTAGCGCTGGCGGCCCCGGGCTCCGCTGGACGCCTATCTTTTTTCTCTCCCTCTTCCCTAGCTCTGGATTGATTGATGACCACCGGCGGCCAATGGCTCTGACACCACGCCATCCTCGGTCGGGCATCACAGCCCCACGTCCCCGACCTCAGCCTCCCGGGCGCGTTGGCATCCCCGAACCCACAGCGCTGAGCCCGAGCCCGGGGCCGCCGCCTCCTCCCTGCTCTACGCCTGGGCGCTGCCAGGTTCCTTCCCTGGAACGGCGGAGAAAGGAAGGGAGGGAGCCAGCGAGCGTTGGAAGGGGGTGTGGAGGCCACGGGATCTCCCCCTCTTCTGACATCTTTTTTCACTTAAACTTTTGTTTGTCCCACCCCCCCGACCTGTTTGTGTTTGTTTGCAGCATCTCAAATCAATTATACATT。
SEQUENCE LISTING
<110> 博尔诚(北京)科技有限公司
<120> 用于检测肺癌的标志物及其用途和系统
<130> PE01733
<160> 5
<170> PatentIn version 3.5
<210> 1
<211> 5001
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述: 人工合成的序列
<400> 1
gctccgttgc ccaagctgga gtgcagtggc ttataaaaca tggctcactg cagccttgaa 60
ctcctgggct catgcaatcc tcctgcctca gcctctggag tagctgggac cacagaagtg 120
caccaccaca cccggctagt tttattttta tttgtagaga tgggatctcc ctatgttgcc 180
cagtctggtc tccaacctgg ggcctcaagt gttccccctg cctcggcctc ccaaagtgca 240
gggattacag cttgggccac tgtgcccagc cctttcttcc atcattccgt cctctccttc 300
cttcttaata ctgcttgtca aactgatttt gccacccagt ttgaaaaaga aggtctagag 360
gattatccca atcattaact atttctgcag gttagcttac ctttccagaa tacagaatag 420
aattcagcaa actgcctcaa agagcagttt ctagatttga cttcttcctc tagggtttat 480
gaagtcatca tactgaagtg acctggattt ccctatacgt gaacctcatg acgtgggagc 540
ccggggtagg gagggacaga taacatgaga atcaatagaa agaactgcaa ggtctgaaga 600
caagaaccat ttgtctagtg gagtctattt tatatccatt ttttaaaaat ctccatttaa 660
gatatttagc ttcaacgtgc accttgacca attaatccaa caaacaaaac tctggcttgg 720
gggcccagtt actcactttc atggaaagag acctctgttt ttagaaccag ggatcttgtg 780
agtccctccc acgtccccag cccttctctg gcctcgggta acttttccct ccagtttggt 840
ggaaggttac attagaagaa aatagtccct accgtctaga aagttttcgg ggggggaaaa 900
aagggcgttg gacgtgcggg tgggtgggta taccgggagg ggacagctgg agccgcgaag 960
gcgcgggggc ccgcggcgcg tgggtgtgga ggccgcgggg cggcaggagg cactgggaag 1020
cggggtgaag agcaccgaag tccagaaaag ggcagtgtcc gccctgcgct cctctgctgg 1080
cgcccgcaac ccgggaggga gcggcgaggc tccgaagggt gggattcgag gtctgaaccc 1140
tcgagtgggc ttgggttttc aggagccgcc ttttcttatt gatcatttct cttttgtcat 1200
cataatctct tggcctcaga ctgagttaag ggagccatag taggagtgca gaaaatgaag 1260
tggaggaaaa aaaaatgtga tatttaaaat atagtttttc ctactttctt tttctctctc 1320
aaattaattt agatgtaaat aacattttaa cagggcccaa catcaggctc ctaggctctg 1380
gctgctggtc tcacttgaca ccagaataag attttggtgt gctagtaatt ttgccaaatg 1440
gaggcctact ccccaaaaca tcaccgtggt gcatgatgaa catttctgta ggtgatgacg 1500
tggagttttt gttttacttc attctaatac atgtccctgc ttcaagtggg taaaattata 1560
cctagctcag cccaggttta attcagatta tttaaaaaat ttcagtggca agtaatttac 1620
gagcttctct ttattaagat ttaggaaatt ttgctttatt gcgcatgcat tttaagtatt 1680
tttttgctgt gttcctagtg tagatagaaa acaacctgtc actgtctcct agttggccct 1740
gtcaacaaac atttgagaag tgcttagatc agaatgctgt tgagtactac aaattaaaca 1800
atctgatgta cttgttaatt tcattacaaa cagcagttag gatttcatat acatatagtc 1860
tgtaccatgc tatatatcag aaatctttgt aaatataaac tccttaaata tagggaccca 1920
gttttattct tcagcgaaag ggagttaatc ttttggtgtt gtgcatttag aaggatctcg 1980
gatgtaagag gctcattaaa tgatagctgt tagtattatt tatcttggta tcttccaaag 2040
ggctttgcac atggctaaca ctaagaaata ttggttgaat gaatgaaggt gccatgccca 2100
tactgtgata tacacagaga aaagaccagg atggggacac tagcacagtg atttcatttc 2160
atcagtgaag ctttgtgtgg aagtgtccct cctgcagccc ttttaccaga tgcaggctcc 2220
cttgaccttg gattgtggac cacttaaaat tttcagggga aaaagtgtgc ctaattagct 2280
agtagggcct aacctcttgt caagatggaa cttgagaagt ttgtctaagt atggaaaagc 2340
taagctcact tgacacagat cacgggaaga aagatttctg catgttattc aagttattca 2400
cgtcaaaagc gattaggggg ccccagcttc cattacatca ttcattagga aaatgtgtgc 2460
tgggagctct gcaaatcaca tgatttgatg gaggcattga gactgggttt cttgtgtgtc 2520
tgcccttggc catattcagt ttttagtatg tttggaaaag gctgaagcag aacatgaaga 2580
tctagtttat tttaatgctg tcagacagct aaatggtgga aacttgttga agagatttac 2640
tgagctgttt ccttagattg aagactttag agaattaatt aacagggttc tgagagatac 2700
aacatgccag acccctactg actctaagag tgtactttct tactgatatg atgtgatagc 2760
tgagcacagt atatgtgaaa ctgctgggga gtaatacaag agcagtgctg atgtgttcta 2820
agacatgcag gtgttcagat gagaactggc catgacaact gagtcagcca ggcactggac 2880
tcatttcctt ttgcttaagc accatgagct cagtagaagc acagactttc acaaggtgct 2940
gaactacttg gtgaaaatga agtcacaatt ttggaagagc ttcactgatt ttgatgtgta 3000
ggtattgttt cacgttttag ctgttgcttt tagaatgcat gccttaagat ggttctcagt 3060
tatcatgcta tatctatgcc acgccatttc tagagcaagt aacttagctg aaagtgacta 3120
tacctataag aaaacaaata tccctgtaga gacatttgta gatgaattgt ggaagtactc 3180
taaaattttt ggccagattt tggggaatgt ttgagtctag ctggtacaga aagtacattc 3240
tgttttatga aaatagcaac attgaagtga aaagatatca ttaatgtata catgtagtca 3300
gaaattgaat gtgccctggc tgattgcaat ttatttattc acttaatgcg tatttattga 3360
gtacaaggcc ttagagtttc ctcagttctt atagtctgta acagtgccat tccataggaa 3420
tgtaatgaga gccacatata taatttacaa ttttctagta gccacattaa aaaattaaaa 3480
agaaactgat aaaattaatg ttaatattaa tatattttat ttcaccaaat atatctaaaa 3540
atatatctaa aatattatcc taatatgtaa ttaatatact tttattggtt tttttttttt 3600
gttttttttt tttttttggg gacagggtct cactctgtca cccaggctgg agtgcagtga 3660
cacaatcatg gttcattgca gcctcaacct tctgggctca gatgctcctc ccacctcagc 3720
ctcgtgagta gctgagacca caggcatttg ccaccagcta attttttgta tttttttgta 3780
gagacaggat ttcccatgtt gcccaggctg gtctccaact cctgggctca cgcgatccac 3840
ccgccttggt ctcctgaagt gcagggatta caggcatgag ccactagaaa ttattaacaa 3900
attattttac attcttcgtt ttgaattaag tttctcgaat ttacttacag caaatctcac 3960
attgcactag ccacatttca ggtactaaaa aactacatgt gattaatggt taccatactg 4020
ggcagtccat gtctagagag aaatacagat gtgtaatttg taaacaggta aacagataat 4080
ttcttttctt tttctatttt tctttttttt ttgagacaaa ttctcactct cccaggccgg 4140
agtgcagagg ctcagtgcag cctccacccc ctgggctcaa gcgatcctcc cagctaacct 4200
ccccaactcc ccaccccagc agctgggact acaggtgggt accaccatgt ccaactaatt 4260
tttatagaga taggttttca tcatgttacc cagactagat aattttaatt aaatgtaata 4320
aaggctatga tgagaaaagt acactcatca tacaatgaaa gcatagaaaa ggggcttagt 4380
tcctccagtt tttcctccta aaatctcata attctctctg cttctctgca tcctgcctgc 4440
cacgactcta atctaagcca gattatctct ctcctagact tgcacaacag cttccgaaat 4500
tgtctacctg catctatccc tgcccctgtt tgcagataaa gtgagctttt aaaaacgccc 4560
atcagatcat gtcattcctc tgtttaaaac cttaaatata tgatgaacac attggacaag 4620
tgtgagatga tgtacataaa gcgcccagcc caaaggttct gctcactgag tttagttctc 4680
ctcgtttctt cctttcactc tcttttttct tcctcttact ttcctcccca gctccttcct 4740
cttatcacct atcagtctct tatcatctga atttcttttt tctttcttcc ttctcacttg 4800
ctttccattt ttttcttcca tctttacttt ctctcctttc tgctttagtt tattttaata 4860
tagaatttaa atagatttag aaattcattc tttaattatt tacttctgag ttccaagctc 4920
ttcatttaaa aatcaaaaga gtactgggca ctgtggctca cgcctgtaat cccagcactt 4980
tgggaggccg aggtgggcgg a 5001
<210> 2
<211> 5001
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述: 人工合成的序列
<400> 2
tctccatgag ctggtgcaag gacaactaat tttaaggtat taaaaaaaca aacagaaaag 60
caactcttaa atgtataaca aaaatttact gagaattagg tctgtggata cagtgttaga 120
catctagaca ctttcccctg aaactattct tcttaagtca aggaaacacc tccatccctt 180
ttcaggaaac ccagaaggca aactctaagg cttaaagaat ccagtaattt aagtcgtcct 240
tattttaaag aaataaggac ggttctccct tcaagtgggc gcagctgcta cctggtatga 300
cagtacaggg ccaggcagtg ggctgtttaa ggcgcatgca gcctaaagat gatggctacc 360
agatttccta ggctgagctc aaagcgcagt gaggggtact ttcaaaaagt taaacaatgt 420
ttgcaaacat gctcccccat gccacgttaa atgtccctca acactagcct gaaagttcca 480
aatgcctata ctgacgctgc agccatgcaa gaaagctgaa taaaatcaca ccacgggcag 540
agagaggtgc agcaactggc aaagcacctg tgtgtgctgg ctgcacaaaa catgccgcac 600
agttccgcta agctaaatct gtccgtgtcc ccagactgca cccaactttt aagaaaggaa 660
agaaactgag gccaaaagaa ttaaagtcgt gtggggacaa gcctgaatta agagccagag 720
tggcagaaaa ccagagtgct gctgcaaaga agatgctaga gggagaaagg aaagacaggg 780
acgggggctg gggcttgggg agggccaagg ttggggtctc acagcggcgc ctctgagcgc 840
gactcgaaac ttcgaggcca gcagtctcca cccccggccc ttttcccact gtggcgagtg 900
ccgctgaaga gcctgccctt ggcccctcgc tctctcactc acctcgacat gagcctccac 960
atctcgcgct gccccatcgc caaacactcc gaagctaaag cagcagagcg agaatctccc 1020
ggaccgttcc agcgcctcgc gtgagccccg cccaccgccg tcctgcgccg ccgggcacag 1080
atgacaagtc ctccaggaag ccagagcgac cgtttccgct acgcgacggg gaagggcggg 1140
gcaagaacga cgcctggagg aaatagttga gggagaggaa gggatcgggg accgggccag 1200
ggagaaggcg gagagcgagc tgaggcggag cgggaagagg gaggatagaa cggactaggg 1260
cggattcgca ggaaaggaga ttgccctcta gaggctgtct tagcccaaag cgcaacctgt 1320
tgtctaggct tggcctgcca atttgaccag cagggactga tgtgaaagac ttttctggaa 1380
ttttagtaat tttttattaa aacgtaaact tagtattctt tgagactcaa gtagaggaat 1440
tacagttgat aaaggacatc gatgtagttt attcattcct aacccaatac agccgaattc 1500
ctttaatatt aggattgaga cattttcatt tttcttggga aaagttacag atctcccact 1560
cttcctcaaa gacacacaag agttgtctga ttaagacata atagatatgt cttcccaact 1620
aaagtaaaag ttgctgttat cagtggaagc ataattacat tcagaaagta gcttactctt 1680
aaatgaaacc aacatttaac tcaactacta ggatccactg ttaaattgag gaaaacgttc 1740
ctccgcttcc agatccaccc agatgtgtag cagaagacat ttcatcgcca ctattaagta 1800
ttgacacatt tatcagaaag aagaaatccg gtgacaaatt tcagagagga cacatgaaag 1860
gagttattct tagtaccttg atatttaaag agatacactg ttgagacttt gatcaaaaat 1920
tacgttgcta acctaggtca aatgtaataa ccaaatgccc actgagaaga ggacagacaa 1980
cagacatcac agaaggaact ccttacctgc aatttggttt ttaactggct acaggacatc 2040
accatctgac atcaccatca tgcctcattc actgcgcaca gaaatgaacc attcatctga 2100
cctagcatgg tttactggaa aaagcatggg ctttcctgtt agtcagactg agattcaaat 2160
cttccttgcc gccctagctt catgtgtgtg aaacctgagt ctcacaaggc ctcatcgtta 2220
gaagggccct gtgcttgttt taatgctgtg ctattaataa tttttgaaca aggaaacaca 2280
aattttcatt ttacactagg cctgcaaatt atgtaatcag tcctacccct agcacactaa 2340
tagtttaatg accttgaaca aattatatag cttttcagaa cctccatttt ctcatctgaa 2400
aatggatgtg ctgatgatta gaggtgtttg tgaagatcca ttgaaatata gaaatatgtg 2460
cataaattac ttaggacttc gtaggtatca agacctgtca gttatgccac accttccacc 2520
aagctgtcct tcctattcct aaattctcta tttcttctaa tgatgctatc gtcttctggc 2580
ttcccgctct agaaacctca gtcctttaaa gaaaattatc ttaacattct attttgaaga 2640
ttttcaaaca tatagcaaaa ttataaaaat ttaaagcaaa cgcctatgtg ctcaccacat 2700
agattctacc tagatttaca ttttatcttg ctttattcct tatcccaaat accttatttt 2760
taaatgcatt tcaaagttaa ttacaagcat cgttttactt ctcccaaaat atggcatgtg 2820
tcttactacc tagagttaaa tatttgttta catattttcc cttttgagac aaaatttaca 2880
tacaacaaaa tgcacaaatc ttaagtgtac attcactgag tttgacaaat gtatacactt 2940
gtgtaaccaa aattccttag atataaacca ttgtcatcac cccaaaaagt ttcctctcac 3000
gatttcccag acattctctg cctaccactg ccttccccac cccaaccccc gccccagaag 3060
caaccactgt tctgtctcga gaaccactgt ttgttttgag acagggtctc actctatcac 3120
ccaggctaga gtacagtgcc acagtcatag ctgactgcag cttcaacctc cctgggctga 3180
agcaatcctc ccacctcagc ctcctgagta gatgggacta caggcacatg ccaccacacc 3240
cagctaattt ttgtattttt tttttttttg cgagatagag tcttgccatg ttactcaggc 3300
tggcctccaa ctcctgggct caaaagatct ccccgcctcg atctcccaaa gtgctaggat 3360
tacaggtgtt aaatactgca cccagtctga tttttctcta ccatcaatta gttttgcatc 3420
ttctgaaaat tcatataaaa tggaatcata cagtgtgcgc tttttttgta tagcattttt 3480
cacttagcaa aatgtccata tcgtgtgtat cggtagtttc ctccatttta ttactgagta 3540
gtatttcatt atatgaatac cccatagttt actgatctgt gctcctcctg atagattcct 3600
gggctgttgc cagttggggc tattatgaat aaagctgctg taaacattct tgtgtaaatc 3660
tattgtagac atatgtttcc tattctcttg ggtaaatatc tataaataga atgtcttggt 3720
tatagggtac atcaatgttt ggttttatgt gaaacagcca gacccttttt tcaagagttt 3780
gtatcatttt ggaaaagaat tctggtggca tacaatccac agaatgagga ataatgttta 3840
taaatgatat atttgataaa aggctatcta gaatatgtaa agaactatca caatttaaat 3900
aaccaaattt taaaatggat gacagatttg aatatactat acagctctcc aaaaaagata 3960
tatgaatgat caatactcat atgaaaagat gctcaacatt attagccatc gggaaataca 4020
catcaaaacc acaatgactt cacacccacc ataatttttt aaaaaacaag tgttagtgag 4080
gagaatttgg aatcctcaga caccactggt gatgtacaac agtacagcta tcttggaaaa 4140
atgtctggca gttcctcaaa tggctaaaca gagagaccat atgacccaac aattccatac 4200
ctaggtattt acccaaaata aatgaaaaca tagtcctcac aaaaacttgt acataatgtt 4260
tatggcagca taattgccaa gaagtagaaa taactcaaat gtccatcaac tgatgaatag 4320
gtaaaaacaa aagttatata tctgtacaat gaagtattat ttggcaagaa acagaaatga 4380
agtatcgata catggtacaa catgagcaaa catggaaaac actgtgctag atgaaagaag 4440
ccagtcacaa tagaccacat attatatgat gccatttaca tgagtgtcta gaataagcaa 4500
atgtgtacag atagaaagta gacgagaggt tgcctaaggt tggagaggag gcaggagaat 4560
tggagagtga cagctaagcg gcacagggtt ttctggtaga gtaatgaaaa tattctaaaa 4620
tgaatagtgg tgatggttgg actacactga aatgaaaata ttctaaaatg gatagtgctg 4680
acagttggct gaatcatata ctttatatgg gtgaattgtg tggtatgtaa attgtatctt 4740
aatttttaaa taaagaattc tggttgctcc atattctcag ccacattttg tattatcagg 4800
cttttaaatt ttagtcatgc tggtgtgtgt gtggtgttat ctccttgtgg ttttaatttt 4860
cattttcctg gtgtctaatg atgttgagca ctttttcata tgcttattat cttcttttaa 4920
ttttcttgcc catttttaaa ttggggtttt tgttgttgtt gttttgtttt ttgttttttt 4980
ttttagacaa agttttgctc t 5001
<210> 3
<211> 5001
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述: 人工合成的序列
<400> 3
agccatgcaa gaaagctgaa taaaatcaca ccacgggcag agagaggtgc agcaactggc 60
aaagcacctg tgtgtgctgg ctgcacaaaa catgccgcac agttccgcta agctaaatct 120
gtccgtgtcc ccagactgca cccaactttt aagaaaggaa agaaactgag gccaaaagaa 180
ttaaagtcgt gtggggacaa gcctgaatta agagccagag tggcagaaaa ccagagtgct 240
gctgcaaaga agatgctaga gggagaaagg aaagacaggg acgggggctg gggcttgggg 300
agggccaagg ttggggtctc acagcggcgc ctctgagcgc gactcgaaac ttcgaggcca 360
gcagtctcca cccccggccc ttttcccact gtggcgagtg ccgctgaaga gcctgccctt 420
ggcccctcgc tctctcactc acctcgacat gagcctccac atctcgcgct gccccatcgc 480
caaacactcc gaagctaaag cagcagagcg agaatctccc ggaccgttcc agcgcctcgc 540
gtgagccccg cccaccgccg tcctgcgccg ccgggcacag atgacaagtc ctccaggaag 600
ccagagcgac cgtttccgct acgcgacggg gaagggcggg gcaagaacga cgcctggagg 660
aaatagttga gggagaggaa gggatcgggg accgggccag ggagaaggcg gagagcgagc 720
tgaggcggag cgggaagagg gaggatagaa cggactaggg cggattcgca ggaaaggaga 780
ttgccctcta gaggctgtct tagcccaaag cgcaacctgt tgtctaggct tggcctgcca 840
atttgaccag cagggactga tgtgaaagac ttttctggaa ttttagtaat tttttattaa 900
aacgtaaact tagtattctt tgagactcaa gtagaggaat tacagttgat aaaggacatc 960
gatgtagttt attcattcct aacccaatac agccgaattc ctttaatatt aggattgaga 1020
cattttcatt tttcttggga aaagttacag atctcccact cttcctcaaa gacacacaag 1080
agttgtctga ttaagacata atagatatgt cttcccaact aaagtaaaag ttgctgttat 1140
cagtggaagc ataattacat tcagaaagta gcttactctt aaatgaaacc aacatttaac 1200
tcaactacta ggatccactg ttaaattgag gaaaacgttc ctccgcttcc agatccaccc 1260
agatgtgtag cagaagacat ttcatcgcca ctattaagta ttgacacatt tatcagaaag 1320
aagaaatccg gtgacaaatt tcagagagga cacatgaaag gagttattct tagtaccttg 1380
atatttaaag agatacactg ttgagacttt gatcaaaaat tacgttgcta acctaggtca 1440
aatgtaataa ccaaatgccc actgagaaga ggacagacaa cagacatcac agaaggaact 1500
ccttacctgc aatttggttt ttaactggct acaggacatc accatctgac atcaccatca 1560
tgcctcattc actgcgcaca gaaatgaacc attcatctga cctagcatgg tttactggaa 1620
aaagcatggg ctttcctgtt agtcagactg agattcaaat cttccttgcc gccctagctt 1680
catgtgtgtg aaacctgagt ctcacaaggc ctcatcgtta gaagggccct gtgcttgttt 1740
taatgctgtg ctattaataa tttttgaaca aggaaacaca aattttcatt ttacactagg 1800
cctgcaaatt atgtaatcag tcctacccct agcacactaa tagtttaatg accttgaaca 1860
aattatatag cttttcagaa cctccatttt ctcatctgaa aatggatgtg ctgatgatta 1920
gaggtgtttg tgaagatcca ttgaaatata gaaatatgtg cataaattac ttaggacttc 1980
gtaggtatca agacctgtca gttatgccac accttccacc aagctgtcct tcctattcct 2040
aaattctcta tttcttctaa tgatgctatc gtcttctggc ttcccgctct agaaacctca 2100
gtcctttaaa gaaaattatc ttaacattct attttgaaga ttttcaaaca tatagcaaaa 2160
ttataaaaat ttaaagcaaa cgcctatgtg ctcaccacat agattctacc tagatttaca 2220
ttttatcttg ctttattcct tatcccaaat accttatttt taaatgcatt tcaaagttaa 2280
ttacaagcat cgttttactt ctcccaaaat atggcatgtg tcttactacc tagagttaaa 2340
tatttgttta catattttcc cttttgagac aaaatttaca tacaacaaaa tgcacaaatc 2400
ttaagtgtac attcactgag tttgacaaat gtatacactt gtgtaaccaa aattccttag 2460
atataaacca ttgtcatcac cccaaaaagt ttcctctcac gatttcccag acattctctg 2520
cctaccactg ccttccccac cccaaccccc gccccagaag caaccactgt tctgtctcga 2580
gaaccactgt ttgttttgag acagggtctc actctatcac ccaggctaga gtacagtgcc 2640
acagtcatag ctgactgcag cttcaacctc cctgggctga agcaatcctc ccacctcagc 2700
ctcctgagta gatgggacta caggcacatg ccaccacacc cagctaattt ttgtattttt 2760
tttttttttg cgagatagag tcttgccatg ttactcaggc tggcctccaa ctcctgggct 2820
caaaagatct ccccgcctcg atctcccaaa gtgctaggat tacaggtgtt aaatactgca 2880
cccagtctga tttttctcta ccatcaatta gttttgcatc ttctgaaaat tcatataaaa 2940
tggaatcata cagtgtgcgc tttttttgta tagcattttt cacttagcaa aatgtccata 3000
tcgtgtgtat cggtagtttc ctccatttta ttactgagta gtatttcatt atatgaatac 3060
cccatagttt actgatctgt gctcctcctg atagattcct gggctgttgc cagttggggc 3120
tattatgaat aaagctgctg taaacattct tgtgtaaatc tattgtagac atatgtttcc 3180
tattctcttg ggtaaatatc tataaataga atgtcttggt tatagggtac atcaatgttt 3240
ggttttatgt gaaacagcca gacccttttt tcaagagttt gtatcatttt ggaaaagaat 3300
tctggtggca tacaatccac agaatgagga ataatgttta taaatgatat atttgataaa 3360
aggctatcta gaatatgtaa agaactatca caatttaaat aaccaaattt taaaatggat 3420
gacagatttg aatatactat acagctctcc aaaaaagata tatgaatgat caatactcat 3480
atgaaaagat gctcaacatt attagccatc gggaaataca catcaaaacc acaatgactt 3540
cacacccacc ataatttttt aaaaaacaag tgttagtgag gagaatttgg aatcctcaga 3600
caccactggt gatgtacaac agtacagcta tcttggaaaa atgtctggca gttcctcaaa 3660
tggctaaaca gagagaccat atgacccaac aattccatac ctaggtattt acccaaaata 3720
aatgaaaaca tagtcctcac aaaaacttgt acataatgtt tatggcagca taattgccaa 3780
gaagtagaaa taactcaaat gtccatcaac tgatgaatag gtaaaaacaa aagttatata 3840
tctgtacaat gaagtattat ttggcaagaa acagaaatga agtatcgata catggtacaa 3900
catgagcaaa catggaaaac actgtgctag atgaaagaag ccagtcacaa tagaccacat 3960
attatatgat gccatttaca tgagtgtcta gaataagcaa atgtgtacag atagaaagta 4020
gacgagaggt tgcctaaggt tggagaggag gcaggagaat tggagagtga cagctaagcg 4080
gcacagggtt ttctggtaga gtaatgaaaa tattctaaaa tgaatagtgg tgatggttgg 4140
actacactga aatgaaaata ttctaaaatg gatagtgctg acagttggct gaatcatata 4200
ctttatatgg gtgaattgtg tggtatgtaa attgtatctt aatttttaaa taaagaattc 4260
tggttgctcc atattctcag ccacattttg tattatcagg cttttaaatt ttagtcatgc 4320
tggtgtgtgt gtggtgttat ctccttgtgg ttttaatttt cattttcctg gtgtctaatg 4380
atgttgagca ctttttcata tgcttattat cttcttttaa ttttcttgcc catttttaaa 4440
ttggggtttt tgttgttgtt gttttgtttt ttgttttttt ttttagacaa agttttgctc 4500
ttgttttcca ggctgcagtg taatagcaca atctgggctc actgcaacct ccacttctgg 4560
ctaattttgt atttttagta gagatggggt ttctccatgt tggtcaggct ggtctcgacc 4620
tcccaatctc aggtgatcca cctgcctcgg cctcccaaag tgctgggatt ataggcgtga 4680
gtcaccgcac ctggccaaat tgggttatct ttttattcgt gtttgatatt gtcttttttt 4740
aattattgtt caattatcta tttctgttac aaattacccc taaaatttag cagcttaaag 4800
caaccaacat ttattgtttc tcagagattc caaggctcag gaatcaggga gagacttagc 4860
caggtggttc tggctcaggg tctctcatga ggctgcaaag cgttggctgg gattgcagtc 4920
atctgaatgc tcagcttcca aacttatgtg gttgttggca ggttacaggt cctttcacgt 4980
gggcctctcc atggggctgc t 5001
<210> 4
<211> 5001
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述: 人工合成的序列
<400> 4
ggaaggagga tcccgaatcc cagccagaac tgagaaagcc ctcaaaggtg cggaaagggg 60
acttttccct caggaaagcc ggcaacagca gaggccctag cccacgtcgc cacacccact 120
ccgcgcgcgc ccctcgcctc ccagggccgg ctctgctcgg ccccgcggcc tctcgggcgc 180
ccccagcccg ccggaaagaa agaagcagaa acccggagcc tgggtcccac ccgcgacccc 240
tcaccttcgc ccttctcgtc ctctcacctg ccagtccccc aggaagaaca ggacgcctct 300
tccccctgat gggcggccac aggctcggat ccttccattg ccgcctgaga caccgccgcc 360
ggctactgga aggtaggaag gggcgggacc gtgggggggt caaggggcgg gcggagacgt 420
catcagaggg ggcgggcctg gggaagctag gagcccggca gcgccttccc gtcaacccta 480
ggggcgtcct ggtttccggt ttgggtgtgg ccgcatggcg tgctgtggtg caggtggccg 540
aagggggcgt tactgttgcg actggcatcc gcatccggca gatgtagatg gaaccaaagt 600
ccagaagtta cgcgtcaccc ttgctctaca gccaaacatg caggactcta gtaacccgcg 660
aaatgatggg atagcgttgc aaatccttaa aagagtctta acggtaagaa gaggaaacag 720
ctttatttta taaataaact gaaggctgct aatagctcca gattgtcagt gaggggatac 780
cacttaaaga tgttatacat ttaataaata attttgggag tccactacat gtgaggcgct 840
gcctcagatt taatagaatc atgtgacttt tagtgccata gatgtcgtta gatcatccag 900
tttggtccct taaatttgtg ggtaagggaa aggaacttcc ggtcagtgca agtgacttgg 960
tcaaggttat agagctagtc actgttagat taccagaaca catatctaaa aagttctcat 1020
ataattcttt ttcatttact tccgtgtcac ctttcttaga aagcaaaaat gagttggaca 1080
caataacatt aggatttgtc tttcactaaa taacactgta tatttgaata aacatctgca 1140
ggatttttaa aattagcata tactttgggt attatgtaat tttctgtgat gtatcatatt 1200
tttaattaga aatttttcct ctcatatgga gatgagggtc caggcaaaac tgtattatcc 1260
ttcgtgccct ctattctctt caaaattgca catcttaaaa tacctggaag ctttatgttg 1320
ctcacctata gcattatccg tgttcctcaa tccagttgtg aaccttttcc acattaaaat 1380
gttcttgatc tgtgttctat tctttcaagg ctctgctcta gcactaagat aatgctacag 1440
gactgaagat aatgaaaaag attgaagaaa gcagaaacag aacaaaaatc agattatttc 1500
aaagtttctt tccttgtaaa ggttaaaaca gagcatactt ccttattatg cccactaggt 1560
taactagaat ctcctgtttt tttaaaaaaa actggctcat tttttcaaaa tccactttaa 1620
ttacatggtg cttagcacaa gcaactccat tctggtttga tctgatgggg cctagtgtag 1680
aaggctaggc caaaacaatg gcctgccatt acccacgctt cttcatattt taacatccat 1740
gaatagagga tgaattttta aaaaataaat acagaaaacg atgcatctta aaattgaggg 1800
catgttagat ttgataaaat atggtgtgaa ttatttcagg catgtaacaa gcaaccagat 1860
ttaacagatt ttaatgtttt gtcacatatg taaaatggga aagaaaacta ggcgatcaca 1920
gctttttgac agtgaggctt tatgtcataa gaaagtagaa tgacatattg aggaaactta 1980
agggaaaaat atgtaggcca aagattttac attcagcaaa actaatatac aaaaggtaca 2040
aactgttatc aacaattgat atatcaattt ggtgagacta gtgttttcat gagcccctcc 2100
ttaataatta attggagaaa gtgtctgaca atcagaatta ttacagaaac attgatctaa 2160
ggattgactc ggtttcttta cagcaaatca taatctgttg catttattag cttttgtgtt 2220
tcttgtagtt tattctttat tactaattct cctgagttct gtcacctcat ttctgaggtt 2280
tttctaattc agaatcaagt tcttccatat cttttatcat ttctctaatg tcatttagct 2340
agtttcaaaa taataaattg ttttgtagtg catctttcag gcatgttttt attatctttg 2400
atgatgatgt tatattcctt attctcttca cataataact gcatggattt gaacttgatg 2460
ctttttttgt tgctcttttt tttttttttt tttttttttt tttgagacag agccttgctc 2520
tgttgcccag gttggagtgc agtggcggga tcttggctca ctgcaagttc tgcctcccgg 2580
attcacgcca ttctcctgcc tcagcctccc gagtagctgg aactacaggc acctgccacc 2640
acgcccggct aattttttgt atttttagta gagacggggt ttcaccgtgt tagccaggat 2700
ggtctcgatc tcctgacctc gtgatccacc ccttggcctc ccaaagtgct gggattacag 2760
gcgtgagtta ttgctcattt ttatgtgaaa ttggtgttcc tgaactaata tgagacaggc 2820
ttcttagccc aataagccta agtttatcag gaacaaaact gtattccaag aaagtcaggt 2880
atattagtct gttttcacac tgctataaag aaatacccga gactgggtaa tttataaagg 2940
aaagagattt agttgactca cagttccaca tggctgggga gtcctcagga aacttaaatc 3000
atagcagaag gtgaaggaga agcaagacat atcttacacg gtggcaggag agaagtgaga 3060
tcgtgggaaa actgccactt ttaaaaccat cagatctcat gagaactccc tcattatcac 3120
aagaatagca tgggggaact gcccccataa tctaatcacc tcccaccagg tctctccttg 3180
cacacatggg aattaaaatt tgaagtgaga tttgggtggg gacacagagc agaccatatc 3240
atcaggttta ctggctcatt gcaaggaggg agcccacatt ccagaagaac catggggtac 3300
ctcaccaaca gaggaagaga tagatttatt gtaggaattt ggggaagtat ggagtttaga 3360
aggaattgaa atgaagtagt gctttgatag actcaaaaga aagcaaggct gtttgtaaag 3420
aattctacac tacatctaaa ctattactaa tggcaaaaac tgcaattact tttgcaccaa 3480
cgtaatacaa gatggaccca gggttctgtt ttttggaaat tgcaaagttc tgcctctcag 3540
aagtagaaac tatttctctg tgtcaatgtg actttagata ttctagccaa gagtgagata 3600
tttcaatctt aataatagga tttaaacagc agagtttttg acaatctttt gatattgtca 3660
taaatgttct atgattttag agaaaagggc attgtgtgag taaaaaatca gttactctaa 3720
gggtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtttgaga cattttaaag 3780
catcttccag agagaaatag tattttctgt taatttcaca gctggcttta tttatgcctg 3840
ttatcccata gctgatgaat ggcaaagcag atttttactt tcttattcta tgcttatttg 3900
ctttctcaca ggttttggga aaacttttct aatttcagag aattcccttt tctgttgctt 3960
ttgtgtaatg ttcagcaata ttatggtttt atttcctttt taaattaata catacataat 4020
aagcatatat ttatggggta ttttgatatt tgcgtacaag gtataatgat aaaaccaagg 4080
taattgtgat atccatcacc tcaaacattg tttatttctt tgtgttagga acatttcaca 4140
tcttgccttc tagctatttt gaaatatatg ataaattatt gttaactata gtcaccctct 4200
agtgctatcg aacactagaa attgtttcct ctatctaatt gtatttttgt acccattacg 4260
caaccttttt catcctcctt acccccaacc ttcccagcct ctggtaacca tcattctact 4320
ctctactgcc atgagatcca cttttttagc tctcacttat gagtgagaat atgtgctatt 4380
tgtctttcta tgcctggcat ttcacttaac ataatgacct ccagttccat ctatggtgct 4440
tcaaactaca tgatttcatg tttttgtgta gatgacacat ttttaaaatc cattcatctg 4500
ttgatggaca cttagattga ttccatatct tggctattgt gaatagtact gtaataaaca 4560
tgggcatgca gatacctttt aaatttattg aattccgttt ttggatgtat actcaggaat 4620
gggattgttg gatcatgtgg tagatctatt tttagatttt tgagaaactt ccatactgtt 4680
tttcatagtt tctgtactaa tttacgttcc caccagcaat gcactagtgt tctccttttg 4740
ccacatcctc accagcatct gttattttct gcctttttgg taatagtaat cttaactgag 4800
gtgagatgat gtcttattgt ggttttgatt tgcatttccc tggtgactgg tgatgttgag 4860
cattttttca tatgtctgtt ggccatttat atgtcttctt ttgataaatg cctgtttaga 4920
tcatttgccc attttaaaat tggattattt gggggttttt gctatggagt tgtttgagtt 4980
ccttatatat tctgattatt a 5001
<210> 5
<211> 5001
<212> DNA
<213> 人工序列
<220>
<223> 人工序列描述: 人工合成的序列
<400> 5
taacctctct gttcttttcc gttcttatct ataaataggg gcaaccaacc accagtcctc 60
agaggctctg aaaatctaat ttcaattgtg gttgaaagtg ctctgaaaat ttgaaatgtt 120
acacagatgt atgggattcc tcctgagctg tatttgaaac cacagatatc catctgattt 180
gtaaatcatt taccttttag tctccctagc agaagttaat agtgaatgct tttctttttt 240
ttctttttat tttcttgatt gctaattttg ttaagttcat aagcgatact tacatatgta 300
catgtggagg ctggaatctg ctctggttga tgttgtagtg cgtgaatgcc tgggtggggt 360
ttgagctgta ctcatccacc gttatggtaa ctttgccttg agaaggaatc ccatgtgcca 420
tccttcctcc ctataggcat gagcaattca caactttaca gagcaaaaga tggaagcagg 480
catggtgcgt ttcagccaac ctctgaatcc aaggatctac tcatcaatac cgctgtgcat 540
ttctgaaaga aaaaaaaaat gtatataaaa tgagaacaaa gagaaaaagg gtgttctaag 600
agacataaat ttaacatcta gacatgaaac tagttcaggg aaaatctgaa tatgtgttgt 660
tggctcatgg atacaactgt tcccaactct cttcccttca tgcacttcaa agtggatatt 720
acactctata catattgctg ggtgctagca aatcttctca atggagttca aactaagatt 780
tcctctttaa ttataattat ggcacttagc gtgaattacg gaaggggcat atccaccgtt 840
gccatggcat ctggctatac atggtttgtg ctccaagtga agaatcttcc aaacctgccc 900
tgctaattgg aatgtttggt ctttacaaag ttggtgtcac gtaatcattt gaaagctcca 960
tgtttaaagc agctatataa cacaatgaca gataagaatt taaaatgttg tgcttataac 1020
aaatacatgt gtattactat aacatgcaca taataaccac acattacaca tatttttttc 1080
tttcacaagc agctcccaaa atacacaggt aggcaatgct tggcattcct cactggccca 1140
gaaccttatg gtaaggcaaa tctttcttgt taaatgtagt gtcatttttt tcaacactcc 1200
agtcactcag gggaaaacca aacacctcca ggtctggacc accactttga atgcattcat 1260
tacctccctt cttcaagccc cgatggagcg gtaaagaagg gcggccatta catctgccac 1320
ctcattcttg gtgcaacgta attctcagta attggtttca ttttttaaaa tttccattag 1380
ttctgatttt ttcataaatg tcaatatatt atttgctgca ctgggttgag aaatgaagat 1440
gtctattttt atggtaggtg tgcaaaggct gagggaagca aattctcatg tccaagttgt 1500
tgcaattgat cagtgcggta gagaagaagc cgtagtacac tccttgggta acccttaggt 1560
aacccatgct cttactttaa gtgcacaacg tcagaatagg tttgccatgt gcaccattaa 1620
gctctgagaa tcttatctgc tatttcaaat aaaaatattt agaataataa gatgagattt 1680
aaaattggca tgaaacacct taaatatcga gcaaaaggca gatggcctgc cataggccat 1740
ttattttatt attttacaac ccggggcttg agtaatcccc catatgctag ctgggctaag 1800
aaattccaga gtgttctact caaatcattg ccttcttcat attagcaaag caagctaaat 1860
aacacccacc ttgcctgcct tcctaatgtc aagtgcactg ccaagagatg aatccccgtg 1920
ctctggcatt ttaaacaaag tgtcactttg ggttctcttt ctttttcctg acttcatggg 1980
aggtatgagt cttttaagcg ccagatgata gacaaccagg ccagtaggat taactaaatt 2040
aaaatctttc cctgctcctc tgatgtaaga tatctataag aactgcttac aaatcataat 2100
gtagcagttt tcataccaag tttgcagctg tttccttaat ttctcccaca attatatttt 2160
actgttattt tgcataacag taaaacacaa cacctgcttc aaattgcagt cctgttctaa 2220
gtactgtaat tctcttttga gacacaaagt accgagacac tactgaagcg caaaactgca 2280
taattgcgtc gcgctgaaaa gtaaatacaa atgaaaacat cttcctgtta tagaaatgac 2340
tgtcattaaa aagaatgtta gccatcaaag cacagagggg gaaaaattca cattttcaga 2400
ctgtgagaag ttagtgtttg cataaattag agagtggtgt aaaaattact tgacaattct 2460
tatgttcatt cttccatcaa tgtctattgt gtgaaatact gaacattaag aagcaaagga 2520
aatcaaattc atgtctagac cgctgtgacc tctgagtaac aatctctgca cccagtacta 2580
gaaagatttt aaatgtttct ggagtaaaca cactaattaa accaagcaaa tgtggcctag 2640
aaataaaata tacataccta atatttaaac atctaggtaa tgacttgtag cagttagcat 2700
gatacccacc caagttctac tatttgaagc taagaagaga cagaatttag cagctgatca 2760
atttgcactt ctacatggtc cgcttgatcc taatgtcaac cttctctatc actgaacatc 2820
tatgcctctt tgcacctttg ccccagtaag acaaatagaa catcttttca tcagcaagca 2880
caggcccctg taactctgaa aggctaaatg ggtggctggc acctcatttg aattcatctt 2940
tgccatgttc cctttcaaat gtttcatcga aacagtgcac ctgcagcgtc tatcttcttt 3000
aatctggagt cctttgaaga aaatgtcaga ctgaggcaga gagcttcaaa actttcacag 3060
cacctttaca gacaagtcaa gaaaaggctt attttttaaa atgctatgtt catccccacc 3120
cgtatctcaa aatgaacaca tcttaagaat tttaaacaca aacacctgga aaagactttt 3180
tctttttttt tttttttttt tttttttttt tttggtaaac tctcagagac aagggacaat 3240
agacaaaacc acttcctata acctgagaaa tttggagaga gcttgaaaca agacagaagg 3300
atacactgct tacaactatc aagaagatgt atatttaggc agtaaaacct tccaaatgat 3360
cagattttcg tgcatctcac cctcttcaca cttactttaa ctttttacac acaatattta 3420
aagacagcac tattcttttc ataaattttc attttatact tcaacacact ttccacaaaa 3480
caaaggaacc caggacgaaa tatcaagaag ccgaaagaaa aatctaaaag ggactgacac 3540
tgccaaacat tcatgctggt gctagtttga tttttctctt taaaaagaaa atcatgtgag 3600
tacattttgc atttcctaga cagcaatcac ttctgtcctt taagctgtac aactagcaat 3660
attcttttcc aggaatctag ttggaaaacc ttttaaagtc ggctggcaat gaagggatta 3720
aaagctgagg aattaaataa ctgtctccac ctcctagaca ccagaagtcc aatttaccaa 3780
aactttcaaa gcaacaactc atgacctctc tacccctgca ctgcccagca cagcctatga 3840
gaaaagagcc cgcggttttc tcgtttcaac aaggatgctc attttaatca cttgccccaa 3900
gatctccaga ccgagcctgg cgggactttg gaacttgcct gctccaaatc cgccaaattt 3960
cgctctctcc tccctctgcc gcgcagatcc agtgcgttct taattcacgc ccctactctt 4020
ttatgcccac ttccagttac tcatccctgt atctgggagc gatgcccaca cgccttcccg 4080
gcgggcttct ccgccagggt ttttttgggg gaggctgaca taaagttcca cgtgcttctg 4140
tccaccgagc gccctccctc ccaccgcact tacacctgaa cttgtctcca gcactgcgga 4200
cacccgggtg acacattctt tcggagaggg agggcaagac ttttctccgg agcctctggc 4260
aactcgtgga gtctatataa ggtggggcgg tggggggcgc ggaattctct actttggatt 4320
ggtttgtttg ttttaaatct agggtggtgg gcagttgcgc gaggcggggt ggggggtgct 4380
ttatgaacta cacacacaca cacacacaca cacacacaca cacaccacat acactcgccc 4440
tgcccttcta ggctcacggc tggctcttcc cggctacaac ttccccttcc ttcctgaaac 4500
accagcgcct tactcgctca gtcccccgtt gccacctccg tcacctcctc ggccgccgct 4560
cctgctggca ctgctggcgc tagcgctggc ggccccgggc tccgctggac gcctatcttt 4620
tttctctccc tcttccctag ctctggattg attgatgacc accggcggcc aatggctctg 4680
acaccacgcc atcctcggtc gggcatcaca gccccacgtc cccgacctca gcctcccggg 4740
cgcgttggca tccccgaacc cacagcgctg agcccgagcc cggggccgcc gcctcctccc 4800
tgctctacgc ctgggcgctg ccaggttcct tccctggaac ggcggagaaa ggaagggagg 4860
gagccagcga gcgttggaag ggggtgtgga ggccacggga tctccccctc ttctgacatc 4920
ttttttcact taaacttttg tttgtcccac ccccccgacc tgtttgtgtt tgtttgcagc 4980
atctcaaatc aattatacat t 5001
- 一种用于肺癌早期诊断的外泌体ecDNA生物标志物检测试剂及其用途
- 用于检测肺癌的基因标志物、试剂盒及肺癌检测方法