掌桥专利:专业的专利平台
掌桥专利
首页

用于鉴定基因的等位基因的试剂盒和探针

文献发布时间:2023-06-19 16:09:34



本申请是分案申请,其原申请的申请号为201480072955.6,申请日为2014年12月10日,发明名称为“用于鉴定基因的等位基因的方法和探针”。

技术领域

本发明涉及一种高多态性核酸的基因分型方法。特别是,本公开涉及使用高通量测序技术对高多态性等位基因(例如HLA等位基因)进行基因分型的方法。

背景技术

所谓的下一代测序(NGS)技术加速了遗传研究并使得先前未确诊的遗传缺陷能够得到快速表征,从而产生早期疾病诊断和改善的健康结果。下一代测序技术的关键特征是能够同时对数百万个单个DNA分子序列进行测序。该测序的并行性和速度使得现在可以在短短几天内对完整的人类基因组进行测序。除了通过NGS能够对整个复杂的基因组进行测序外,许多应用还关注NGS的临床潜力及对特定靶区域中的遗传变异的检测。

一种靶向型基因测序方法涉及使用结合靶区域的带标记的探针,然后其可以从基因组DNA中提取出。

使用的探针可以是天然的RNA或DNA,且通常长度为大约100个核苷酸。

捕获探针的使用对于在健康个体中多态性不会很高的遗传区域是有用的。即,健康个体间遗传序列的差异大约<1%。使用高冗余度的重叠探针以确保当探针和靶标DNA之间的序列差异阻止探针与靶标序列复性结合时,在与该基因差异相邻之处会有其它探针使得能够对变异的DNA片段进行提取和测序。

虽然捕获探针的使用已经具有广泛的应用,但其使用并不是通用的,且认为其不适合于高度多态性基因(例如HLA系统的基因)的基因分型。HLA对我们对病原体的免疫应答非常重要。HLA分子位于细胞的表面且向免疫系统提呈片段化的病原体肽。大多数个体具有使物种能够抵御几乎任何病原攻击的独特HLA型。

虽然HLA多态性对我们物种的优势明显,但另一方面移植器官(包括造血干细胞(HSC))上的HLA抗原被受体的免疫系统视为“外来的”,从而导致器官排斥。在HSC移植的情况下,移植的干细胞靶向新的宿主,从而导致移植物抗宿主病(GvHD),其为HSC移植的潜在致命的后果。

因此,要求进行HLA的基因分型以确保HSC供体与患者之间的相容性。有数个HLA基因,其全部位于人类6号染色体的短臂上的被称为主要组织相容性复合体(MHC)的大约4Mb的区域内。这些基因可被分为2组。I类基因包括HLA-A、HLA-B和HLA-C,2类基因包括HLA-DRB1、HLA-DQB1和HLA-DPB1。这些基因正是通常用于移植目的而被分型的基因,但MHC还包含额外的I类HLA基因,其多态性不是很高,并且其功能并非是提呈病原体衍生肽。这种基因包括HLA-E、HLA-F和HLA-G。此外,有很多类似I类和2类的假基因和基因片段。

经典的I类基因在序列上类似。它们全部为大约3,200个碱基对的相对小的基因,以7-8个外显子和小内含子为特征。2类基因具有更大的内含子,且某些为大约20,000个碱基对。

高水平的HLA多态性是通过来自相同和不同基因座的等位基因的序列基序的“共享”产生。独特的多态性和SNP是相对较少的。换句话说,新鉴定的等位基因会包含基序的独特组合,这些基序见于相同基因座的其它等位基因中或来自其他相关基因座的等位基因。基序共享是多态性快速进化的有效机制并且当遭遇病原体时良好地服务物种。等位基因和基因座之间共享的基序的大小是变化的。在一些情况下,所述基序可能小于20bp,但另一些等位基因可包含整个基因的一半。高水平多态性的结果是在一些情况下不可能鉴别HLA匹配的HSC供体。

用于HLA的NGS与基于传统Sanger的测序技术相比提供了显著益处。传统HLA测序技术要求对通过聚合酶链式反应扩增的DNA进行测序。扩增的DNA作为多个序列分子被测序,其中不能确定相邻核苷酸是来自相同还是不同(母本或父本)的染色体。这种无法进行相位定序的能力缺乏常常导致不准确的分型,且要求随后的实验来解析不明确的类型。

NGS产生单分子序列数据,使用可用序列分析软件(例如Assign MPS)编译的相位信息来完成,以潜在地产生明确的HLA类型。然而,当对PCR产物进行测序时,PCR所包含的错误和嵌合分子也被测序,造成序列分析困难。

然而,传统的基于外显子的探针捕获技术可能是不可靠的,因为HLA类型主要是通过基序重排产生,且一个等位基因与下一个的序列差异程度可以是巨大的。

因此,仍需要能够对高多态性基因(例如HLA基因)进行高通量测序的方法。

发明内容

本发明的发明人描述了一种捕获探针方法,其适合于通过使捕获探针靶向到非编码序列上来鉴定高多态性基因中的等位基因。通常分型的HLA I类和II类分子的非编码区与多态性外显子相比多态性较低,而且除了因正常变异产生过程而出现的随机SNP之外,在不同HLA类型中的可能的替代序列的数量似乎是相对有限的。因此,可以在单区域设计出能够捕获全部等位基因(包括可能在未来描述的那些)的少量探针。所述捕获探针将会捕获包括多态性外显子的DNA片段,且对捕获的DNA片段的测序将会产生多态性片段的序列,这使得能够推导出HLA类型。

因此,一方面,本发明提供一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:

a)使来自受试对象的核酸样品接触寡核苷酸探针,其中,所述寡核苷酸探针与所述核酸样品中的基因靶序列杂交;

b)通过将杂交到寡核苷酸探针的核酸与未结合寡核苷酸探针的核酸分离,富集杂交到寡核苷酸探针的核酸;及

c)对核酸进行测序以鉴定基因的一种或多种等位基因;

其中,所述基因靶序列在所述基因的非编码区域内。

本发明的方法对于鉴定高多态性基因中的等位基因是特别有用的。因此,在一个实施方式中,所述基因是高多态性基因。在一个特定实施方式中,所述基因是HLA基因。

技术人员将会理解在制备用于测序的被捕获的核酸时,扩增被捕获的核酸可能是期望的。因此,在一个实施方式中,所述方法包括:扩增结合到寡核苷酸探针的核酸。

在一个实施方式中,所述方法包括对HLA基因外显子进行测序。

在另一个实施方式中,所述方法包括对整个HLA基因进行测序。

为了促进所感兴趣的核酸的富集,在一个实施方式中,寡核苷酸探针包含捕获标签。

在一个实施方式中,捕获标签为杂交标签。

在另一个实施方式中,捕获标签为生物素或抗生蛋白链菌素。

在另一个实施方式中,所述方法包括用结合试剂接触所述捕获标签。

在一个实施方式中,所述结合试剂为生物素或抗生蛋白链菌素。

在另一个实施方式中,所述结合试剂与基体偶联。在一个特殊的实施方式中,所述结合试剂与诸如磁珠等磁性基体偶联。

在一个实施方式中,与寡核苷酸探针接触的核酸样品包含单链核酸。

在另一个实施方式中,所述核酸样品在与寡核苷酸探针接触之前被片段化。

在一个实施方式中,所述方法包括使寡核苷酸探针接触平均长度大于约100bp的核酸片段。

在另一个实施方式中,所述方法包括使寡核苷酸探针接触平均长度大于约2kb的核酸片段。

作为另一选择,所述核酸样品在与寡核苷酸探针接触之后被片段化。

所述寡核苷酸探针靶向基因的非编码区,例如内含子和基因间隔区。在一个实施方式中,诸如HLA基因等基因的非编码区为内含子。

在另一个实施方式中,所述方法进一步包括检测非HLA基因的一种或多种等位基因。

在另一个实施方式中,所述测序为高通量测序。

在一个实施方式中,所述高通量测序为下一代测序技术。

第二方面,本发明提供一种鉴定受试对象中的基因的等位基因的方法,所述方法包括:

a)从受试对象中获得核酸样品;

b)片段化所述核酸样品以获得长度为至少约2kb的核酸片段;

c)使单链核酸与包含捕获标签的寡核苷酸探针接触,其中,所述寡核苷酸探针与所述核酸样品中的HLA靶序列杂交;

d)通过使结合试剂接触捕获标签,富集杂交到寡核苷酸探针的核酸;及

e)对核酸进行测序以鉴定一种或多种等位基因;

其中,所述HLA靶序列在所述基因的非编码区内。

虽然本发明方法中使用的核酸可来自预先获得的样品,但在一个实施方式中,所述方法包括从获自受试对象的生物样品中分离出核酸。

在一个实施方式中,所述核酸样品在与寡核苷酸探针接触之前被片段化。

在另一个实施方式中,所述核酸样品在与寡核苷酸探针接触之后被片段化。

在另一个实施方式中,所述基因的等位基因是HLA基因的等位基因。

在第一或第二方面的一个实施方式中,一种或多种寡核苷酸探针包含与SEQ IDNo:1至8或10至71中的任意一个具有至少95%同一性的核酸序列。

在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。

在一个特殊的实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个相同的核酸序列。

第三方面,本发明提供一种为需要移植的受体鉴定移植供体的方法,所述方法包括:

a)进行本发明的方法以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及

b)基于同时在移植供体和移植受体的HLA基因中一种或多种等位基因的存在,鉴定移植供体。

本发明进一步提供降低移植受体发展移植物抗宿主病的可能性的方法,所述方法包括:

a)进行本发明的方法以在需要移植的受体中鉴定一种或多种HLA基因等位基因;及

b)基于同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在,鉴定移植供体;

其中,同时在移植供体和移植受体中一种或多种HLA基因等位基因的存在表明所述移植受体在从所述移植供体移植了移植物后发展移植物抗宿主病的可能性降低。

在一个实施方式中,所述方法包括在所述移植供体中鉴定一种或多种HLA基因等位基因。

第四方面,本发明提供一种将同种异基因移植物移植到受体中的方法,所述方法包括:

a)进行本发明的方法;及

b)从所述移植供体中移出供体移植物;及

c)将所述移植物移植到受体中。

第五方面,本发明提供一种用于鉴定受试对象中的基因的等位基因的试剂盒,所述试剂盒包含与所述基因的非编码区中的基因靶序列杂交的寡核苷酸探针。

在一个实施方式中,所述基因是高多态性基因。

在一个特定实施方式中,所述基因是HLA基因。

在另一个实施方式中,HLA基因的非编码区为内含子。

在一个实施方式中,所述寡核苷酸探针包含捕获标签。

在一个实施方式中,所述捕获标签为生物素或抗生蛋白链菌素。

在另一个实施方式中,所述试剂盒包含结合试剂。

在一个特定实施方式中,所述结合试剂为生物素或抗生蛋白链菌素。

在另一个实施方式中,所述结合试剂与基体偶联。在一个特定实施方式中,所述基体为磁性基体。在一个特定实施方式中,所述基体为磁珠。

在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。

在另一个实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个具有至少98%同一性的核酸序列。

在一个特定实施方式中,一种或多种寡核苷酸探针包含与SEQ ID No:1至8或10至71中的任意一个相同的核酸。

可明显看出本发明一个方面的优选特征或特点可应用于本发明的许多其它方面。

整个说明书中的词语“包括”或其变化形式应被理解为意味着包含所描述的要素、整体或步骤、或要素、整体或步骤的组,但不排除任何其它要素、整体或步骤或要素、整体或步骤的组。

下文通过下面的非限制性实施例并参考附图对本发明进行描述。

附图说明

图1.HLA-A内含子1的序列比对,表明了不同的HLA等位基因具有相同的可预测的HLA序列。HLA等位基因的命名使用了至多4个用冒号分开的字段(例如A*01:01:01:01)。第一字段表示可通过抗体检测到的一般氨基酸序列差异。第二字段表示导致氨基酸变化但可能用抗体无法检测到的核苷酸差异。第三字段表示同义变化,第四字段表示非编码区中的变化。字母代码后缀(例如A*01:01:01:02N中的N)的使用表明该等位基因是表达变异基因。例如,N=零或不表达。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。

图2.对低多态性非编码区使用捕获探针以对多态性编码区进行捕获和测序。

图3.HLA-A基因结构,显示了在原理实验的证据中外显子和捕获探针的位置。

图4.对使用靶向型捕获测序方案产生的序列数据的分析(颜色未显示)。

1:显示了在白色至红色渐变色调区之上的HLA基因结构,其总结了跨基因的序列深度。白色区域表明序列读出深度<50,而且距离红色色调越近,序列读出深度越小。黑块表明没有序列文件跨越此区。

2:其显示了样品名称(样品01)和被分析的基因座(HLA-A=gA)

3:该区总结了数据。每个灰色垂直条表示在此位置处序列的量。此比例尺显示的最大覆盖度为100。彩块的水平线为共有序列,其中红色=T,黑色=G,蓝色=C且绿色=A。下方的彩块表示在此位置处看到的其它序列,并且它们位于垂直灰色条上的地点表明以此位置上的该碱基读出的百分比。这些序列通常表示碱基识别(call)错误,但能够表明杂合序列。黑色水平线表明碱基识别结果的百分比,所以在第一水平线上的蓝色块表明在此位点上1%的碱基识别结果为C。比例尺是对数的,因此第二水平线表明10%的读出结果。

4:软件界面内的该区表明在共有序列和HLA-A文库之间的最佳匹配的基因型。前2列表明基因型。第3列表明与HLA-A编码序列错配的序列数量。下一列表明与HLA-A非编码序列错配的数量,第5列和第6列表明在序列数据的相位确定时的序列错配。正确的基因型在第3至6列会具有0个错配。在此情况下,最佳匹配的基因型是具有HLA-A*02:01:01:01+A*02:01:01:01。

图5.在3个样品的捕获探针富集后的下一代测序结果,也进行了Sanger测序。

SEQ ID NO:1至8–寡核苷酸捕获探针

SEQ ID NO:9–HLA A内含子1

SEQ ID NO:10至71–HLA捕获探针序列

具体实施方式

除非另外特别限定,本文使用的所有技术与科学术语应该认为与本领域(例如,在分子遗传学、生物化学和免疫学领域)普通技术人员通常理解的具有相同含义。

除非另外指出,本发明使用的分子遗传学、生物化学和免疫学技术为本领域技术人员熟知的标准程序。这些技术在以下来源的文献中有所描述和解释:例如J,Perbal,APractical Guide to Molecular Cloning,John Wiley和Sons(1984),J.Sambrook和Russell.,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring HarbourLaboratory Press(2001),R.Scopes,Protein Purification-Principals and Practice,第三版,Springer(1994),T.A.Brown(编),Essential Molecular Biology:A PracticalApproach,第1和2卷,IRL Press(1991),D.M.Glover和B.D.Hames(编),DNA Cloning:APractical Approach,第1-4卷,IRL Press(1995和1996),及F.M.Ausubel等(编),CurrentProtocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience(1988,包括直至目前的所有更新),Ed Harlow和David Lane(编)Antibodies:ALaboratory Manual,Cold Spring Harbour Laboratory,(1988),及J.E.Coligan等(编)Current Protocols in Immunology,John Wiley&Sons(包括直至目前的所有更新)。

术语“核酸”或“核酸序列”或“核酸分子”指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸及它们的聚合物。术语核酸与基因、互补DNA(cDNA)、信使RNA(mRNA)、寡核苷酸及多核苷酸可互换使用。

“分离的核酸分子”指总体已从其在天然状态下(如果其以任何形式存在于自然中)所结合或连接的核苷酸序列中分离出的核酸分子。优选地,所述分离的核酸至少60%脱离、更优选至少75%脱离、更优选至少90%脱离其通常所结合的其它组分。核酸可以使用任何适合的已知技术从生物样品中分离。例如,总基因组DNA可以使用本领域已知的方法和/或商业可得的试剂盒来从细胞中提取,例如,通过使用QIAGEN提供的QIAamp DNA血液Mini试剂盒或DNeasy Blood&Tissue试剂盒,或通过使用诸如酚/氯仿提取和乙醇沉淀等方法。

除非另有说明,本文使用的术语“约”指指定值的+/-20%,更优选+/-10%,或更优选+/-5%。

本发明的发明人目前开发出了一种鉴定基因的等位基因的方法,其特别适合于靶向捕获和高通量测序技术。本发明的方法包括用寡核苷酸探针接触来自受试对象的核酸样品,以从所述DNA样品中分离出感兴趣的基因组区域。由于靶向捕获的现有技术方法依赖于捕获感兴趣的基因的编码区的寡核苷酸,这些方法不适合对高多态性基因的基因分型,因为设计出能够鉴定所有目前描述的等位基因并鉴定新等位基因的基于外显子的捕获探针是困难的。与此相反,本发明使用与位于非编码区的基因靶序列杂交的寡核苷酸捕获探针,因此能够进行高多态性基因等位基因的高通量测序。

图1显示了HLA-A内含子1的序列比对,其表明不同的HLA等位基因具有相同的和可预见的HLA内含子序列。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。

图2提供了显示与所述捕获探针互补的序列的捕获DNA片段的位置及其相对于多态性外显子的相对位置的图。图3显示了如何设计捕获探针和设定捕获探针的位置以捕获用于测序的多态性外显子。

此处使用的术语“非编码序列”或“非编码区”指不属于包含所要鉴定的等位基因的基因的蛋白编码序列的核酸序列。因此,此术语包括内含子、5′和3′非翻译区、启动子、转录调控元件和/或基因间DNA。因此,所述非编码区可以在感兴趣的基因内部,或在感兴趣的基因外部,例如,在基因间区域。在一个实施方式中,所述寡核苷酸探针与感兴趣的基因的内含子内的基因靶序列杂交。

核酸的制备

本发明的方法可以对已使用本领域已知的任何适合的技术从受试对象获得的核酸样品进行。作为另一选择,在一个实施方式中,所述方法包括从获自受试对象的生物样品中获得核酸样品。此处使用的“生物样品”可以是例如淋巴细胞、全血、颊粘膜拭子、活检样本或冷冻组织或包含基因组DNA的任何其它样品。尽管对于分子基因分型而言可以使用几乎任何组织来源,但最常使用的是例如来自外周血的淋巴细胞。也可以使用通过非侵入性方法获得的样品,例如通过基于脸颊拭子或唾液的DNA收集。从这些来源提取DNA的多种适合的方法是本领域已知的。这些方法的范围从有机溶剂提取到二氧化硅包覆的珠及阳离子交换柱的吸附。DNA自动提取系统也是商业可得的且可提供高品质、高纯度的DNA。

本发明方法中使用的核酸可以是单链和/或双链基因组DNA。在某些实施方式中,核酸可包括长度为至少约1kb、至少约2kb、至少约5kb、至少约10kb或至少约20kb或更长的长核酸。长核酸可以用本领域众所周知的多种方法从来源制备。保持核酸分子完整性(即断裂和剪切最小化)的获得生物样品及随后从所述样品中分离核酸的方法是优选的。示例性方法包括但不限于:不进行进一步纯化的裂解方法(例如,使用去垢剂、有机溶剂、碱和/或蛋白酶的化学或酶裂解方法),进行或不进行进一步核酸纯化的核酸分离,使用沉淀步骤的分离方法,使用固体基质的核酸分离方法(例如硅类膜、珠或结合核酸分子的修饰表面),凝胶状基质(例如,琼脂糖)或粘性溶液,及用密度梯度富集核酸分子的方法。

在一个实施方式中,为了获得所需的平均片段大小,将本发明方法中使用的核酸片段化。技术人员会理解,核酸片段的所需长度将依赖于所使用的测序技术。例如,离子激流(Ion Torrent)和MisSeq平台使用长度大约为100bp–200bp的片段,而PacificBiosciences NGS平台可以使用长度至多为20kb的片段。核酸可以通过物理剪切、超声处理、限制性酶切或本领域已知的其它适合的技术来片段化。可以进行核酸片段化,以产生具有所需平均长度的核酸片段。核酸片段的长度或平均长度例如可以为至少约100bp、至少约200bp、至少约300bp、至少约400bp、至少约500bp、至少约600bp、至少约700bp、至少约800bp、至少约900bp、至少约1kb、至少约2kb、至少约3kb、至少约4kb、至少约5kb、至少约6kb、至少约7kb、至少约8kb、至少约9kb、至少约10kb、至少约11kb、至少约12kb、至少约15kb或至少约20kb。

在一个实施方式中,在用寡核苷酸探针接触样品前,为了产生单链核酸或产生包含单链区域的核酸而处理核酸样品。可以使用本领域已知的技术产生单链核酸,例如,包括已知的杂交技术和诸如ReadyAmp

寡核苷酸探针

本发明的术语“探针”或“寡核苷酸探针”指被设计为与感兴趣的核酸特异性地杂交的寡核苷酸。优选地,探针适合用于制备使用靶标捕获技术的高通量(下一代)测序所用的核酸。因此,在一个实施方式中,探针可适合于靶标捕获,并且长度为约60-120个核苷酸。作为另一选择,探针可以为约10-25个核苷酸。在某些实施方式中,探针长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个核苷酸。用于本发明的核苷酸可以是核糖核苷酸、脱氧核糖核苷酸及修饰的核苷酸(例如肌苷)或包含基本不改变其杂交特性的经修饰的基团的核苷酸。

作为另一选择,所述寡核苷酸探针可包含核苷酸类似物。术语“核苷酸类似物”指具有经修饰的核苷酸碱基部分、经修饰的戊糖部分和/或经修饰的磷酸酯部分的合成类似物,并且在多核苷酸的情况下,还具有经修饰的核苷酸间连接,如在别处概述的(例如,Scheit,Nucleotide Analogs,John Wiley,New York,(1980);Agarwal,Protocols forPolynucleotides and Analogs,Humana Press,(1994))。通常,修饰的磷酸酯部分包括磷酸酯类似物,其中磷原子在+5氧化态,且一个或多个氧原子被非氧部分替换,例如,硫。示例性磷酸酯类似物包括但不限于硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯(phosphoroanilothioate)、苯胺磷酸酯(phosphoranilidate)、氨基磷酸酯、硼磷酸酯(boronophosphate),包括相关的平衡离子,如H

杂交

本文使用的术语“杂交”指寡核苷酸探针与靶核酸非共价结合以形成稳定的双链多核苷酸的过程。杂交条件通常包括低于约1M的盐浓度,更通常的为低于约500mM且可能为低于约200mM的盐浓度。杂交缓冲液包括诸如5%SSPE等缓冲盐溶液,或本领域已知的其它这种缓冲液。杂交温度可以是低至5℃,但其通常高于22℃,更通常的为高于约30℃,且通常超过37℃。通常在严格的条件下进行杂交,即在探针会杂交到与其互补的靶序列但不会杂交到其它非互补序列的条件下。

本文使用的术语“互补”及其语法等价形式指一条核酸与另一条核酸(包括修饰的核酸和核酸类似物)的核苷酸碱基配对相互作用,其导致双螺旋、三螺旋或其它更高级的有序结构的形成。主要的相互作用通常因Watson-Crick和Hoogsteen型氢键结合而是核苷酸碱基特异性的,例如A:T、A:U和G:C。使寡核苷酸探针与靶核酸的互补或基本互补区复性结合的条件是本领域众所周知的。

如本领域中所理解的,严格杂交条件是序列依赖性的,且在不同的场合下是有区别的。例如,对于特异性杂交,更长的片段可能比短片段要求更高的杂交温度。因为其他因素可能影响杂交的严格性(其包括碱基组成和互补链的长度,有机溶剂的存在,及碱基错配的程度),参数的组合比单独任意一个参数的绝对测量值更重要。一般来说,对于在限定的离子强度和pH下的特定序列,将严格条件选择为低于T

捕获标签和结合试剂

在一个实施方式中,本发明方法中使用的寡核苷酸探针包含捕获标签,从而便于从样品中的其他核酸序列中富集出结合到寡核苷酸探针上的所感兴趣的核酸。为了从其它核酸序列中富集出感兴趣的核酸,将捕获标签结合到适合的结合试剂上。如本领域所理解的,短语“核酸的富集”指相对于未结合到寡核苷酸探针的核酸在样品中增加靶核酸序列的量。因此,增加了样品中靶序列相对于相应的非靶核酸的比率。

在一个实施方式中,捕获标签为“杂交标签”。本文使用的术语“杂交标签”及其语法等价形式可以指包含与作为结合试剂(即,“结合标签”)的另一核酸序列的至少一部分互补的序列的核酸。杂交标签和相应的结合标签序列之间的互补程度可根据应用而变化。在某些实施方式中,杂交标签可以与结合标签或其部分互补或基本互补。例如,杂交标签可包含具有与相应的结合标签至少约50%、至少约60%、至少约70%、至少约80%、至少约90%及至少约99%互补的序列。在某些实施方式中,杂交标签可包含与相应的结合标签100%互补的序列。

在某些实施方式中,捕获探针可包括多个杂交标签,其相应的结合标签位于相同的核酸或不同的核酸中。在某些实施方式中,包含RNA的杂交标签可能对有效移除过量水平的该标签是有利的。

在某些实施方式中,杂交标签可包含至少约5个核苷酸、至少约10个核苷酸、至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸、至少约35个核苷酸、至少约40个核苷酸、至少约45个核苷酸、至少约50个核苷酸、至少约55个核苷酸、至少约60个核苷酸、至少约65个核苷酸、至少约70个核苷酸、至少约75个核苷酸、至少约80个核苷酸、至少约85个核苷酸、至少约90个核苷酸、至少约95个核苷酸和至少约100个核苷酸。

在另一个实施方式中,所述捕获标签可包含“亲和标签”。本文使用的术语“亲和标签”及其语法等价形式可指多组分复合体的组分,其中所述多组分复合体的各组分彼此特异性相互作用或相互结合。例如,亲和标签可包括可结合抗生蛋白链菌素的生物素。多组分亲和标签复合物的其他实例包括:配体及其受体,例如抗生物素蛋白-生物素,抗生蛋白链菌素-生物素,生物素的衍生物,抗生蛋白链菌素,或抗生物素蛋白,其包括但不限于2-亚氨基生物素、脱硫生物素、NeutrAvidin(分子探针,Eugene,Oreg.)、CaptAvidin(分子探针)等;结合蛋白/肽,包括麦芽糖-麦芽糖结合蛋白(MBP)、钙-钙结合蛋白/肽(CBP));抗原-抗体,包括表位标签(包括c-MYC、HA和FLAG Tag

因此,本发明的方法中使用的结合试剂能够结合本文描述的亲和标签以便于从样品中的其它核酸序列中分离出感兴趣的核酸。例如,在一个实施方式中,亲和标签包含生物素且结合试剂包含抗生蛋白链菌素。结合试剂通常在基体上。基体的实例包括珠、微球、平面表面、柱、孔等。术语“微球”或“珠”或“颗粒”或其语法等价形式是本领域所了解的,并指小的离散颗粒。基体的组成会根据应用而变化。适合的组成包括用于肽、核酸和有机部分合成的那些,其包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、顺磁材料、氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖(如琼脂糖)、纤维素、尼龙、交联胶束和特氟龙,其全部可以使用,来自Fishers Ind.的Bangs实验室的“微球检测指南”是有用的指南。珠不是必须为球形;可以使用不规则的颗粒。在某些实施方式中,基体可包含金属组成,例如含铁的,也可能包含磁性。使用磁珠的示例性实施方式包括包含抗生蛋白链菌素包覆的磁珠的捕获探针。此外,珠可以为多孔的,从而增加可用于与捕获探针相连的珠的表面积。珠的大小在纳米(即100nm)至毫米(即1mm)范围内,珠为约0.2μm至约200μm,或为0.5μm至约5μm,但在某些实施方式中可以使用更小的珠。

高通量测序

本发明的方法特别适合于制备使用高通量测序技术(例如下一代测序技术)进行测序所用的核酸。下一代测序(NGS)技术包括能够在每次仪器运行中对超过10

因此,本文使用的术语“下一代测序”或“NGS”或“NG测序”指以高通量模式确定个体核酸分子(例如,在单个分子测序中)或克隆扩增的个体核酸分子的代替物(例如,同时测序多于10

用于下一代测序的平台包括但不限于Roche/454基因组测序仪(GS)FLX系统、Illumina/Solexa基因组分析仪(GA)、Life/APG的支持寡核苷酸连接检测(SOLiD)系统、Polonator的G.007系统、Helicos BioSciences的HeliScope基因测序系统及PacificBiosciences的PacBio RS系统。

本发明的方法特别适合于鉴定高多态性基因中的等位基因。本文使用的术语“高多态性基因”包括指在基因的编码区中具有比非编码区中更高水平的多态性的基因。例如,与基因的非编码序列的每kb的多态性的数量相比,高多态性基因的编码序列的每kb可具有更多数量的多态性。高多态性基因的众所周知的实例为人白细胞抗原(HLA)基因。

因此,本发明的方法适合于HLA基因等位基因的鉴定和HLA分型。HLA分子的编码区是高多态性的,因为认为其处在进化的正向选择压力下以响应于病原威胁。HLA的非编码区不在此选择压力下,且不共享相同程度的多态性。虽然I类HLA的非编码区是多态性的,但该多态性在这些区域上不是随机分布的,而且是紧密相关的,通过编码序列相似性而具有相同的非编码序列。

I类HLA的非编码区的序列比对分析揭示出了有限的一组独特序列。本发明的发明人确定了可以对该组独特序列中的每一个都设计出探针以捕获DNA片段,而后可用于下一代测序测定。

因此,代替使用来自外显子组的重叠探针(即在外显子区设计的探针)的方法,本发明的发明人描述了明确针对HLA的非编码区而设计的探针的应用。图1显示了HLA-A内含子1的序列比对,其示出了具有相同的可预测的HLA序列的不同HLA等位基因。HLA等位基因的命名使用了至多4个用冒号分开的字段(例如A*01:01:01:01)。第一字段表示可通过抗体检测到的一般氨基酸序列差异。第二字段表示导致氨基酸变化但可能用抗体无法检测到的核苷酸差异。第三字段表示同义变化,第四字段表示非编码区中的变化。字母代码后缀(例如A*01:01:01:02N中的N)的使用表明该等位基因是表达变异基因。例如N=零或不表达。可以看出,除了与A*30等位基因共享核苷酸的2个(A*01:02和A*01:20)外,所有的A*01等位基因具有相同的序列,并且A*03和A*11等位基因也与大多数A*01等位基因相同。由于探针会平等地捕获具有单碱基对错配的DNA,单探针应该捕获所有的A*01、A03、A*11和A*30等位基因。

在一个实施方式中,本发明的方法包括在HLA-A、HLA-B、HLA-C、HLA-DPA1、HLA-DPB1、HLA-DQA1、HLA-DQB1、HLA-DRA和/或HLA-DRB1基因中的一个或多个中鉴定等位基因。

在某些实施方式中,本发明的方法可用于通过同时在移植供体和受体中匹配基因的等位基因(例如HLA基因的等位基因)来确定移植受体的合适供体和/或确定患者发展移植物抗宿主病(GVHD)或急性GVHD(aGVHD)的可能性。

另外,确定移植候选者发展aGVHD的可能性可影响确定是否移植确实是治疗他们的病情最适合的形式。在某些情况下,可能有替代形式的治疗,其提供给患者更好的预后。同时,aGVHD可能性的预测将指示治疗方案的必要性,或者指示可能比推荐方案更具侵袭性(aggressive)的治疗方案。这种侵袭性疗法通常具有不期望的副作用,因此优选不使用,除非预后表明需要。例如,用中和性抗TNF-α单克隆抗体治疗患者可导致aGVHD的改善,但是可增加感染风险。也可使用多种侵袭性抗炎疗法。

本文使用的术语“移植”指将获自一个个体(供体)的组织或细胞移植或引入到另一个个体(受体)的身体中或身体上。从供体移除并移植到受体中的细胞或组织称为“移植物(graft)”。通常移植的组织的实例为骨髓、造血干细胞、器官(例如肝脏、心脏、皮肤、膀胱、肺、肾、角膜、胰腺、胰岛、脑组织、骨和肠)。

本领域技术人员将会理解,术语“单倍型”指在染色体上位置靠近或位于相邻基因座的一起遗传的等位基因的组合,或是在染色体对的单个染色体上的统计学相关联的一组单核苷酸多态性。

本发明进一步提供用于根据本发明的方法鉴定基因的等位基因的试剂盒。所述试剂盒包含寡核苷酸探针,其能够与感兴趣的基因的非编码区中的基因靶序列杂交。在一个实施方式中,所述寡核苷酸探针包含捕获标签,例如生物素或抗生蛋白链菌素。所述试剂盒可进一步包含能够结合捕获标签的结合试剂。所述结合试剂可以被涂覆在或连接到适合的基体上,所述基体为例如微球或珠。在某些实施方式中,所述基体可以是磁性的以便于富集所感兴趣的靶核酸。

实施例1.DNA文库的制备

使用Illumina TruSeq DNA Nano操作规程,从200ng基因组DNA中制备Illumina文库,以选择大小为550bp的靶标插入序列。

实施例2.使用内含子特异性探针捕获HLA

作为概念验证,将靶向内含子序列的定制寡核苷酸探针池(SEQ ID NO:1至8)稀释到1.5pmol/μl的浓度。对于第一杂交过程,将人Cot DNA、扩增的文库(如上制备)、通用阻断寡TS-p7(6nt)及通用阻断寡TS-p7(8nt)添加至管中,并在设为60℃的真空浓缩器中干燥大约1小时。然后在Nimblegen 2X杂交缓冲液、Nimblegen杂交组分A和无核酶水中重悬干燥的样品。然后涡旋所述重悬样品并在95℃变性10分钟。变性后,添加2μl探针(3pmol)至样品中并且在72℃温育4小时。

为了清洗和回收探针杂交的DNA,根据制造商的操作规程稀释来自Nimblegen清洗试剂盒的清洗溶液。将杂交的样品与抗生蛋白链菌素珠合并,涡旋混合,并在72℃温育45分钟。温育后,在72℃用洗液I和严格洗液清洗结合的DNA,随后在室温下使用洗液II和III清洗。然后将结合到抗生蛋白链菌素珠上的杂交样品放置到磁铁上,并使用0.125N NaOH洗脱结合的DNA。然后使用Ampure XP珠纯化杂交的样品,而后用KAPA HiFi HotStart ReadyMix进行12个循环的扩增。PCR中使用的引物与连接的DNA中的Illumina接头序列和条码序列(Illumina P5和P7)互补。使用Ampure XP珠纯化样品。

实施例3.杂交的DNA的测序

经扩增的杂交样品使用Illumina 2x300bp测序操作规程在MiSeq或HiSeq上进行测序。

实施例4.结果

所产生的序列数据使用Assign MPS v1.0序列分析软件进行分析(ConexioGenomics,Fremantle,澳大利亚)。对使用靶标捕获测序操作规程产生的序列数据的分析显示在图4中。使用Assign MPS v 1.0软件,确定样品的最佳匹配基因型为HLA-A*02:01:01:01+A*02:01:01:01。

实施例5.在3个样品的捕获探针富集后的下一代测序结果,还进行了Sanger测序

Sanger测定扩增了扩增子中的HLA-A、HLA-B和HLA-C序列,对于HLA-A和HLA-B其跨度为5′非翻译区至内含子4的末端,对于HLA-C其跨度为5′非翻译区至至3′非翻译区。使用等位基因特异性测序引物,解决了所有的杂合性歧义。

使用图3描述的作为SEQ ID NO:10至71提供的探针并使用上文描述的操作规程来进行捕获探针测定。对于所述3个样品,与报告的基因型完全一致。测定结果显示在图5中。

样品1的HLA-B包含一种等位基因,其参考序列未被报道过。与B*15:01:01:01的序列比较,此等位基因在位于内含子1的碱基444处具有单个错配。通过使用Sanger进行基因座特异性扩增,此样品要求使用B*08:01:01和B*15:01:01等位基因特异性测序引物的额外实验来确定该新等位基因为B*15:01:01:01等位基因的未描述过的B*08:01:01等位基因。NGS能够对整个基因的多态性进行相位确定,并能够迅速鉴定该新等位基因为B*15:01:01亚型。此样品也包含新的C*04:01:01等位基因。此多态性位于内含子5中。使用等位基因特异性测序引物在此区域是不常用的,且通过Sanger测序进行表征会要求通过PCR分离等位基因,而后进行Sanger测序。然而,NGS正确地鉴定了该新等位基因为C*04:01:01亚型。

此数据表明使用捕获探针能够鉴定新等位基因,也表明NGS能够确定序列多态性的相位关系,因此能够对新等位基因进行精确表征。

本领域技术人员会知晓,在不脱离广泛描述的本发明的范围的情况下,可以对具体实施方式中所显示的发明进行多种修改和/或变化。因此,本发明的实施方式仅是说明性的且非限制性的。

本文讨论和/或参考的所有出版物都以其整体并入本文。

本申请要求AU 2013904801的优先权,将其全部内容作为参考并入本文。

对本说明书中所包括的文件、法案、材料、设备、物品等的任意讨论仅是为了为本发明提供语境。不应认为这是承认它们中的任何一个或全部因存在于本申请每个权利要求的优先权日之前而构成部分现有技术基础或本发明相关领域的公知常识。

Metzker(2010)Nat Rev Genet,11(1):31-46。

<110> 康内西奥基因组学私人有限公司

<120> 用于鉴定基因的等位基因的试剂盒和探针

<130> P95258.PCT

<150> AU 2013904801

<151> 2013-12-10

<160> 71

<170> PatentIn version 3.5

<210> 1

<211> 74

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I1.1 (01 = 等位基因组; I1 =

内含子序号1; .1 = probe one for intron)

<400> 1

cgcctctgcg gggagaagca aggggccctc ctggcggggg cgcaggaccg ggggagccgc 60

gccgggagga gggt 74

<210> 2

<211> 74

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I2.1 (01 = 等位基因组; I2 =

内含子序号2; .1 = probe one for intron)

<400> 2

cacagtctcc gggtccgaga tccaccccga agccgcggga ctccgagacc cttgtcccgg 60

gagaggccca ggcg 74

<210> 3

<211> 87

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I3.1 (01 = 等位基因组; I3 =

内含子序号3; .1 = 内含子用探针1)

<400> 3

gtaccagggg ccacggggcg cctccctgat cgcctataga tctcccgggc tggcctccca 60

caaggagggg agacaattgg gaccaac 87

<210> 4

<211> 82

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I3.2 (01 = 等位基因组; I3 =

内含子序号3; .2 =内含子用探针2)

<400> 4

tatcaccctc cctctggtcc tgagggagag gaatcctcct gggtttccag atcctgtacc 60

agagagtgac tctgaggttc cg 82

<210> 5

<211> 80

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I3.3 (01 = 等位基因组; I3 =

内含子序号3; .3 =内含子用探针3)

<400> 5

acacaattaa gggataaaat ctctgaagga gtgacgggaa gacgatccct cgaatactga 60

tgagtggttc cctttgacac 80

<210> 6

<211> 86

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I3.4 (01 = 等位基因组; I3 =

内含子序号3; .4 =内含子用探针4)

<400> 6

ttgggcccgt gacttttcct ctcaggcctt gttctctgct tcacactcaa tgtgtgtggg 60

ggtctgagtc cagcacttct gagtct 86

<210> 7

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> Oligonculeotide capture probe 01-I4.1 (01 = 等位基因组; I4 =

内含子序号4; .1 =内含子用探针1)

<400> 7

atgggggtgt catgtctctt agggaaagca ggagcctctc tggagacctt tagcagggtc 60

agggcccctc accttcccct cttttcccag 90

<210> 8

<211> 79

<212> DNA

<213> 人工序列

<220>

<223> 寡核苷酸捕获探针01-I5.1 (01 = 等位基因组; I5 =

内含子序号5; .1 =内含子用探针1)

<400> 8

cttccacaat catgggccga cccagcctgg gccctgtgtg ccagcactta ctcttttgta 60

aagcacctgt taaaatgaa 79

<210> 9

<211> 130

<212> DNA

<213> 智人

<400> 9

gtgagtgcgg ggtcgggagg gaaaccgcct ctgcggggag aagcaagggg ccctcctggc 60

gggggcgcag gaccggggga gccgcgccgg gaggagggtc gggcaggtct cagccactgc 120

tcgcccccag 130

<210> 10

<211> 127

<212> DNA

<213> 人工序列

<220>

<223> A-3-1.1 HLA-A 3' 未翻译区捕获探针序列

<400> 10

gacagctgcc ttgtgtggga ctgagaggca agagttgttc ctgcccttcc ctttgtgact 60

tgaagaaccc tgactttgtt tctgcaaagg cacctgcatg tgtctgtgtt cgtgtaggca 120

taatgtg 127

<210> 11

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> A-5-1.1 HLA-A 5' 未翻译区捕获探针序列

<400> 11

cagggcgaag tcccagggcc ccaggcgtgg ctctcagggt ctcaggcccc gaaggcggtg 60

tatggattgg ggagtcccag ccttggggat tccccaactc cgcagtttct tttctccctc 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> A-5-2.1 HLA-A 5' 未翻译区捕获探针序列

<400> 12

cctggatact cacgacgcgg acccagttct cactcccatt gggtgtcggg tttccagaga 60

agccaatcag tgtcgtcgcg gtcgctgttc taaagcccgc acgcacccac cgggactcag 120

<210> 13

<211> 112

<212> DNA

<213> 人工序列

<220>

<223> A-I1-1.1 HLA-A 内含子1捕获探针序列

<400> 13

gggaaacggc ctctgcgggg agaagcaagg ggcccgcccg gcgggggcgc aggacccggg 60

aagccgcgcc gggaggaggg tcgggcgggt ctcagccact cctcgccccc ag 112

<210> 14

<211> 112

<212> DNA

<213> 人工序列

<220>

<223> A-I1-1-2 HLA-A 内含子1捕获探针序列

<400> 14

gggaaaccgc ctctgcgggg agaagcaagg ggccctcctg gcgggggcgc aggaccgggg 60

gagccgcgcc gggaggaggg tcgggcaggt ctcagccact gctcgccccc ag 112

<210> 15

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> A-I2-1.1 HLA-A 内含子2捕获探针序列

<400> 15

gcaggtcacg acccctcatc ccccacggac gggccaggtc gcccacagtc tccgggtccg 60

agatccaccc cgaagccgcg gggctccgag acccttgtcc cgggagaggc ccagg 115

<210> 16

<211> 111

<212> DNA

<213> 人工序列

<220>

<223> A-I2-2.1 HLA-A 内含子2捕获探针序列

<400> 16

gaggcccagg cgcctttaac ccggtttcat tttcagttta ggccaaaaat ccccccgggt 60

tggtcggggc ggggcggggc tcgggggacc gggctgacct cggggtccgg g 111

<210> 17

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> A-I2-2.2 HLA-A 内含子2捕获探针序列

<400> 17

gaggcccagg cgcctttacc cggtttcatt ttcagtttag gccaaaaatc cccccgggtt 60

ggtcggggcc gggcggggct cgggggactg ggctgaccgc ggggtcgggg 110

<210> 18

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> A-I3-1.1 HLA-A 内含子3捕获探针序列

<400> 18

gatcgcctgt agatctccgg ggctggcctc ccacaagaaa gggagacaaa tgggaccaac 60

actataatat cgccctccct ctggtcttga gggagaagaa tcctcctggg ttt 113

<210> 19

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> A-I3-1.2 HLA-A 内含子3捕获探针序列

<400> 19

gatcgcctgt agatctcccg ggctggcctc ccacaaggag gggagacaat tgggaccaac 60

actagaatat cgccctccct ctggtcctga gggagaggaa tcctcctggg ttt 113

<210> 20

<211> 103

<212> DNA

<213> 人工序列

<220>

<223> A-I3-2.1 HLA-A 内含子3捕获探针序列

<400> 20

ctgggttctg tgctctcttc cccatcccgg gtgtcctgtc cattctcaag atggccacat 60

gcgtgctggt ggagtgtccc atgacagatg caaaatgcct gaa 103

<210> 21

<211> 103

<212> DNA

<213> 人工序列

<220>

<223> A-I3-2.2 HLA-A 内含子3捕获探针序列

<400> 21

ctgggttctg tgctctcttc cccatcccag gtgtcctgtc cattctcaag atagccacat 60

gtgtgctgga ggagtgtccc atgacagatg caaaatgcct gaa 103

<210> 22

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> A-I3-2.3 HLA-A 内含子3捕获探针序列

<400> 22

ctgggttctg tgctctcttc cccatcccgg gtgtcctgtc cattctcaag atggccacat 60

gcatgctgga gtgtcccatg acagatgcaa aatgcctgaa 100

<210> 23

<211> 103

<212> DNA

<213> 人工序列

<220>

<223> A-I3-2.4 HLA-A 内含子3捕获探针序列

<400> 23

ctgggttctg tgctctcttc cccatcccag gtgtcctgtc catcctcaaa atggccacat 60

gcgtgctggt ggagtgtccc atgacagatg caaaatggct gaa 103

<210> 24

<211> 101

<212> DNA

<213> 人工序列

<220>

<223> A-I4-1.1 HLA-A 内含子4捕获探针序列

<400> 24

taaggaggga gatgggggtg tcatgtctct tagggaaagc aggagcctct ctggagacct 60

ttagcagggt cagggcccct caccttcccc tcttttccca g 101

<210> 25

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> A-I4-1.2 HLA-A 内含子4捕获探针序列

<400> 25

taaggaggga gacgggggtg tcatgtcttt tagggaaagc aggagcctct ctgaccttta 60

gcagggtcag ggcccctcac cttcccctct tttcccag 98

<210> 26

<211> 96

<212> DNA

<213> 人工序列

<220>

<223> A-I4-1.3 HLA-A 内含子4捕获探针序列

<400> 26

taaggaggga gatgggggtg tcatgtcttt tacggaaagc aggagcctct ctgaccttta 60

gcagggtcag ggcccctcac cttccccttt tcccag 96

<210> 27

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> A-I5-1.1 HLA-A 内含子5捕获探针序列

<400> 27

tctgagattt cttgtctcac tgagggttcc aagacccagg tagaagtgtg ccctgcctcg 60

ttactgggaa gcaccatcca caattatggg cctacccagc ctgggccctg tgt 113

<210> 28

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> A-I5-1.2 HLA-A 内含子5捕获探针序列

<400> 28

tctgagattt cttgtctcac tgagggttcc aagccccagc tagaaatgtg ccctgtctca 60

ttactgggaa gcaccatcca caatcatggg cctacccagc ctgggccctg tgt 113

<210> 29

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> A-I5-2.1 HLA-A 内含子5捕获探针序列

<400> 29

ccctgggtct gcagtcacac atttctggaa acttctctga ggtccaagac ttggaggttc 60

ctctaggacc ttaaggccct gactcctttc tggtatctca caggacattt tctt 114

<210> 30

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> A-I5-2.2 HLA-A 内含子5捕获探针序列

<400> 30

ccctgggtct gcattcacac atttctggaa acttctctgg ggtccaaggc tacgaggttc 60

ctctaggacc ttaaggccct ggctcctttc tggtagctca caggacattt tctt 114

<210> 31

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> B-3-1.1 HLA-B 3' 未翻译区捕获探针序列

<400> 31

cagaatttgt tcatgactgt tgttttctgt agcctgagac agctgtcttg tgagggactg 60

agatgcagga tttcttcact cctccccttt gtgacttcaa gagcctctgg catctctttc 120

<210> 32

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> B-5-1.1 HLA-B 5' 未翻译区捕获探针序列

<400> 32

gatcaggacg aagtcccagg tcccggacgg ggctctcagg gtctcaggct ccgagggccg 60

cgtctgcaat ggggaggcgc agcgttgggg attccccact cccatgagtt tcac 114

<210> 33

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> B-5-1.2 HLA-B 5' 未翻译区捕获探针序列

<400> 33

gatcaggacg aagtcccagg ccccgggcgg ggctctcagg gtctcaggct ccgagagccg 60

cgtctgcatt ggggaggcgc agcgttgggg attccccact cccacgagtt tcac 114

<210> 34

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> B-5-2.1 HLA-B 5' 未翻译区捕获探针序列

<400> 34

ttcccactcc cattgggtgt cgggtgtcta gagaagccaa tcagtgtcgc cggggtccca 60

gttctaaagt ccccacgcac ccacccggac tcaaaatctc ctcagacgcc 110

<210> 35

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> B-5-2.2 HLA-B 5' 未翻译区捕获探针序列

<400> 35

ttcccactcc cattgggtat tggatatcta gagaagccaa tcagcgtcgc cgcggtccca 60

gttctaaagt ccccacgcac ccacccggac tcagagtctc ctcagacgcc 110

<210> 36

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> B-5-2.3 HLA-B 5' 未翻译区捕获探针序列

<400> 36

ttcccactcc cattgggtgt cggatatcta gagaagccaa tcagcgtcgc cggggtccca 60

gttctaaagt ccccacgcac ccacccggac tcagagtctc ctcagacgcc 110

<210> 37

<211> 101

<212> DNA

<213> 人工序列

<220>

<223> B-I1-1.1 HLA-B 内含子1捕获探针序列

<400> 37

gggaaatggc ctctgtgggg aggagcgagg ggaccgcagg cgggggcgca ggacccgggg 60

agccgcgccg ggaggagggt cgggcccctc ctcgccccca g 101

<210> 38

<211> 108

<212> DNA

<213> 人工序列

<220>

<223> B-I1-1.2 HLA-B 内含子1捕获探针序列

<400> 38

gggaaatggc ctctgccggg aggagcgagg ggaccgcagg cgggggcgca ggacctgagg 60

agccgcgccg ggaggagggt cgggcgggtc tcagcccctc ctcacccc 108

<210> 39

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> B-I2-1.1 HLA-B 内含子2捕获探针序列

<400> 39

gtgagtgacc ccggcccggg gcgcaggtca cgactcccca tcccccacgg acggcccggg 60

tcgccccgag tctccgggtc cgagatccgc ctccctgagg ccgcgggacc cgccc 115

<210> 40

<211> 113

<212> DNA

<213> 人工序列

<220>

<223> B-I2-1.2 HLA-B 内含子2捕获探针序列

<400> 40

gtgagtgacc ccggcccggg gcgcaggtca cgactcccca tcccccacgt acggcccggg 60

tcgccccgag tctccgggtc cgagatccgc ccccgaggcc gcgggacccg ccc 113

<210> 41

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> B-I2-1.3 HLA-B 内含子2捕获探针序列

<400> 41

gtgagtgacc ccggcctggg gcgcaggtca cgacccctcc ccaaccccga cgtacggccc 60

gggtctcctc gagtctctag gtccgagatc cgccccgagg ccgcgggacc cgccc 115

<210> 42

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> B-I2-2.1 HLA-B 内含子2捕获探针序列

<400> 42

gccgcgggac ccgcccagac cctcgaccgg cgagagcccc aggcgcgttt acccggtttc 60

attttcagtt gaggccaaaa tccccgcggg ttggtcgggg gggggcgggg 110

<210> 43

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> B-I2-2.2 HLA-B 内含子2捕获探针序列

<400> 43

gccgcgggac ccgcccagaa cctcgaccgc agagagcccc aggcgacttt acccggtttc 60

attttcagtt gaggtcaaaa gccccgcggg ttggtcaggg gggggcgggg 110

<210> 44

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> B-I3-1.1 HLA-B 内含子3捕获探针序列

<400> 44

gtaccagggg cagtggggag ccttccccat ctcctatagg tcgccgggga tggcctccca 60

cgagaagaag aggaaaatgg gatcagcgct agaatgtc 98

<210> 45

<211> 98

<212> DNA

<213> 人工序列

<220>

<223> B-I3-1.2 HLA-B 内含子3捕获探针序列

<400> 45

gtaccagggg cagtggggag ccttccccat ctcctataga tcgcccggga tggcctccca 60

cgaggagggg aggaaaatga gagaagcgct agaatgtc 98

<210> 46

<211> 126

<212> DNA

<213> 人工序列

<220>

<223> B-I3-2.1 HLA-B 内含子3捕获探针序列

<400> 46

tgtctgggtt ctgtgcccct tccccacccc aggtgtcctg tccattctca ggctggtcac 60

atgggtggtc ctagggtgtc ccatgaaaga tgcaaagcgc ctgaattttc tgactcttcc 120

catcag 126

<210> 47

<211> 93

<212> DNA

<213> 人工序列

<220>

<223> B-I4-1.1 HLA-B 内含子4捕获探针序列

<400> 47

gtaaggaggg ggatgagggg tcatatctct tctcagggaa agcaggagcc cttcagcagg 60

gtcagggccc ctcatcttcc cctcctttcc cag 93

<210> 48

<211> 104

<212> DNA

<213> 人工序列

<220>

<223> B-I4-1.2 HLA-B 内含子4捕获探针序列

<400> 48

gtaaggaggg ggatgagggg tcatatctct tctcagggaa agcaggagcc cttctggagc 60

ccttcagcag ggtcagggcc cctcatcttc ccctcctttc ccag 104

<210> 49

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> B-I5-1.1 HLA-B 内含子5捕获探针序列

<400> 49

gtagggaagg ggtgaggggt ggggtctggg ttttcttgtc ccactggggg tttcaagccc 60

caggtagaag tgttccctgc ctcattactg ggaagcagca tgcacacagg ggcta 115

<210> 50

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> B-I5-2.1 HLA-B 内含子5捕获探针序列

<400> 50

ctttcctcgt gtttcctgat cctgccctgg gtctgtagtc atacttctgg aaattctttt 60

tgggtccaag actaggaggt tcctctaaga tctcatggcc ctgcttcctc ccagtcccct 120

<210> 51

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> C-3-2.1 HLA-C 3' 未翻译区捕获探针序列

<400> 51

gacagctgcc tgtgtgggac tgagatgcag gatttcttca cacctctcct ttgtgacttc 60

aagagcctct ggcatctctt tctgcaaagg catctgaatg tgtctgcgtt cctgt 115

<210> 52

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> C-5-1.1 HLA-C 5' 未翻译区捕获探针序列

<400> 52

caggacgaag tcccaggtcc cgggcggggc tctcagggtc tcaggctcca agggccgtgt 60

ctgcactggg gaggcgccgc gttggggatt ctccactccc ctgagtttca 110

<210> 53

<211> 116

<212> DNA

<213> 人工序列

<220>

<223> C-5-1.2 HLA-C 5' 未翻译区捕获探针序列

<400> 53

caggacgaag tcccaggtcc cgggcggggc tctctgggtc tcaagctccc agggccgtgt 60

ctgcattggg gaggcgcagc gttggggatt ccccactccc actcccctga gtttca 116

<210> 54

<211> 109

<212> DNA

<213> 人工序列

<220>

<223> C-5-2.1 HLA-C 5' 未翻译区捕获探针序列

<400> 54

ctcatgacgc gtccccaatt cccactccca ttgggtgtcg gattctagag aagccaatca 60

gcgtctccgc agtcccggtt ctgaagtccc cagtcaccca cccggactc 109

<210> 55

<211> 102

<212> DNA

<213> 人工序列

<220>

<223> C-5-2.2 HLA-C 5' 未翻译区捕获探针序列

<400> 55

ctcatgacgc gtccccaatt cccactccca ttgggtgtcg ggttctagag aagccaatca 60

gcgtctacgc agtcccggtt ctgaagtcac ccacccggac tc 102

<210> 56

<211> 112

<212> DNA

<213> 人工序列

<220>

<223> C-I1-1.1 HLA-C 内含子1捕获探针序列

<400> 56

ggttgggagg gaagcggcct ctgcggagag gagcgagggg cccgcccggc gagggcgcag 60

gacccgggga gccgcgcagg gaggtgggtc gggcgggtct cagcccctcc tc 112

<210> 57

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> C-I2-1.1 HLA-C 内含子1捕获探针序列

<400> 57

gtgagtgacc ccggcccggg gcgcaggtca cgacccctcc ccatccccca cggacggccc 60

gggtcgcccc gagtctcccg gtctgagatc caccccg 97

<210> 58

<211> 97

<212> DNA

<213> 人工序列

<220>

<223> C-I2-1.2 HLA-C 内含子1捕获探针序列

<400> 58

gtgagtgacc ccggcccggg gcgcaggtca cgacccctcc ccatccccca cggacggccc 60

gggtcgccta gagtctcccc gtctgagatc cacccca 97

<210> 59

<211> 114

<212> DNA

<213> 人工序列

<220>

<223> C-I2-2.1 HLA-C 内含子2捕获探针序列

<400> 59

gcggaacccg cccagaccct cgaccggaga gagccccagt cacctttacc cggtttcatt 60

ttcagtttag gccaaaatcc ccgcgggttg gtcggggcgg ggcggggctc gggg 114

<210> 60

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> C-I2-2.2 HLA-C 内含子2捕获探针序列

<400> 60

gcggaacccg cccagaccct cgaccggaga gagccctagt cgcctttacc cggtttcatt 60

ttcagtttag gccaaaatcc ccgcgggttg gtcggggctg gggcggggtt cgggg 115

<210> 61

<211> 115

<212> DNA

<213> 人工序列

<220>

<223> C-I2-2.3 HLA-C 内含子2捕获探针序列

<400> 61

gcggaacccg cccagaccct cgaccggaga gagccccagt cacctttacc cggtttcatt 60

ttcagtttag gccaaaatcc ccgcgggttg gtcggggctg gggcggggct cgggg 115

<210> 62

<211> 108

<212> DNA

<213> 人工序列

<220>

<223> C-I3-1.1a HLA-C 内含子3捕获探针序列

<400> 62

gggcagtggg gagccttccc catctcctgt agatctcccg ggatggcctc ccacgaggag 60

gggaggaaaa tgggatcagc gctagaatat cgccctccct tgaatgga 108

<210> 63

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> C-I3-1.1b HLA-C 内含子3捕获探针序列

<400> 63

cccccttccc caccccaggt gtcctgtcca ttctcaggat agtcacatgg gcgctgttgg 60

agtgtcgcaa gagagataca aagtgtctga attttctgac tcttcccgtc 110

<210> 64

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> C-I3-1.2 HLA-C 内含子3捕获探针序列

<400> 64

ccgccttccc caccccaggt gtcctgtcca ttctcaggat ggtcacatgg gcgctgctgg 60

agtgtcccaa gagagatgca aagtgtctga attttctgac tcttcccgtc 110

<210> 65

<211> 117

<212> DNA

<213> 人工序列

<220>

<223> C-I4-1.1 HLA-C 内含子4捕获探针序列

<400> 65

ggagggggat gaggggtcat gtgtcttctc agggaaagca gaagtcctgg agcccttcag 60

ccgggtcagg gctgaggctt gggggtcagg gcccctcacc ttcccctcct ttcccag 117

<210> 66

<211> 100

<212> DNA

<213> 人工序列

<220>

<223> C-I4-1.2 HLA-C 内含子4捕获探针序列

<400> 66

ggagggggat gaggggtgat atctgttctc agggaaagca ggagcccttc tggagccctt 60

cagcagggtc agggcccctc accttcccct cctttcccag 100

<210> 67

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> C-I4-1.3 HLA-C 内含子4捕获探针序列

<400> 67

ggaggggaat ggggggtcac atctcttatc agagaaagca gaagtccttc tggagccctt 60

cagccgggtc agggctgagg cttgggggtc agggcccctc accttctcct cctttcccag 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列

<220>

<223> C-I4-1.4 HLA-C 内含子4捕获探针序列

<400> 68

ggagggggat gaggggtcat gtgtcttctc agggaaagca gaagtccttc tggagccctt 60

cagccgggtc agggctgagg cttgggtgta agggcccctc accttcccct cctttcccag 120

<210> 69

<211> 110

<212> DNA

<213> 人工序列

<220>

<223> C-I5-1.1 HLA-C 内含子5捕获探针序列

<400> 69

gggtctgggt tttcttgtcc cactgggagt ttcaagcccc aggtagaagt gtgccccacc 60

tcgttactgg aagcaccatc cacacctggg ccatcccagc ctgggaccct 110

<210> 70

<211> 118

<212> DNA

<213> 人工序列

<220>

<223> C-I5-2-1 HLA-C 内含子5捕获探针序列

<400> 70

cctgggtctg cagtcatagt tctggaaact tctcttgggt ccaagactag gaggttcccc 60

taagatcgca tggccctgcc tcctccctgt cccctcacag ggcattttct tcccacag 118

<210> 71

<211> 118

<212> DNA

<213> 人工序列

<220>

<223> C-I5-2-2 HLA-C 内含子5捕获探针序列

<400> 71

cctgggtctg cagtcgtagt tctggaaact tctcttgggt ccaagactag gaggttcccc 60

taaaatcaca tggccctgcc tcctcccagt cccctcatag ggcattttct tcccacag 118

相关技术
  • 用于鉴定基因的等位基因的试剂盒和探针
  • 用于鉴定基因的等位基因的方法和探针
技术分类

06120114721473