掌桥专利:专业的专利平台
掌桥专利
首页

一种甜瓜SNP位点标记组合、检测SNP位点标记探针组合、液相芯片及应用

文献发布时间:2024-04-18 19:58:30


一种甜瓜SNP位点标记组合、检测SNP位点标记探针组合、液相芯片及应用

技术领域

本发明属于植物基因分型检测技术领域,具体涉及一种甜瓜SNP标记位点组合、检测SNP位点标记探针组合、液相芯片及应用。

背景技术

甜瓜(Cucumis melo L.)作为一类重要的经济作物,其丰富的商品类型深受消费者青睐。甜瓜高质量基因组的组装以及大规模甜瓜种质基因组重测序的完成标志着甜瓜的分子研究突破了标记数量的限制,同时也为基因组辅助甜瓜育种及甜瓜的品种鉴定管理提供了宝贵的遗传资源以及变异信息。然而通过重测序技术,将如此高通量的分子标记应用到实际的育种和品种鉴定管理工作中需要较高的计算资源、特殊的技术要求以及较大的检测成本,限制了甜瓜分子育种中更为广泛的应用。因而,当下建立起一套快速高效、成熟稳定、成本低、通量高的基因型鉴定方法,来提高甜瓜品种鉴定和育种中的样本检测效率,有利于甜瓜科研工作者推动甜瓜育种和分子生物学的高质量发展。

单个核苷酸发生的转换,颠换、缺失或插入引起的基因组多态性被称为单核苷酸多态性(SNP)。二代测序技术的进步推动了SNP检测的高通量发展,因其具有基因组覆盖密度高、遗传特征代表性强、遗传稳定、自动化和易操作等优点,在遗传与育种方面的应用越来越广泛。通过分析样本间基因组中的碱基差异,可以用来鉴定检测样本的基因型和遗传背景,确定样本间的亲缘关系和群体结构等方面的信息。SNP标记在遗传分析方面具有多方面的应用,比如:标记辅助群体选育、遗传连锁图谱构建、QTL定位、群体遗传多态性分析以及群体系统演化关系推断等。此外,SNP标记在育种中应用也极其广泛,比如:SNP标记可以帮助种业人员更准确地鉴定和区分不同品种;SNP标记可以帮助种业从业人员有效调控作物性状并开发新的优良品种;SNP标记在选择性育种时可以更快速准确地选择优良品种,避免传统选择方法中存在的缺陷,例如繁琐、费时、不准确等;SNP标记还可以帮助种业人员更好地保护和利用珍稀的遗传资源并进行种质资源评价。

全基因组测序能极大程度得覆盖全基因组序列,然而其重要的应用指标测序价格往往伴随着测序深度的增加而上涨,不能较好的兼顾精度与价格的优势。简化基因组测序一般是通过限制性内切酶随机酶切DNA序列,测序价格相对便宜,但由于简化基因组测序酶切位点的随机性和检测结果的假阳性和假阴性因而存在的种种限制。靶向测序分型是从基因组上定点进行深度测序并获得物理位置相对固定且高度可信的标记位点,测序费用依标记通量的大小而变动,其样本检测价格相对较低。全基因组测序因其在基因组覆盖范围广,常被用作靶向基因组测序的先验数据和重要的数据支撑,二者的结合应用可以达到测序策略的优势互补。靶向测序分型平台因其具有靶向准确、变异位点测序深度高、分型费用低以及性价比高等优点,近期多项研究中,以液相芯片技术为载体并基于群体重测序的变异组数据,筛选代表性SNP成为品种鉴定以及育种改良中高效可靠的方法。目前在玉米、水稻、小麦、大豆、花生、棉花等农业作物(Guo et al.,2019;Guo et al.,2021;Liu et al.,2022);白菜、辣椒、茄子、黄瓜、西瓜等蔬菜或水果作物(Su et al.,2018;Du et al.,2019;Liu etal.,2019;Zhang et al.,2020;Shen et al.,2021;Zhang et al.,2022)具有广泛的应用。

因此,开发一种可以用在甜瓜样本的基于SNP位点的基因型快速分型检测方法是有必要的。

发明内容

针对以上问题,本发明目的在于提供一种用于检测甜瓜SNP位点的探针,该探针是用于检测筛选出甜瓜的2000个SNP位点组合,通过该探针可以实现对甜瓜样本的基因型快速分型,用于甜瓜种质资源的遗传多样性分析、品种鉴定、遗传连锁图谱构建、基因定位、遗传背景选择以及分子辅助育种从而实现甜瓜的高效分子育种。

为了达到上述目的,本发明可以采取以下技术方案:

本发明一方面提供一种甜瓜SNP标记位点组合,其特征在于,包括2000个SNP标记位点,每个SNP标记位点包含1个碱基变异位点;SNP标记位点位置及变异位点如表1所示。

本发明另一方面提供一种用于检测上述的甜瓜SNP标记位点组合的探针组合,其特征在于,每一个SNP标记位点对应设置一组用于检测对应的SNP标记位点探针,构成探针组合。

本发明再一方面提供一种用于鉴定甜瓜基因分型的试剂,包括上述的用于检测甜瓜SNP标记位点的探针组合。

本发明再一方面提供一种液相芯片,包括上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂。

本发明再一方面提供一种上述甜瓜SNP标记位点组合或上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂或上述的液相芯片在鉴定甜瓜基因分型中的应用。

本发明再一方面提供一种上述甜瓜SNP标记位点组合或上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂或上述的液相芯片在甜瓜的遗传多样性分析、品种鉴定、遗传连锁图谱构建、QTL或基因定位、遗传背景选择或分子辅助育种的应用。

本发明有益效果至少包括:本发明提供的用于检测甜瓜SNP位点的探针,是用于检测筛选出甜瓜的2000个SNP位点组合,基于该探针,可以对甜瓜种质资源进行遗传多样性分析和品种鉴定;针对甜瓜遗传群体进行连锁图谱构建、基因定位、遗传背景选择以及分子辅助育种能达到重测序级别的变异图谱特征,具有极高的准确度和可靠性,同时较重测序进行样本分型具有更低的价格优势。

附图说明

图1为甜瓜液相芯片的2K SNP位点在甜瓜全基因组染色体中的分布情况;

图2A为2000个SNP位点的MAF频率分布分析结果情况;

图2B为基于2000个SNP位点代构建的进化树与全基因组所有SNP位点构建的进化树;

图2C为基于2000个SNP位点与全基因组所有SNP位点的两两个体之间的遗传相似性的亲缘关系矩阵图;

图3A为基于甜瓜液相芯片2K SNP位点筛选的核心SNP构建的代表性种质指纹图谱;

图3B为基于甜瓜液相芯片2K SNP位点筛选的核心SNP个体之间差异分布情况;

图4A为利用甜瓜液相芯片构建回交群体的遗传背景图谱;

图4B为利用甜瓜液相芯片构建回交群体的背景回复率的统计。

具体实施方式

所举实施例是为了更好地对本发明进行说明,但并不是本发明的内容仅局限于所举实施例。所以熟悉本领域的技术人员根据上述发明内容对实施方案进行非本质的改进和调整,仍属于本发明的保护范围。

本文中使用的术语仅用于描述特定实施例,并且无意于限制本公开。除非在上下文中具有明显不同的含义,否则单数形式的表达包括复数形式的表达。如本文所使用的,应当理解,诸如“包括”、“具有”、“包含”之类的术语旨在指示特征、数字、操作、组件、零件、元件、材料或组合的存在。在说明书中公开了本发明的术语,并且不旨在排除可能存在或可以添加一个或多个其他特征、数字、操作、组件、部件、元件、材料或其组合的可能性。如在此使用的,根据情况,“/”可以被解释为“和”或“或”。

本发明一实施例提供一种甜瓜SNP标记位点组合,其特征在于,包括2000个SNP标记位点,每个SNP标记位点包含1个碱基变异位点;SNP标记位点位置及变异位点如表1所示。

表1 2000个SNP标记位点

本发明另一实施例提供一种用于检测上述的甜瓜SNP标记位点组合的探针组合,其特征在于,每一个SNP标记位点对应设置一组用于检测对应的SNP标记位点探针,构成探针组合。

需要说明的是,上述表1的2000个SNP位点组合,其能极大程度反应甜瓜代表性种质群体的遗传特征;该液相芯片的密度大小以及在染色体上的均匀分布程度是在目前甜瓜DNA芯片报道中最高的,能针对不同的应用场景进行实质性的应用,在甜瓜育种改良以及品种鉴定中具有很大的应用价值。

另外,上述2000个SNP位点是按照以下方法进行筛选:通过1175份甜瓜的重测序数据(NCBI BioProject accession:PRJNA565104),基于表型和基因型的PCA分析筛选得到823份代表性种质;以“DHL94v4.0”为参考基因组利用GATK pipeline鉴定出8032592个SNP位点,首先为保证变异位点的可靠性,采用常规原则过滤掉非二等位基因位点、稀有突变位点(最小等位计数40)、高缺失率和高杂合率位点(大于0.1)、低测序覆盖度位点(小于4)和低比对得分位点(小于20)。接着针对甜瓜全基因组液相芯片的开发,采取以下筛选标准:1)任意两份甜瓜资源之间至少有30个以上标记存在基因型差异以保证个体间的遗传多样性;2)SNP位点上下游55bp旁侧序列的GC含量范围要在30%-70%之间以保证探针的结合;3)SNP位点上下游55bp旁侧序列其它变异的数量不能超过1个以保证分型准确性;4)SNP位点上下游55bp旁侧序列与基因组其它区域的相似性不能超过10%以保证探针杂交的唯一性;5)每100Kb划窗中的任意两个SNP之间的连锁不平衡系数(VIF)小于2以保证标记的非冗余性;6)以170kb为滑动窗口,对剩余的SNP画Bin,基于其在染色体均匀分布的标准选择最终的2000个SNP。

在一些具体实施例中,每一个SNP标记位点对应的探针如表2所示。需要说明的是,表2的探针编号与上表1中的SNP编号对应的变异位点和位置一一对应,比如,探针1号是SNP标记位点1号的探针。

表2 SNP标记位点对应的探针

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

/>

本发明再一实施例提供一种用于鉴定甜瓜基因分型的试剂,包括上述的用于检测甜瓜SNP标记位点的探针组合。

本发明再一实施例提供一种液相芯片,包括上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂。

需要说明的是,上述液相芯片中的2000个SNP位点组合,其能极大程度反应甜瓜代表性种质群体的遗传特征;该液相芯片的密度大小以及在染色体上的均匀分布程度是在目前甜瓜DNA芯片报道中最高的,能针对不同的应用场景进行实质性的应用,在甜瓜育种改良以及品种鉴定中具有很大的应用价值。

本发明再一实施例提供一种上述甜瓜SNP标记位点组合或上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂或上述的液相芯片在鉴定甜瓜基因分型中的应用。

本发明再一方面提供一种上述甜瓜SNP标记位点组合或上述的用于检测甜瓜SNP标记位点的探针组合或上述的用于鉴定甜瓜基因分型的试剂或上述的液相芯片在甜瓜的遗传多样性分析、品种鉴定、遗传连锁图谱构建、QTL或基因定位、遗传背景选择或分子辅助育种的应用。

为了更好地理解本发明,下面结合具体示例进一步阐明本发明的内容,但本发明的内容不仅仅局限于下面的示例。

本发明实施中,甜瓜全基因组液相芯片试剂盒是利用石家庄博瑞迪公司的基于液相探针杂交的靶向基因捕获技术(GenoBaits)制作而成。

实施例1甜瓜全基因组液相芯片的开发

通过1175份甜瓜的重测序数据(NCBI BioProject accession:PRJNA565104),基于表型和基因型的PCA分析筛选得到823份代表性种质。以“DHL94 v4.0”为参考基因组利用GATK pipeline鉴定出8032592个SNP位点,首先为保证变异位点的可靠性,采用常规原则过滤掉非二等位基因位点、稀有突变位点(最小等位计数40)、高缺失率和高杂合率位点(大于0.1)、低测序覆盖度位点(小于4)和低比对得分位点(小于20)。

接着针对甜瓜全基因组液相芯片的开发,采取以下筛选标准:1)任意两份甜瓜资源之间至少有30个以上标记存在基因型差异以保证个体间的遗传多样性;2)SNP位点上下游55bp旁侧序列的GC含量范围要在30%-70%之间以保证探针的结合;3)SNP位点上下游55bp旁侧序列其它变异的数量不能超过1个以保证分型准确性;4)SNP位点上下游55bp旁侧序列与基因组其它区域的相似性不能超过10%以保证探针杂交的唯一性;5)每100Kb划窗中的任意两个SNP之间的连锁不平衡系数(VIF)小于2以保证标记的非冗余性;6)以170kb为滑动窗口,对剩余的SNP画Bin;基于其在染色体均匀分布的标准选择最终的2000个SNP,通过石家庄博瑞迪公司的基于液相探针杂交的靶向基因捕获技术(GenoBaits)制作甜瓜全基因组SNP液相芯片试剂盒“Melon2K”,其2000个SNP位点在染色体的分布如图1所示。

实施例2甜瓜全基因组液相芯片用于群体遗传分析

本发明实例中基于2000个极具代表性的SNP位点与全基因组所有的SNP位点,对823份代表性甜瓜种质的最小等位基因频率(MAF)和系统进化树进行比较分析,进而评估2000个代表性SNP位点的代表性。MAF频率分布分析结果来看,2000个SNP位点与全基因组所有SNP位点在全群以及不同亚群内部的MAF频数分布上有着非常一致的分布趋势,其能够正确反映全群及亚群内的遗传多样性(图2A,其中,每组的横坐标从左到右依次为全群个体、栽培薄皮、栽培厚皮、野生薄皮和野生厚皮)。

另外,利用2000个SNP位点代构建的进化树与全基因组所有SNP位点构建的进化树也有近乎一致拓扑结构和分群结果,都能反应甜瓜四个经典类群:栽培薄皮、栽培厚皮、野生薄皮和野生厚皮(图2B)。

另外,基于2000个代表性SNP位点与全基因组所有SNP位点,本发明实施例进一步计算两两个体之间的遗传相似性并构建两组数据的亲缘关系矩阵,两组数据的皮尔逊相关系数在823份种质中可达到0.996,在不同亚群内部以及不同亚群之间平均达到0.99以上(图2C)。

以上结果充分说明本发明液相芯片中2000个SNP位点的代表性。

实施例3构建甜瓜代表性种质指纹图谱

本发明实施例中,为了科学高效得对甜瓜种质资源进行鉴定管理,通过perl语言脚本对甜瓜823份代表性种质中的2000个多态的SNP位点进行核心SNP鉴定,共筛选到能对所有代表性品种进行有效区分的21个核心SNP基因型位点(见表3),分型结果来看21个核心SNP基因型可赋予823份甜瓜种质独特的基因型组合(图3A),可用于对不同品种进行区分,构建DNA指纹图谱。

表3 21个核心SNP基因型位点及对应探针

另外,通过对每两个体之间差异的核心SNP基因型数量进行统计,发现个体间差异核心标记数据在数学模型上符合正态分布,其中个体间最小差异基因型数量为1,最多差异基因型数量为20,95.65%个体间差异基因型数量在5到14之间(图3B)。

实施例4甜瓜遗传背景选择及单片段渐渗系背景回复率检测

本发明实施例中,为了验证甜瓜全基因组液相芯片在标记辅助育种中的功能性,选取栽培薄皮甜瓜“13C”材料为受体亲本,野生薄皮甜瓜“P132”为供体亲本构建单片段渐渗系。通过两亲本杂交在与受体亲本“13C”回交,获得223份BC

以上结果表明本发明中构建的甜瓜全基因组液相芯片对于甜瓜群体的遗传背景选择结果是可靠的,也证明了其在分子育种上的应用价值。

最后说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围。

相关技术
  • 一种鉴定滩羊与非滩羊的4种SNP位点组合及其应用
  • 一种甜瓜果皮果面沟的SNP标记、检测方法及应用
  • 与油菜多分枝性状主效QTL位点连锁的SNP分子标记及应用
  • 一种用于鉴定甜瓜果肉颜色的SNP标记引物及分子标记方法
  • 官庄花猪SNP位点、SNP芯片与其检测引物组合、检测试剂盒及其应用和种质鉴定方法
  • 官庄花猪SNP位点、SNP芯片与其检测引物组合、检测试剂盒及其应用和种质鉴定方法
技术分类

06120116503083