掌桥专利:专业的专利平台
掌桥专利
首页

一种估测生物分化时间的方法及其系统

文献发布时间:2023-06-19 11:26:00



技术领域

本发明涉及一种估测生物分化时间的方法及系统,属于生物技术和生物信息学领域。

背景技术

分化时间是当前宏观进化分析的一个热点,以某一个或某几个特定类群的化石时间作为参照,通过基因序列间的分歧程度以及分子钟来估计分支间的分歧时间,同时计算系统发育树上其它节点的发生时间,从而推断相关类群的起源和不同类群的分歧时间。根据分子钟理论,基因序列中密码子随着时间的推移以几乎恒定的比例相互替换,即具有恒定的演化速率,两个物种之间的遗传距离将与物种的分化时间成正比。通常采用单拷贝基因家族中的四重简并位点来估算分子钟(替换速率)以及物种间的分化时间,密码子中的四重简并位点由于第三碱基不改变所编码的氨基酸,属于中性进化,其中中性替换速率一般用每个位点每年的变异数来衡量。利用贝叶斯统计或其他方法估计物种分歧时间的程序很多,如R8S、MCMCTREE、MULTIDIVTIME、BEAST等,通过不同的策略将化石时间信息整合到一个系统发育树中,从而计算得到分化时间树。该方法只涉及到特定外显子的速率,没有考虑其他区域的进化速率。

单倍群是在分子进化的研究中,单倍群或单倍型类群是一组类似的单倍型,它们有一个共同的单核苷酸多态性祖先,单倍群计算群体分化时间主要应用于人类研究。首先是根据单倍群形成的顺序,先确定最后一个单倍群的核苷酸多态性祖先,根据该单倍群序列其他位置的分子标记差异,结合进化速率计算单倍群形成时间。该单倍群是上一个单倍群进化而来(也就是从上一个单倍群继承过来共同的核苷酸多态性),通过计算两个单倍群之间不同序列上核苷酸多态性数目,结合进化速率计算上一个单倍群的时间,以此类推得到每个单倍群的时间。该方法需要一步步计算每个单倍群的时间,不能一步计算需要的单倍群时间。

PSMC全称是成对序列马可夫共祖分析(pairwise sequentially Markoviancoalescent),是一种推测物种进化历史上有效群体大小的方法,也是目前最受欢迎使用最广的一种方法。该方法利用个体重测序的数据来推测该个体所属的种群在历史上各个时期的有效群体大小。进行PSMC分析所需的数据:(a)个体重测序的数据。PSMC分析必须基于个体重测序比对的结果,主要基于个体的杂合位点开展分析。(b)物种突变速率。(c)物种平均世代间隔,就是从个体出生到产下第一个后代的平均时长,比如人类大概是25年左右。(d)重测序材料的亚群分类信息,因为每个个体PSMC分析的结果,代表它所属的亚群的历史有效群体大小。因此必须预知每个个体属于哪个亚群,才便于对个体分析的结果进行分类比较。该方法基于个体的杂合位点,对于纯合位点不能利用PSMC分析。

目前对于共同祖先或者物种分化的时间计算主要是利用单拷贝基因、单倍群和PSMC。单拷贝基因通过序列比对,构建进化树,结合一个具体的物种分化时间以及分子钟确定所有物种的分化时间。单倍群计算分化时间主要是基于分子标记的继承,通过分子标记的差异数目与进化速率的关系计算最近一次单倍群事件发生的时间。再通过继承关系,依次推断其他单倍群发生的时间。PSMC计算群体历史大小,主要是基于个体的杂合位点分析。

其中,单拷贝基因计算物种分化时间,只考虑外显子的核苷酸多态性,而不同基因之间存在较大差异,对于其他基因组序列没有涉及,缺少了其他序列对进化贡献的研究;单拷贝基因计算物种分化时间,一般采用构建最大似然树,并且bootstrap为1000次。需要的计算量非常庞大,需要复杂碱基替代模型。单倍群计算物种分化时间,需要对单倍群进行依次分化时间的计算,不能一次获得需要的单倍群时间;单倍群计算物种分化时间,单倍群是群体的单倍型,只能计算整个单倍群的分化时间,不能计算个体的分化时间。PSMC分析群体历史大小,完全依赖于需要个体杂合位点,对于不含有杂合位点的个体不适合应用;PSMC分析群体历史大小,依赖于个体的全因组重测序数据,不能应用于按照某种要求获得的基因组片段分析。它们的优缺点比较如下表所示:

发明内容

本发明所要解决的技术问题是克服现有技术的方法的各种缺陷或不足,简化计算方法,又能达到估测的准确性和可靠性。

为解决上述技术问题,本发明提供的技术方案是:一种估测生物分化时间的方法,包括如下步骤:

(1)通过个体或群体与外类群的分子标记构建进化树,并且利用外类群作为进化树的根,确定群体内部的聚类以及分布;

(2)比较个体或群体与外类群之间的分子标记,计算个体或群体与外类群之间的分子标记差异个数;

(3)比较个体或群体内部之间的分子标记,计算个体或群体内部之间的分子标记差异个数;

(4)计算个体或群体内部之间的分子标记差异个数与不同个体或群体与外类群之间的分子标记差异的比值;

(5)结合个体或群体与外类群的分化时间,利用以下公式计算出个体或群体的分化时间;

式中,O表示外类群,A、B表示两个个体或群体,并且与外类群相比,在进化关系较为接近,NAB表示A与B分子标记的差异数目,单位:个数;NAO表示A与O分子标记差异数目,单位,个数;NBO表示B与O分子标记差异数目,单位:个数;Tm表示O与A、B分化节点对应时间;Tn表示A与B分化节点对应时间。

本发明方法中,生物分化时间计算模式图请参见图1。

a:个体分化时间计算模式图;Outgroup(O)表示外类群。A、B表示两个个体,并且与外类群相比,在进化关系较为接近。例如:A、B表示人类的2个个体,O表示黑猩猩。结点I表示外类群O与A、B个体分化节点,对应时间用Tm表示。结点II表示A与B个体分化节点,对应时间用Tn表示。

b:群体分化时间计算模式图;Outgroup(O)表示外类群。A群体包括A1、A2个体;B群体包括B1、B2个体。结点I表示外类群O与A、B群体分化节点,对应时间用Tm表示。结点II表示A与B群体分化节点,对应时间用Tn表示。

外类群O与A、B个体分化时间,与外类群O与A、B个体之间分子标记差异数目成正比;同理A、B个体分化时间,与A、B个体之间分子标记差异数目成正比。A个体与B个体分子标记的差异数目,记作NAB(单位:个);A个体与外类群分子标记差异数目记作NAO(单位:个);B个体与外类群分子标记差异数目记作NBO(单位:个)。等式如下:

A群体包括A1、A2个体,B群体包括B1、B2个体。外类群O与A、B群体分化时间,与外类群O与A、B群体之间分子标记差异数目成正比;同理A、B群体分化时间与A、B群体之间分子标记差异数目成正比。A群体与B群体分子标记的差异数目,是A1、A2个体分别与B1、B2个体之间分子标记差异数目(A1与B1、A2与B1、A1与B2、A2与B2)的平均值,记作NAB(单位:个);A群体与外类群分子标记差异数目(A1与O、A2与O)的平均值,记作NAO(单位:个);B群体与外类群分子标记差异数目(B1与O、B2与O)的平均值,记作NBO(单位:个)。等式如下:

本发明方法通过个体、群体与外类群的分子标记构建进化树,并且利用外类群作为进化树的根,确定群体内部的聚类以及分布;通过个体群体内部之间的分子标记差异,不同个体群体与外类群之间的分子标记差异的比值,结合个体、群体与外类群的分化时间,确定个体、群体的分化时间。

其中,在具体实施方式中,步骤(1)中,利用个体或群体基因组片段中的随机数量的SNP构建进化树。优选地,所述基因组片段与外类群有同源序列,并且外类群与每个样本之间都有至少一个以上的分子标记差异,能够区分不同的个体。在更具体实施方式中,利用连锁不平衡分析确定基因组的block区块,优选地是对每条染色体基因组单独处理,在每条染色体中随机选取200个以上满足质量要求的SNP位点利用Haploview软件进行连锁不平衡分析,得到基因组的最大的连锁区域,其中满足质量要求的SNP位点指满足缺失率<50%且最小等位基因频率>5%的SNP位点。

优选地,所述构建进化树是采用IBS距离法或其他可以构建进化树的方法构建所述系统进化树。进一步地,根据构建的所述系统进化树,确定祖先的来源;并通过分析所述系统进化树中各物种的先后顺序,确定所述物种之间的演化关系,从而获得所述群体遗传进化图谱。

本发明还提供一种基于上述方法的估测生物分化时间的系统,其特征在于,其包括数据录入模块,用于录入计算所需的原始数据;数据计算模块,用于执行所述的计算公式的计算,得到计算结果;结果输出模块,用于输出计算结果。进一步包括结果显示模块,优选通过计算机屏幕、移动终端显示。通过这种方式可编制相关计算程序,或者编制在移动终端上使用APP,如此可以通过数据录入后,自动计算结果,并进行显示。

本发明具有以下有益效果:不依赖于特定基因序列,可以利用全基因组片段,计算分化时间;不依赖于位点的杂合状态,对于位点不同状态的核苷酸多态性,都可以计算分化时间;不依赖于核苷酸多态性的继承,可以计算结点的分化时间;既可以计算群体,也可以计算个体的分化时间。本发明方法可根据全基因组利用某种特定要求得到的片段构建的进化树,通过群体内部之间的分子标记差异与不同群体与外类群之间的分子标记差异的比值,结合群体与外类群的分化时间,快速确定群体、个体的分化时间。对于所有物种的分化时间计算具有广泛的适用性。

附图说明

图1本发明方法生物分化时间计算模式图。其中,a:个体分化时间计算模式图;b:群体分化时间计算模式图。

图2人类线粒体基因组构建进化树。

图3人类线粒体基因组构建进化树。

图4人类Y染色体基因组构建进化树;其中,AFR:非洲地区的人群;AMR:美洲地区的人群;EAS:东亚地区的人群;SAS:南亚地区的人群;EUR:欧洲地区的人群;Pan:黑猩猩。进化树上的数字表示计算群体分化时间的结点。进化树外圈的颜色与各群体的颜色相对应。

图5水稻5号染色体着丝粒区域构建进化树,其中:Tej表示粳稻,Ind表示籼稻,BAR为非洲野生稻。

具体实施方式

下面通过具体实施方式的详细描述来进一步阐明本发明,但并不是对本发明的限制,仅仅作示例说明。

实施例1:利用人类线粒体基因组确定现代人类个体之间的分化时间

利用9个个体(个体编号分别是:HG02312、NA20774、NA19651、HG00409、HG00252、HG01170、HG03832、NA19011和HG03073)在线粒体基因组中的SNP构建进化树(SNP位置参考文献如下:1000 Genomes Project Consortium,Auton A,Brooks LD,Durbin RM,GarrisonEP,Kang HM,Korbel JO,Marchini JL,McCarthy S,McVean GA,Abecasis GR.A globalreference for human genetic variation.Nature.2015 Oct 1;526(7571):68-74.doi:10.1038/nature15393.PMID:26432245;PMCID:PMC4750478.),并且用黑猩猩作为外类群。具体操作如下:对每条染色体基因组单独处理,在每条染色体中随机选取200个以上满足质量要求(满足质量要求的SNP位点指满足缺失率<50%且最小等位基因频率>5%的SNP位点)的SNP位点利用Haploview软件进行连锁不平衡分析,得到基因组的最大的连锁区域。结果如图2所示。

根据进化树中不同个体之间的聚类,计算了不同个体之间的分化时间。结果如图2所示,结点1表示个体HG02312与个体NA20774的分化时间(进化树中的结点处有两个分枝,在结点1处,两个分枝分别是两个个体,个体编号分别是:HG02312和个体NA20774,在图1中有表示),具体的计算过程如下:首先比较个体HG02312与外类群黑猩猩之间分子标记,差异个数为540(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,两个个体间碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内)),相当于等式中的NAO;比较个体NA207744与外类群黑猩猩之间分子标记,差异个数为538(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,两个个体间碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内)),相当于等式中的NBO;比较个体HG02312与个体NA20774之间分子标记,差异个数为12(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较两个个体在同一位置上的碱基是否一致。统计在所有位置中,两个个体间碱基不一致的总个数(当两个个体中某一位置的碱基是“-”,该位置不被统计在内)),相当于等式中的NAB,根据等式:

根据已知信息,黑猩猩与人类的分化时间大约是400~500万年,因此Tm的取值范围为400~500万年,Tn的时间范围是:

进化树中,每个结点对应两个分枝,由结点向上走的分枝,记为A分枝,向下走的分枝记为B分枝。A分枝中所有聚集在一起的个体记为A群体,B分枝中所有聚集在一起的个体记为B群体。结点2表示走出非洲节点,A群体包括:NA19651、NA20774、HG00409、HG02312、HG00252,B群体包括:HG01170、HG03832、NA19011。

结点3表示人类共同祖先节点,A群体包括:NA19651、NA20774、HG00409、HG02312、HG00252、HG01170、HG03832、NA19011。B群体包括:HG03073。计算方法如上。

实施例2:利用人类线粒体基因组确定现代人类共同祖先时间

利用2535个个体在线粒体基因组中的SNP构建进化树(SNP位置参考文献如下:1000 Genomes Project Consortium,Auton A,Brooks LD,Durbin RM,Garrison EP,KangHM,Korbel JO,Marchini JL,McCarthy S,McVean GA,Abecasis GR.A global referencefor human genetic variation.Nature.2015 Oct 1;526(7571):68-74.doi:10.1038/nature15393.PMID:26432245;PMCID:PMC4750478.),并且用黑猩猩作为外类群。结果如图3所示。

根据进化树中不同个体之间的聚类,计算了不同个体之间的分化时间。结果如表1所示,结点1表示现代人类共同祖先时间,具体的计算过程如下:首先比较A群体与外类群黑猩猩之间分子标记,差异个数为541.35(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NAO;比较B群体外类群黑猩猩之间分子标记,差异个数为542.6(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较B群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算B群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NBO;比较A群体与B群体之间分子标记,差异个数为43.06(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与B群体中每个个体在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与B群体中所有个体分子标记差异个数的平均数),相当于等式中的NAB,根据等式:

已知黑猩猩与人类的分化时间大约是400~500万年,因此Tm的取值范围为400~500万年,Tn的时间范围是:

结点2表示人类走出非洲的时间,具体的计算过程如下:首先比较A群体与外类群黑猩猩之间分子标记,差异个数为540.68(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NAO;比较B群体与外类群黑猩猩之间分子标记,差异个数为542.38(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较B群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算B群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NBO;比较A群体与B群体之间分子标记,差异个数为19.23(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与B群体中每个个体在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与B群体中所有个体分子标记差异个数的平均数),相当于等式中的NAB,根据等式:

Tm的取值范围400~500万年,Tn的时间范围是:

利用线粒体基因组分析,人类起源于非洲;利用线粒体的突变速率与突变个数,分析获得线粒体祖先大约在20万年前(14-29万年)(参考文献如下:Cann,R.,Stoneking,M.&Wilson,A.Mitochondrial DNA and human evolution.Nature 325,31–36(1987).https://doi.org/10.1038/325031a0)。与利用相对差异比较法获得的线粒体共同祖先在30万年左右基本一致。相对差异比较法获得的线粒体走出非洲的时间是14-18万年,与之前的研究人类最后一次走出非洲的时间大约在5-20万年一致(见参考文献:Delson E.Anearly dispersal of modern humans from Africa to Greece.Nature.2019Jul;571(7766):487-488.doi:10.1038/d41586-019-02075-9.PMID:31337897.)。

表1每个结点中个体的分化时间

案例3:利用人类Y染色体基因组确定现代人类个体之间的分化时间

利用1233个个体在Y染色体中的SNP构建进化树,并且用黑猩猩作为外类群。结果如图4所示。

根据进化树中不同个体之间的聚类,计算了不同个体之间的分化时间。结果如表2所示,结点1表示现代人类共同祖先时间,具体的计算过程如下:首先比较A群体与外类群黑猩猩之间分子标记,差异个数为3000.5(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NAO;比较B群体外类群黑猩猩之间分子标记,差异个数为2979.11(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较B群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算B群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NBO;比较A群体与B群体之间分子标记,差异个数为2197.19(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与B群体中每个个体在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与B群体中所有个体分子标记差异个数的平均数),相当于等式中的NAB,根据等式:

已知黑猩猩与人类的分化时间大约是400~500万年,因此Tm的取值范围为400~500万年,Tn的时间范围是:

结点2表示人类走出非洲的时间,具体的计算过程如下:首先比较A群体与外类群黑猩猩之间分子标记,差异个数为2979.27(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NAO;比较B群体与外类群黑猩猩之间分子标记,差异个数为2954.75(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较B群体中每个个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算B群体中所有个体与黑猩猩之间分子标记差异个数的平均数),相当于等式中的NBO;比较A群体与B群体之间分子标记,差异个数为1216.75(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较A群体中每个个体与B群体中每个个体在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),最后计算A群体中所有个体与B群体中所有个体分子标记差异个数的平均数),相当于等式中的NAB,根据等式:

Tm的取值范围400~500万年,Tn的时间范围是:

研究Y染色体的分化时间,通常利用单倍群分析(见参考文献:Poznik GD,Xue Y,Mendez FL,Willems TF,Massaia A,Wilson Sayres MA,Ayub Q,McCarthy SA,NarechaniaA,Kashin S,Chen Y,Banerjee R,Rodriguez-Flores JL,Cerezo M,Shao H,Gymrek M,Malhotra A,Louzada S,Desalle R,Ritchie GR,Cerveira E,Fitzgerald TW,GarrisonE,Marcketta A,Mittelman D,Romanovitch M,Zhang C,Zheng-Bradley X,Abecasis GR,McCarroll SA,Flicek P,Underhill PA,Coin L,Zerbino DR,Yang F,Lee C,Clarke L,Auton A,Erlich Y,Handsaker RE;1000Genomes Project Consortium,Bustamante CD,Tyler-Smith C.Punctuated bursts in human male demography inferred from 1,244worldwide Y-chromosome sequences.Nat Genet.2016 Jun;48(6):593-9.doi:10.1038/ng.3559.Epub 2016 Apr 25.PMID:27111036;PMCID:PMC4884158.)。人类共同祖先的时间大约19万年,而非洲之外的人类的时间大约7.6万年左右。利用相对差异比较法确定人类共同祖先的时间大约300万年,而走出非洲的时间大约在200万年,与人类第一次走出非洲的时间一致(见参考文献如下:Delson E.An early dispersal of modern humans fromAfrica to Greece.Nature.2019 Jul;571(7766):487-488.doi:10.1038/d41586-019-02075-9.PMID:31337897.)。造成两次计算结果差异如此之大的原因,单倍群分析考虑的是群体,忽略了个体特有的分子标记。而个体特有的分子标记同样体现了人类进化过程中的印记。在分析时间过程中不能忽视。利用相对差异比较法,所有个体的特有分子标记都考虑在内,能够准确的计算人类进化事件的时间。

结点3表示个体NA19063与个体NA18995的分化时间,具体的计算过程如下:首先比较个体NA19063与外类群黑猩猩之间分子标记,差异个数为2917(计算过程如下:个体与黑猩猩含有相同的分子标记,并且所有分子标记的位置相同,比较个体与黑猩猩在同一位置上的碱基是否一致。统计在所有位置中,两个个体间碱基不一致的总个数(当个体或者黑猩猩中某一位置的碱基是“-”,该位置不被统计在内),相当于等式中的NAO;比较个体NA18995与外类群黑猩猩之间分子标记,差异个数为2917,相当于等式中的NBO;比较个体NA19063与个体NA18995之间分子标记,差异个数为117(计算过程如下:每个个体含有相同的分子标记,并且所有分子标记的位置相同,比较两个个体在同一位置上的碱基是否一致。统计在所有位置中,两个个体间碱基不一致的总个数(当两个个体中某一位置的碱基是“-”,该位置不被统计在内)),相当于等式中的NAB,根据等式:

根据Tm的取值范围为400~500万年,Tn的时间范围是:

单倍群分析考虑的是群体,无法分析个体的分化时间。利用相对差异分析法,能准确的获得个体之间的分化时间。

表2每个结点中群体、个体的分化时间

综上通过利用人类线粒体及Y染色体分析获得的人类共同祖先以及走出非洲时间,与之前研究结论一致,证明了相对比较差异法的可靠性。

实施例4:利用水稻5号染色体着丝粒侧翼测序分析水稻个体之间的分化时间

利用12份水稻材料5号染色体着丝粒区域中的SNP构建进化树,并且用非洲野生稻作为外类群(参见文献:Huang X,Kurata N,Wei X,Wang ZX,Wang A,Zhao Q,Zhao Y,LiuK,Lu H,Li W,Guo Y,Lu Y,Zhou C,Fan D,Weng Q,Zhu C,Huang T,Zhang L,Wang Y,FengL,Furuumi H,Kubo T,Miyabayashi T,Yuan X,Xu Q,Dong G,Zhan Q,Li C,Fujiyama A,Toyoda A,Lu T,Feng Q,Qian Q,Li J,Han B.A map of rice genome variation revealsthe origin of cultivated rice.Nature.2012 Oct 25;490(7421):497-501.doi:10.1038/nature11532.Epub 2012 Oct 3.PMID:23034647;PMCID:PMC7518720.)。结果如图5所示。

根据进化树中不同个体之间的聚类,计算了不同个体之间的分化时间。结点1表示粳稻分枝与籼稻分枝的分化时间,具体的计算过程如下:首先比较粳稻分枝所有材料与外类群非洲野生稻之间分子标记,差异个数平均值为786.25(计算过程如下:每个粳稻材料与非洲野生稻有相同的分子标记,并且所有分子标记的位置相同,比较粳稻材料中每个个体与非洲野生稻在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当粳稻材料或者非洲野生稻中某一位置的碱基是“-”,该位置不被统计在内),最后计算粳稻群体中所有个体与非洲野生稻之间分子标记差异个数的平均数),相当于等式中的NAO;籼稻分枝所有个体与外类群非洲野生稻之间分子标记,差异个数平均值为763.5(计算过程如下:每个籼稻材料与非洲野生稻有相同的分子标记,并且所有分子标记的位置相同,比较籼稻材料中每个个体与非洲野生稻在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当籼稻材料或者非洲野生稻中某一位置的碱基是“-”,该位置不被统计在内),最后计算籼稻群体中所有个体与非洲野生稻之间分子标记差异个数的平均数),相当于等式中的NBO;比较粳稻分枝所有个体与籼稻分枝所有个体之间分子标记,差异个数平均值为23.5(计算过程如下:每个材料含有相同的分子标记,并且所有分子标记的位置相同,比较粳稻材料中每个个体与籼稻材料中每个个体在同一位置上的碱基是否一致。统计在所有位置中,碱基不一致的总个数(当粳稻材料或者籼稻材料中某一位置的碱基是“-”,该位置不被统计在内),最后计算粳稻中所有个体与籼稻中所有个体分子标记差异个数的平均数),相当于等式中的NAB,根据等式:

根据最新研究认为非洲野生稻与亚洲栽培稻的分化时间大约是160万年(见参考文献:Zhang QJ,Zhu T,Xia EH,Shi C,Liu YL,Zhang Y,Liu Y,Jiang WK,Zhao YJ,MaoSY,Zhang LP,Huang H,Jiao JY,Xu PZ,Yao QY,Zeng FC,Yang LL,Gao J,Tao DY,WangYJ,Bennetzen JL,Gao LZ.Rapid diversification of five Oryza AA genomesassociated with rice adaptation.Proc Natl Acad Sci USA.2014 Nov 18;111(46):E4954-62.doi:10.1073/pnas.1418307111.Epub 2014 Nov 3.PMID:25368197;PMCID:PMC4246335.),因此Tm的取值范围为160万年,Tn的时间范围是:160万年。通过计算,粳稻与籼稻在5号染色体着丝粒区分化时间大约是4.8万年。

亚洲稻与非洲稻的分化时间大约是160万年前。利用相对差异比较分析法,确定粳稻与籼稻5号染色体的分化时间大约在4.8万年左右。因此,两种方法计算的分化时间基本一致,以表明本发明的计算方法的结果十分可靠。

相关技术
  • 一种估测生物分化时间的方法及其系统
  • 可靠性评估测试装置、可靠性评估测试系统、接触器以及可靠性评估测试方法
技术分类

06120112921486