掌桥专利:专业的专利平台
掌桥专利
首页

一种基于营养吸收能力基因的身高预测模型

文献发布时间:2023-06-19 09:49:27


一种基于营养吸收能力基因的身高预测模型

技术领域

本发明涉及一种基于营养吸收能力基因的身高预测模型,属于基因算法方法领域。

背景技术

基于基因和营养吸收能力基因的身高预测模型要足够多可靠的大量的用户基因位点,表型身高,人群基础数据,目前的基因库虽然拥有足够多中国用户的准确基因位点和表型数据。但是由于中国各地区在不同年份和地区的营养获取差异显著,营养吸收能力基因型对身高的差异在不同人群中的表现因此存在明显差异,对身高的预测需要考虑两者的交互作用。因此本申请研究一种基于营养吸收能力基因的身高预测模型。

发明内容

针对上述问题,本发明要解决的技术问题是提供的一种基于营养吸收能力基因的身高预测模型。

本发明提供如下技术方案:一种基于营养吸收能力基因的身高预测模型包含以下步骤:步骤一、提取每个用户的所有基因位点数据,表型身高数据,人群基础数据,验证数据可靠性,在大数据平台上将数据转换成模型可用的形式储存,对数据进行清洗,得到模型使用的数据;

步骤二、利用清洗得到的影响营养吸收能力的基因位点数据以及表型数据在不同年份地区性别人群中的相关性,建立多元线性回归模型;

步骤三、通过对模型的结果进行统计分析,预测不同的影响营养吸收能力基因型在不同人群中的身高。

进一步优选,所述的步骤一的详细流程为:首先要从大数据平台中提取基因位点数据,表型身高数据,人群基础数据,比较用户多次填写表型的准确性,使用准确可靠的表型数据,在大数据平台上将原始的基因位点数据转换成模型可以使用的矩阵形式,对数据处理异常缺失值,得到模型直接使用的数据。

进一步优选,所述的步骤二的详细流程为:根据清洗得到的表型,基因和基础数据,寻找与营养吸收能力相关性高的基因位点,建立年份,地区,性别,营养吸收能力基因与身高的线性回归模型,最终对模型结果统计分析,得出不同年份地区性别的人群基因型与身高的预测模型。

与现有技术相比,本发明的有益效果如下:1.模型基于大量的可靠的基因和表型数据;

2.考虑人群环境差异的模型在预测上更准确有效;

3.不同人群中差异的系数可以被事实解释。

附图说明:

图1为本发明实施例的具体方法流程图。

具体实施方式

下面将结合本发明实施例及附图对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例:本申请将用户的基因位点数据和表型身高数据预处理之后,建立不同人群的营养吸收能力基因和身高的回归模型,通过分析模型的结果得到基因,营养,人群的关系。

原始数据为(1)50万用户的3万维度的基因位点数据,(2)7万用户的表型身高,地区,年份,性别数据。首先从7万用户的表型身高数据中提取出可靠的4万成人用户的身高数据,再将50万用户的基因数据与有表型数据的用户匹配,最后经过数据的预处理得到4万用户的身高与基因数据。建立影响营养吸收能力基因数据,地区,年份,性别数据以及他们的交叉项和身高的线性回归模型。通过模型结果分析营养吸收能力基因对不同人群的影响。

参照图1所示,本实施例的预测模型的方法如下所示:首先获取用户的身高数据data_height,基因数据data_gene,特征数据data_feature,分别经过数据预处理之后根据加密的样本ID匹配,得到成人的身高基因特征数据data。经过统计相关性分析,筛选特征集,并对特征集交叉构建更灵活的特征值集合var。建立身高height与特征集合var的线性回归模型,更灵活的参数使得结果更准确。对模型结果进行统计分析,推断不同人群的营养吸收和获取情况,输出结果到用户给出预测身高和营养补充建议。

本实施例的具体代码如下:

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种基于营养吸收能力基因的身高预测模型
  • 一种青少年身高预测模型的建立方法
技术分类

06120112316460