掌桥专利:专业的专利平台
掌桥专利
首页

基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法

文献发布时间:2024-04-18 19:58:30


基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法

技术领域

本申请涉及一种区分个体体能耐力的方法,尤其涉及基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法。

背景技术

现有区分个体体能耐力的方法主要使用单一组学等方法,较少使用多组学融合的方法区分个体体能耐力。单一组学方法实施起来简单,但是仅从单一组学的视角去区分个体体能耐力,在区分方法上有些片面,单一组学不能全面反映个体(人)的状态。

发明内容

鉴于上述问题,本申请旨在提出一种基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法及其装置,从粪便肠道菌群和血液代谢物两个组学的角度来对个体体能耐力作区分,以更全面的特征来对个体体能耐力进行区分。

本申请的基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法,通过将受试者的粪便肠道菌群组学特征和血液代谢物组学特征作为输入特征输入经训练的预测模型,由该经训练的预测模型计算得到个体体能耐力的分类。

本申请的基于粪便肠道菌群和血液代谢物区分个体体能耐力的装置,其包括计算单元,所述计算单元用于运行经训练的预测模型,通过将受试者的粪便肠道菌群组学特征和血液代谢物组学特征作为输入特征输入该经训练的预测模型,由该经训练的预测模型计算得到个体体能耐力的分类。

其中所述经训练的预测模型为xgboost模型;

所述输入特征中,

粪便肠道菌群组学特征包括:

g_Clostridium;s_Clostridium butyricum、

g_Unclassified;s_Lachnospiraceae bacterium 28-4、

g_Eubacterium;s_Eubacterium sp.CAG:192、

g_Unclassified;s_Deltaproteobacteria bacterium CG11_big-fil_rev_8_21_14_0_20_47_16、

g_Bifidobacterium;s_Bifidobacterium sp.N4G05、

g_Coprobacillus;s_Coprobacillus sp.CAG:605、

g_Streptococcus;s_Streptococcus salivarius;

血液代谢物组学特征包括:

MADP0195、

MEDP0184、

LIPID-P-0497、

MEDN0368、

MADN0168、

MEDN1069、

MEDP1662、

MEDP1165、

LIPID-P-0827、

LIPID-P-1218。

优选地,所述输入特征在所述预测模型的中的对应权重由大到小为:

MADP0195、

MEDP0184、

LIPID-P-0497、

MEDN0368、

g_Clostridium;s_Clostridium butyricum、

MADN0168、

MEDN1069、

g_Unclassified;s_Lachnospiraceae bacterium 28-4、

g_Eubacterium;s_Eubacterium sp.CAG:192、

g_Unclassified;s_Deltaproteobacteria bacterium CG11_big-fil_rev_8_21_14_0_20_47_16、

g_Bifidobacterium;s_Bifidobacterium sp.N4G05、

MEDP1662、

MEDP1165、

LIPID-P-0827、

g_Coprobacillus;s_Coprobacillus sp.CAG:605、

LIPID-P-1218、

g_Streptococcus;s_Streptococcus salivarius。

本申请的基于粪便肠道菌群和血液代谢物区分个体体能耐力的方法及其装置,充分利用了粪便肠道菌群和血液代谢物组学特征之间的互作关系,抓住与体能耐力相关的关键特征,以更多的维度实现体能耐力表型的分类。

附图说明

图1为肠道菌群数据;

图2为血液代谢物数据;

图3为体能表型数据;

图4为预测精度曲线;

图5为关键特征列表。

具体实施方式

本发明共包括三部分,第一部分为组学特征构建,第二部分为xgboost分类,第三部分为关键特征提取。

第一部分:组学特征构建

考虑到粪便肠道菌群和血液代谢物之间存在一定的关联性。本发明同时使用便肠道菌群的相对丰度数据(如图1所示)和血液代谢物丰度数据(如图2所示),基于特征的低方差过滤部分低质量特征,以3千米跑为体能耐力表型的标签(如图3所示)。

第二部分:xgboost分类

使用极致梯度提升机器学习方法xgboost进行体能耐力表型建模。以粪便肠道菌群和血液代谢物为特征,以3千米跑为体能耐力表型为机器学习的标签。进行建模和分类预测。

第三部分:关键特征

基于致梯度提升机器学习方法xgboost筛选出来的特征为关键特征,为粪便肠道菌群和血液代谢物之一。

步骤一:组学特征构建

针对同一个样本的粪便肠道菌群和血液代谢物数据,基于特征的低方差过滤部分低质量特征,分别构建粪便肠道菌群特征数据和血液代谢物数据,同时收集统一样本的3千米跑为体能耐力表型数据。

步骤二:使用极致梯度提升机器学习方法xgboost进行体能耐力表型建模

以粪便肠道菌群和血液代谢物为特征,通过直接拼接形成统一特征,基于6:4的比例切分数据形成训练集和测试集,以3千米跑为体能耐力表型为机器学习的标签,进行建模和分类预测,得到测试集的预测精度(曲线下面积ROC)。

步骤三:获取模型的关键特征

本申请经过筛选,获得的关键特征如图5所示。其中,

MADP0195:丝氨酸

MEDP0184:3,3',5'-碘甲状腺原氨酸

LIPID-P-0497:磷脂酰胆碱_PC(14:0_18:3)

MEDN0368:溶血磷脂酰乙醇胺LPE(14:0/0:0)

g_Clostridium;s_Clostridium butyricum丁酸梭菌

MADN0168:丁酮酸

MEDN1069:9,12-十八碳四烯酸

g_Unclassified;s_Lachnospiraceae bacterium 28-4:毛螺旋菌28-4

g_Eubacterium;s_Eubacterium sp.CAG:192:真/优杆菌CAG-192

g_Unclassified;s_Deltaproteobacteria bacterium CG11_big-fil_rev_8_21_14_0_20_47_16:三角蛋白细菌

g_Bifidobacterium;s_Bifidobacterium sp.N4G05:双歧杆菌N4G05

MEDP1662:N6,N6,N6-三甲基赖氨酸

MEDP1165:溶血磷脂酰胆碱PC(O-16:0/O-2:0)

LIPID-P-0827:甘油三酯_TG(12:0_16:0_16:1)

g_Coprobacillus;s_Coprobacillus sp.CAG:605:粪芽孢菌CAG605

LIPID-P-1218:甘油三酯_TG(18:2_20:3_20:4)

g_Streptococcus;s_Streptococcus salivarius:唾液链球菌

如Clostridium butyricum丁酸梭菌,又称酪酸梭菌、丁酸菌,是普遍存在于土壤、动物及人体粪便中的一类梭状芽胞杆菌,属于梭菌属(Clostridium)。Clostridiumbutyricum在肠道内产生的淀粉酶可以将碳水化合物降解为低聚糖,促进益生菌对碳源的利用。

本发明利用多组学数据进行体能耐力指标建模,充分利用了多组学之间的互作关系,能够抓住与体能耐力相关的关键特征,进行实现体能耐力表型的分类。

除非另有定义,本申请中使用的所有技术和/或科学术语具有与由本发明所涉及的领域的普通技术人员通常理解的相同含义。本申请中提到的材料、方法和实施例仅为说明性的,而非限制性的。

虽然已结合具体实施方式对本发明进行了描述,在本申请的发明主旨下,本领域的技术人员可以进行适当的替换、修改和变化,这种替换、修改和变化仍属于本申请的保护范围。

相关技术
  • 基于GCMSMS高通量分析动物肠道菌群代谢物的方法及应用
  • 基于GCMSMS高通量分析动物肠道菌群代谢物的方法及应用
技术分类

06120116497087