掌桥专利:专业的专利平台
掌桥专利
首页

一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用

文献发布时间:2023-06-19 16:11:11



技术领域

本发明涉及乳腺癌检测技术领域,尤其涉及一种乳腺癌的血清代谢指纹图谱构建方法及其应用。

背景技术

乳腺癌是当前世界上最常见的癌症,全世界每年有超过1300万新病例和45万人死亡,高性能分析化学方法对于乳腺癌的早期有效诊断和治疗至关重要。目前,临床 上对乳腺癌的诊断仍依赖于常规的组织病理学分类方法和影像学工具,如乳房X线 摄影、磁共振成像和超声等。然而,这些方法需要大型仪器或严格的操作,耗时长且 结果并不可靠。

近来,越来越多的乳腺癌研究强调了代谢组学在其早期诊断以及治疗和预后预测中的价值,已开发出诸如核磁共振光谱(NMR)和质谱(MS)等分析技术用于癌症代谢组 的全面筛查。然而,MS在液相和气相检测中的应用依赖于通过色谱法进行样品纯化 和代谢物富集,严重限制了分析速度和分析通量。激光解吸/电离(LDI)-MS使用纳米 颗粒基质替代色谱法进行固相检测,有助于推动乳腺癌代谢组分析。此外,使用基于 血液样本的液体活检具有易操作、非侵入和高通量的优势,可以作为促进早期检测、 预测转移潜力和选择治疗方式的有效工具。

因此,LDI-MS技术结合生物信息学方法有可能构建乳腺癌的血清代谢指纹图谱,筛选出特异性强的乳腺癌代谢生物标志物,实现对乳腺癌的高效、准确、快速诊断以 及预后预测。

发明内容

有鉴于现有技术的上述缺陷,本发明提供了一种乳腺癌代谢生物标志物组合及其指纹模型构建方法与应用,旨在实现对乳腺癌的高效、准确、快速诊断以及预后预测。

在本发明的实施方式中,一种乳腺癌血清代谢指纹模型的构建方法,包括以下步骤:

步骤1、预处理血清样本;

步骤2、预处理无机纳米颗粒;

步骤3、在质谱靶板上进行样品制备,每个稀释后的血清样本点样1μL,室温下 干燥;

步骤4、在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;

步骤5、在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集;

步骤6、对血清代谢指纹进行机器学习。

进一步地,步骤1具体为将血清样本用去离子水稀释10倍。

进一步地,步骤2具体为将无机纳米颗粒用去离子水配成1mg/mL的基质溶液。

进一步地,步骤6具体包括:

步骤6.1、在MATLAB R2020a上对步骤5采集的血清代谢指纹进行预处理,得到 m/z信号;

步骤6.2、将指纹图谱划分成训练集和测试集;

步骤6.3、在MATLAB R2020a上使用弹性网络算法在训练集上对m/z信号进行特 征选择,并设置弹性网络算法中频率参数的阈值,得到m/z特征;

步骤6.4、在Orange 3.25.0上使用神经网络在训练集上进行模型训练,得到模 型在训练集上的诊断性能;

步骤6.5、在Orange 3.25.0上使用步骤6.4中训练好的模型在测试集进行预测,得到神经网络在测试集上的诊断性能。

进一步地,步骤6.2所述训练集和测试集均包括乳腺癌病人组和对照组的血清代谢指纹图谱。

优选的,步骤6.3所述阈值为95%。

本发明还提供一种如权利要求4所述的乳腺癌血清代谢指纹模型的构建方法在预后预测中的应用,其特征在于,在SPSS上使用比例风险回归模型进行多因素回归分析, 具体包括以下步骤:

S1:采集具有完整随访信息的血清样本的血清代谢指纹;

S2:在MATLAB R2020a上对血清代谢指纹进行预处理,得到m/z信号;

S3:将步骤1中的血清样本划分成训练集和测试集;

S4:在SPSS上使用比例风险回归模型在训练集上对m/z信号进行多因素回归分析,并设置参数p value的阈值,得到m/z特征及其对应系数,由该特征和系数线性加和 构成代谢预后评分系统;

S5:使用步骤4中得到的评分系统对所有样本进行评分,将所有样本分为高风险组和低风险组;

S7:在Orange 3.25.0上使用生存分析,验证训练集和测试集中高风险组和低 风险组生存情况。

优选的,所述阈值为0.05。

本发明最后提供一种乳腺癌血清代谢生物标志物组合,包括甘油酸、烟酰胺、组胺、尿嘧啶、胸腺嘧啶、3,4-二碘吡唑和脱氢苯丙氨酸。

本发明与其他乳腺癌的检测方法比较所具备的有益效果为:

1.具有高检测重现性(血清样本中约95%的特征强度变异系数(CV)<30%)、快 速的分析速度(每个样本约30秒)和最少的样本消耗(每个样本约100nL)。

2.通过对血清代谢指纹的机器学习,我们实现了针对乳腺癌的高效诊断性能,诊断曲线下面积(AUC)为0.948(95%置信区间(CI):0.922-0.973)。此外,由血清代谢 指纹构建的代谢预后评分系统可以有效地预测了患者的预后和生存(p<0.005)。

3.开发了一种基于7个代谢生物标志物组合的诊断模型,具有准确的乳腺癌诊断效率,AUC为0.865(95%CI:0.820-0.911)。

以下将结合附图对本发明的技术方案及产生的技术效果作进一步说明,以充分地了解本发明的目的和效果。

附图说明

图1是乳腺癌病人及对照组血清代表性代谢指纹;

图2是325个样本血清谢指纹预处理后301个m/z信号对应热图;

图3是生物标志物组合和单个生物标志物诊断乳腺癌的性能对比图;

图4代谢预后评分系统在训练集中的预测性能示意图。

具体实施方式

以下参考说明书附图介绍本发明的优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限 于文中提到的实施例。

实施例一、使用纳米颗粒增强激光解吸/电离质谱技术,进行血清代谢指纹采集:

仪器与试剂的准备:纳米颗粒增强激光解吸/电离飞行时间质谱,血清样本,去离子水,基质(无机纳米颗粒);

步骤1:将血清样本用去离子水稀释10倍;

步骤2:将无机纳米颗粒用去离子水配成1mg/mL的基质溶液;

步骤3:在质谱靶板上进行样品制备,每个稀释后的血清样本点样1μL,室温下 干燥;

步骤4:在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;

步骤5:在纳米颗粒增强激光解吸/电离质谱仪中进行血清代谢指纹采集;

步骤6:得到血清代谢指纹,用于后续分析。

实施例二、对乳腺癌病人和对照组血清代谢指纹进行机器学习,实现对乳腺癌的精准诊断:

仪器与试剂的准备:MATLAB R2020a,Orange 3.25.0;

步骤1:通过实施例一,对325个血清样本(156个对照组和169个乳腺癌病人) 进行血清代谢指纹采集,结果如附图1所示;

步骤2:在MATLAB R2020a上对325个血清代谢指纹进行预处理,包括谱线平 滑、基线校正和谱峰联配,得到301个m/z信号,结果如附图2所示;

步骤3:将325个病人划分成训练集(260个样本,包括135个乳腺癌病人和125 个对照组)和测试集(65个样本,包括34个乳腺癌病人和31个对照组);

步骤4:在MATLAB R2020a上使用弹性网络算法在训练集上对301个m/z信号 进行特征选择,并设置弹性网络算法中频率参数的阈值为95%,得到36个m/z特征;

步骤5:在Orange 3.25.0上使用神经网络在训练集进行模型训练,得到模型在训练集上的诊断性能(表1);

步骤6:在Orange 3.25.0上使用步骤6中训练好的模型在测试集进行预测,得到神经网络在测试集上的诊断性能(表1)。

实施例三、进行血清中乳腺癌生物标志物鉴定,通过生物标志物组合实现对乳腺癌的精准诊断:

仪器与试剂的准备:纳米颗粒增强激光解吸/电离飞行时间质谱,纳米颗粒增强激光解吸/电离傅里叶变换离子回旋共振质谱,血清样本,去离子水,基质(无机纳米颗 粒);

步骤1:将血清样本用去离子水稀释10倍;

步骤2:将无机纳米颗粒用去离子水配成1mg/mL的基质溶液;

步骤3:在质谱靶板上进行样品制备,每个稀释后的房水样本点样1μL,室温 下干燥;

步骤4:在质谱靶板上进行基质制备,每个基质溶液点样1μL,室温下干燥;

步骤5:在基质辅助激光解吸电离傅里叶变换离子回旋共振质谱仪中得到血清中乳腺癌生物标志物的精准分子量;

步骤6:在基质辅助激光解吸电离飞行时间质谱中得到血清中乳腺癌生物标志物的二级质谱谱图;

步骤7:对质谱检测结果进行分析,鉴定出7个代谢生物标志物(表2);

步骤8:相比于单个标志物,7个标志物组合在乳腺癌诊断时表现出最好的性能,结果如附图3所示。

实施例四、对乳腺癌病人和对照组血清代谢指纹进行比例风险回归模型分析,实现对乳腺癌的精准预后预测:

仪器与试剂的准备:MATLAB R2020a,SPSS 22.0;

步骤1:通过步骤一,对具有完整随访信息的143个血清样本进行血清代谢指纹 采集;

步骤2:在MATLAB R2020a上对143个血清代谢指纹进行预处理,包括谱线平 滑、基线校正和谱峰联配,得到301个m/z信号;

步骤3:将143个病人划分成训练集(96个样本)和测试集(47个样本);

步骤4:在SPSS上使用比例风险回归模型在训练集上对301个m/z信号进行多因 素回归分析,并设置参数p value的阈值为0.05,得到4个m/z特征及其对应系数(表 3),由该特征和系数线性加和构成代谢预后评分系统。

步骤5:使用步骤5中得到的评分系统对所有样本进行评分。

步骤6:使用训练集中样本得分中位数作为阈值,将所有样本分为高风险组(评 分高于阈值)和低风险组(评分低于阈值)。

步骤7:在Orange 3.25.0上使用生存分析,验证训练集和测试集中高风险组生存情况均差于低风险组(p<0.05),说明代谢预后评分系统可以有效对乳腺癌进行预后 预测,结果如附图4所示。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术 人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得 到的技术方案,皆应在由权利要求书所确定的保护范围内。

技术分类

06120114736094