掌桥专利:专业的专利平台
掌桥专利
首页

一种肝癌微血管侵犯预测方法、设备及存储设备

文献发布时间:2024-04-18 19:58:21


一种肝癌微血管侵犯预测方法、设备及存储设备

技术领域

本申请涉及临床医学图像分析领域,尤其涉及一种肝癌微血管侵犯预测方法、设备及存储设备。

背景技术

肝细胞性肝癌(HCC)是当今世界上医学领域的最难根本性治疗的疾病之一,近几年HCC的发生率逐年升高。因此,HCC患者的治疗和术后预防问题是非常值得关注的。相关研究表明手术患者肝癌复发最重要的预测因素是微血管侵犯现象(MVI),其主要表现为肝癌细胞转移侵犯肝脏周围微血管,而且这种侵犯现象肉眼难以观测,只能在显微镜下观测判断。因此,有效地预测MVI对于HCC的治疗和术后预防具有重要意义。

目前已知的肝癌微血管侵犯现象的观察方法是对患者肝部病变部位进行穿刺活检,但是,该方法存在以下缺点:(1)穿刺活检是通过穿刺来获取肝癌患者肝部的组织细胞样本,以供医生在显微镜下检验判断是否存在MVI,步骤繁琐,需要损耗大量的时间,易导致患者错过最佳治疗阶段;(2)穿刺活检是有创检查,进行穿刺活检时,患者已经发生了MVI,组织创伤极有可能会导致肝癌细胞通过肝部周围的微血管入侵到血液里,而后随血液循环到达身体其他部位,也就是肝癌细胞发生了扩散,极大缩短了患者原本的生存时间,而且会给下一步治疗的计划和实施带来很严峻的挑战。

对于上述问题,亟需一种时间短、无创伤且能准确识别肝癌微血管侵犯现象的方法。

发明内容

本申请的目的在于解决常规的肝癌微血管预测技术存在步骤繁琐、风险性大且不能精准的识别肝癌微血管侵犯现象的技术问题,提供一种肝癌微血管侵犯预测方法、设备及存储设备。

本申请的上述目的是通过以下技术方案得以实现的:

一种肝癌微血管侵犯预测方法,该方法包括:

S1:提取各个模态MRI图像数据的影像组学特征数据;

S2:对各个所述模态MRI图像数据的影像组学特征数据进行T检验;

S3:对T检验后的各个所述影像组学特征数据进行数据融合,生成影像组学特征数据集;

S4:通过Lasso回归对所述影像组学特征数据集进行数据降维,确定有效特征数据;

S5:将所述影像组学特征数据集按照预设比例划分为测试集以及训练集;

S6:构建高斯过程回归模型,根据影像组学特征数据集以及高斯过程回归方法训练所述高斯过程回归模型;

S7:将所述测试集的数据输入到所述高斯过程回归模型中,输出识别预测结果。

可选的,步骤S2包括:

S21:计算各个所述影像组学特征数据的检验统计量;

S22:根据各个所述检验统计量的值,选取检验统计量的值大于预设阈值的对应的所述影像组学特征数据。

可选的,步骤S3包括:

S31:判断各个所述影像组学特征数据是否存在重复特征;

S32:若各个所述影像组学特征数据不存在重复特征,则将各个所述影像组学特征数据进行所述数据融合,生成所述影像组学特征数据集;

S33:若所述影像组学特征数据存在重复特征,则计算所述影像组学特征数据的重复特征与所述影像组学特征数据的其他特征的关联程度系数,并确定所述关联程度系数的平均值;

S34:将所述关联程度系数的平均值大于预设阈值的对应的所述重复特征删除,再将各个所述影像组学特征数据进行所述数据融合,生成所述影像组学特征数据集。

可选的,步骤S4包括:

S41:所述Lasso回归的公式如下:

其中,h

S42:通过k折交叉检验以及所述影像组学特征数据集,确定所述λ参数。

可选的,步骤S6包括:

S61:所述高斯过程回归模型的表达式为:

其中,x

S62:假设F(x

f(x)~GP(m(x),K(x,x′))

其中,m(x)为均值函数;K(x,x′)为核函数,即协方差函数;将所述均值函数m(x)设为0,即可确定所述核函数;

S63:采用所述核函数中的高斯核函数,即径向基函数RBF,基本形式如下:

其中,σ

S64:根据影像组学特征数据集对所述超参数进行计算,确定所述高斯核函数;

S65:设X(x

通过贝叶斯公式,得到f(X

p(f,f

S66:将所述均值函数、所述协方差函数以及所述噪声变量代入,即可得到预测点的概率表达式,如下:

μ

一种存储设备,存储设备存储指令及数据用于实现一种肝癌微血管侵犯预测方法。

一种肝癌微血管侵犯预测设备,包括:处理器及存储设备;处理器加载并执行存储设备中的指令及数据用于实现一种肝癌微血管侵犯预测方法。

本申请提供的技术方案带来的有益效果是:

1、本申请通过提取各个模态MRI图像数据的影像组学特征数据,对影像组学特征数据进行T检验,再对T检验后的各个影像组学特征数据进行数据融合的处理,充分利用多模态数据,使得数据融合后的数据特征更加充分完善,在数据层面有益于对肝癌微血管现象进行预测识别,提高预测和识别的准确性。

2、本申请通过Lasso回归对融合后的影像组学特征数据集进行数据降维的操作,减小了数据的复杂度,提高了数据处理效率;构建高斯过程回归模型,通过高斯过程回归方法训练所述高斯过程回归模型,输出识别预测结果;采用高斯过程回归算法对经过模态融合后的数据进行训练,使得训练后的高斯过程回归模型不会过分依赖某一模态的数据特征;因此本申请的高斯过程回归模型具有更好综合性、普遍性以及准确性。

附图说明

下面将结合附图及实施例对本申请作进一步说明,附图中:

图1是本申请实施例中肝癌微血管侵犯预测方法的步骤图;

图2是本申请实施例中肝癌微血管侵犯预测方法的特征图;

图3是本申请实施例中硬件设备工作的示意图。

具体实施方式

为了对本申请的技术特征、目的和效果有更加清楚的理解,现对照附图详细说明本申请的具体实施方式。

本申请的实施例提供了一种肝癌微血管侵犯预测方法、设备及存储设备。

请参考图1,图1是本申请实施例中一种肝癌微血管侵犯预测方法的流程图,具体包括如下步骤:

S1:提取各个模态MRI图像数据的影像组学特征数据;

S2:对各个所述模态MRI图像数据的影像组学特征数据进行T检验;

S3:对T检验后的各个所述影像组学特征数据进行数据融合,生成影像组学特征数据集;

S4:通过Lasso回归对所述影像组学特征数据集进行数据降维,确定有效特征数据;

S5:将所述影像组学特征数据集按照预设比例划分为测试集以及训练集;

S6:构建高斯过程回归模型,根据影像组学特征数据集以及高斯过程回归方法训练所述高斯过程回归模型;

S7:将所述测试集的数据输入到所述高斯过程回归模型中,输出识别预测结果。

具体的,提取各个模态MRI图像数据的影像组学特征数据的方式包括但不限于:通过Python中的Pyradiomics库来提取肝癌MRI医学图像的影像组学特征数据;Pyradiomics库可以通过配置文件提取对应特征,例如设置提取特征前是否重采样,设置不同种类的滤波器、设置滤波核的大小等。提取肝癌MRI图像的影像组学特征数据包括但不限于:形态学特征、滤波特征、一阶直方图特征以及纹理特征。

步骤S2包括:

S21:计算各个所述影像组学特征数据的检验统计量;

S22:根据各个所述检验统计量的值,选取检验统计量的值大于预设阈值的对应的所述影像组学特征数据。

具体的,若提取到的影像组学特征数据有1000条左右,维数较高;首先提出原假设和备择假设,然后计计算各个影像组学特征数据的检验统计量。通过比较检验统计量的大小,将检验统计量进行降序排列,选取检验统计量的值大于预设阈值的对应的所述影像组学特征数据,从而达到去除差别小的特征数据的目的。通过T检验来初步筛选特征,以达到初步降维的目的,提高数据处理的效率。

请参见图3,图3是本申请实施例中肝癌微血管侵犯预测方法的特征处理图,具体如下:

步骤S3包括:

S31:判断各个所述影像组学特征数据是否存在重复特征;

S32:若各个所述影像组学特征数据不存在重复特征,则将各个所述影像组学特征数据进行所述数据融合,生成所述影像组学特征数据集;

S33:若所述影像组学特征数据存在重复特征,则计算所述影像组学特征数据的重复特征与所述影像组学特征数据的其他特征的关联程度系数,并确定所述关联程度系数的平均值;

S34:将所述关联程度系数的平均值大于预设阈值的对应的所述重复特征删除,再将各个所述影像组学特征数据进行所述数据融合,生成所述影像组学特征数据集。

具体的,对T检验后的各个所述影像组学特征数据进行数据融合,对影像组学特征数据的重复特征进行处理,取平均值,再将重复特征删除,最后将影像组学特征数据进行拼接,生成影像组学特征数据集,减少了数据的冗余度,提高了数据的有效性和处理效率。

步骤S4包括:

S41:所述Lasso回归的公式如下:

其中,h

S42:通过k折交叉检验以及所述影像组学特征数据集,确定所述λ参数。

具体的,Lasso回归的核心是罚函数的构建,罚函数的作用是设置相关的约束条件,使得一些回归系数最终为0,除此之外,罚函数还能有效地压缩其他的回归系数,从而得到一个简单又高效的特征筛选模型。罚函数与Lasso回归方法中的参数λ密切相关,它控制了罚函数惩罚的严厉程度。如果λ参数设置得过小,那么模型的特征数量就会较多,会形成拟合过度。如果λ数设置得过大,那么模型的特征数量将会趋于0,又会遭成拟合不足。

λ的取值并不是随意的,本申请将通过k折交叉检验来确定λ参数。k折交叉验证,就是将数据集等比例划分为k份,并取其中的一份为测试数据,剩余的的k-1份数据为训练数据,这样算是完成了其中一次实验。因为k折交叉验证必须实验k次才是完成完整的一次实验,即k交叉验证是把实验重复性做了k次,每一次实验都是从k份数据集里选取一份不同的数据集为测试数据,其余的的k-1个数据集为训练数据,最终把得到的k个实验结果进行平分。

具体的,通过Lasso回归对所述影像组学特征数据集进行数据降维,确定有效特征数据,该方法类似于压缩估计,通过要说数据的方式,能更好地收缩影像组学特征数据,起到筛选特征的效果;Lasso回归保留了子集收缩的优点,是一种处理具有复共线性数据的有偏估计。Lasso回归的优点是对数据的要求是极其低,可以处理更多种类数据,而且在变量的选取上也优于其他算法,提高了本申请的实用性。

步骤S6包括:

S61:所述高斯过程回归模型的表达式为:

y

其中,x

S62:假设f(x

f(x)~GP(m(x),K(x,x′))

其中,m(x)为均值函数;K(x,x′)为核函数,即协方差函数;将所述均值函数m(x)设为0,即可确定所述核函数;

S63:采用所述核函数中的高斯核函数,即径向基函数RBF,基本形式如下:

其中,σ

S64:根据影像组学特征数据集对所述超参数进行计算,确定所述高斯核函数;

S65:设X(x

通过贝叶斯公式,得到f(X

p(f,f

S66:将所述均值函数、所述协方差函数以及所述噪声变量代入,即可得到预测点的概率表达式,如下:

Y

μ

具体的,将特征融合后的测试集数据传递给已经训练好的高斯过程回归模型进行预测和指标的评估,分别计算准确率Accuracy和查准率Precision和ROC曲线线下面积AUC,以对高斯过程回归模型进行评估。

为了充分利用多模态数据,本申请选取了常规单模态数据实验中测试结果最好的两个模态数据进行融合,以使特征数据充分完善,使得训练后的高斯过程回归模型不会过分依赖某一模态的数据特征,使得高斯过程回归模型的综合性更高,普遍性更强以及识别预测结果更好。

请参见图3,图3是本申请实施例的硬件设备工作示意图,硬件设备具体包括:一种肝癌微血管侵犯预测设备401、处理器402及存储设备403。

一种肝癌微血管侵犯预测设备401:一种肝癌微血管侵犯预测设备401实现一种肝癌微血管侵犯预测方法。

处理器402:处理器402加载并执行存储设备403中的指令及数据用于实现一种肝癌微血管侵犯预测方法。

存储设备403:存储设备403存储指令及数据;存储设备403用于实现一种肝癌微血管侵犯预测方法。

以上仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

相关技术
  • 一种钻进状态变量的预测方法、设备及存储设备
  • 一种后端存储设备的管理方法、装置、设备以及存储介质
  • 一种网络安全态势预测方法、装置、设备及存储介质
  • 一种进馆档案数量预测方法、装置、电子设备及存储介质
  • 一种身体质量指数预测方法、装置、电子设备及存储介质
  • 一种肝癌微血管侵犯鉴别模型的构建方法及肝癌微血管侵犯预测值的测试方法
  • cfDNA 5hmC水平作为生物标志物在预测肝癌患者微血管侵犯中的应用
技术分类

06120116484282