掌桥专利:专业的专利平台
掌桥专利
首页

一种基于CT影像组学的肺癌预后辅助评估方法及系统

文献发布时间:2023-06-19 11:21:00


一种基于CT影像组学的肺癌预后辅助评估方法及系统

技术领域

本发明属于肺癌预后辅助评估的技术领域,具体涉及一种基于CT影像组学的肺癌预后辅助评估方法及系统。

背景技术

肺癌在全球癌症发病率位居首位,是癌症导致死亡的主要原因。大多数患者在确诊时已处于中晚期,约60%的患者无法手术,放射治疗是恶性肿瘤最重要的治疗手段之一,70%的恶性肿瘤患者需要在不同的治疗阶段接受放疗,但是经过放射治疗后的整体有效率远不能令人满意。

计算机断层扫描CT作为一种无创的肿瘤早期诊断方法,已广泛应用于多种临床疾病检查和辅助诊断。值得注意的是,影像组学得益于图像分析算法和影像组学技术的进步,通过应用生物信息学方法从医学图像中提取大量影像学特征,以此预测潜在的肿瘤生物学行为,从而对多种疾病尤其是恶性肿瘤提供了诊断、治疗及预后价值,进而为临床决策提供支持。

同样的肺癌患者,在CT影像病灶表现却具有差异性,病灶其内在异质性的差异,可能揭示患者放疗疗效的潜在信息,针对相关技术中肺癌患者对放射治疗敏感性的问题,目前尚未提出有效的解决方案,所以建立基于CT影像组学的肺癌放射治疗疗效的辅助评估系统和方法具有极高的实用意义。

发明内容

本发明克服现有技术存在的不足,所要解决的技术问题为:提供一种基于CT影像组学的肺癌预后辅助评估方法及系统,能够实现对放射治疗敏感性预先评估,实现个体化及精准化医疗。

为了解决上述技术问题,本发明采用的技术方案为:一种基于CT影像组学的肺癌预后辅助评估方法,包括:S101、采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选;S102、把肺癌患者按比例随机分为训练集和验证集,所述训练集用于训练预测模型,所述测试集用于验证预测模型的性能;S103、通过高分辨的计算机断层扫描勾勒出原始医学影像的病灶区域,并从病灶区域中提取影像组学特征,得到初步影像组学特征;S104、对初步影像组学特征进行分析筛选,得到目标影像组学特征S105、对训练集中的目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在验证集中验证模型;S106、确立采用放疗有效的影像组学特征标签,并在验证集中进行验证;S107、在预测模型的基础上计算每个患者的影像组学特征评分;S108、将患者的影像组学特征评分转化为患者放射治疗敏感性的概率。

优选地,所述根据高分辨的计算机断层扫描勾勒的病灶区域提取病灶轮廓,并从病灶轮廓中提取影像组学特征,得到初步影像组学特征,所述影像组学特征包括一阶特征18个,形状特征14个,灰度共生矩阵特征24个,灰度相关矩阵特征14个,灰度游程矩阵特征16个,灰度区域大小矩阵特征16个,相邻灰度差分矩阵特征5个,共计107个特征。

优选地,所述对初步影像组学特征进行分析筛选,得到目标影像组学特征,具体包括:S31、设定方差特征值,排除小于设定的方差阈值的特征;S32、使用单变量特征选择方法中的ANOVA(方差分析)算法,得到数据集中成像表型和治疗反应之间的关系,评估特征在治疗反应不同组间的差异,剔除训练组和验证组中显著性差异程度值@P值超过0.05的特征;S33、采用适合高维数据回归运算的最小绝对值收敛和选择算子回归模型(LASSO)方法,从原始数据集中选取有效的预测特征,采用10倍交叉验证法计算最小均方误差,根据最小均方误差得到了选择算子回归模型的最佳惩罚参数;S34、筛选出系数不为零的特征集。

优选地,所述采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选,具体包括:排除患有其他癌症的患者;排除接受过手治疗或放化疗但未完成完整治疗方案的患者;排除将缺乏高分辨率计算机断层扫描图像的患者。

优选地,所述临床信息具体包括但不限于:年龄、性别、基础病、病理类型、TMN分期、初治前Hb、WBC平均水平、呼吸困难、咳嗽、咳痰和发热症状。

相应地,一种基于CT影像组学的肺癌预后辅助评估系统,包括:预处理模块:采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选;分类模块:把肺癌患者按比例随机分为训练集和验证集,所述训练集用于训练预测模型,所述测试集用于验证预测模型的性能;提取模块:通过高分辨的计算机断层扫描勾勒出原始医学影像的病灶区域,并从病灶区域中提取影像组学特征,得到初步影像组学特征;筛选模块:对初步影像组学特征进行分析筛选,得到目标影像组学特征;预测模块:对训练集中的目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在验证集中验证模型;验证模块:确立采用放疗有效的影像组学特征标签,并在验证集中进行验证;评分模块:在预测模型的基础上计算每个患者的影像组学特征评分;换算模块:将患者的影像组学特征评分转化为患者放射治疗敏感性的概率。

优选地,所述提取模块中,所述影像组学特征包括一阶特征18个,形状特征14个,灰度共生矩阵特征24个,灰度相关矩阵特征14个,灰度游程矩阵特征16个,灰度区域大小矩阵特征16个,相邻灰度差分矩阵特征5个,共计107个特征。

优选地,所述筛选模块,具体包括:第一筛选单元:设定方差特征值,排除小于设定的方差阈值的特征;第二筛选单元:、使用单变量特征选择方法中的ANOVA(方差分析)算法,得到数据集中成像表型和治疗反应之间的关系,评估特征在治疗反应不同组间的差异,剔除训练组和验证组中显著性差异程度值@P值超过0.05的特征;第三筛选单元:采用适合高维数据回归运算的最小绝对值收敛和选择算子回归模型(LASSO)方法,从原始数据集中选取有效的预测特征,采用10倍交叉验证法计算最小均方误差,根据最小均方误差得到了选择算子回归模型的最佳惩罚参数;第四筛选单元:筛选出系数不为零的特征集。

优选地,所述机器学习的算法包括:逻辑蒂斯回归、支持向量机、随机森林、XGboost和k近邻(k-NN)算法。

一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求上项所述的一种基于CT影像组学的肺癌预后辅助评估方法。

本发明与现有技术相比具有以下有益效果:

在本申请实施例中,通过从原始医学影像的病灶区域中提取影像组学特征,得到初步影像组学特征,对初步影像组学特征进行分析筛选,得到目标影像组学特征;对目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在预测模型的基础上计算每个患者的影像组学特征评分,得到患者放射治疗敏感性的概率,达到了对放射治疗敏感性预先评估的目的,从而实现了辅助医生制定个性化的治疗方案,并辅助医生对病人的存活和复发时间进行评估,实现个体化及精准化医疗的技术效果,进而解决了由于不同肺癌患者异质性的差异造成的放疗疗效不敏感的技术问题。

附图说明

下面结合附图对本发明做进一步详细的说明;

图1为本发明实施例一提供的一种基于CT影像组学的肺癌预后辅助评估方法的流程示意图;

图2为本发明实施例一提供的一种基于CT影像组学的肺癌预后辅助评估系统的结构示意图;

图3为本发明实施例二提供的一种基于CT影像组学的肺癌预后辅助评估系统的结构示意图;

图4为本发明实施例一中影像组学特征评分与概率的换算表;

图中:101为预处理模块,102为分类模块,103为提取模块,104为筛选模块,1041为第一筛选单元,1042为第二筛选单元,1043为第三筛选单元,1044为第四筛选单元,105为预测模块,106为验证模块,107为评分模块,108为换算模块。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种基于CT影像组学的肺癌预后辅助评估方法,包括:S101、采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选;S102、把肺癌患者按比例随机分为训练集和验证集,所述训练集用于训练预测模型,所述测试集用于验证预测模型的性能;S103、通过高分辨的计算机断层扫描勾勒出原始医学影像的病灶区域,并从病灶区域中提取影像组学特征,得到初步影像组学特征;S104、对初步影像组学特征进行分析筛选,得到目标影像组学特征;S105、对训练集中的目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在验证集中验证模型;S106、确立采用放疗有效的影像组学特征标签,并在验证集中进行验证;S107、在预测模型的基础上计算每个患者的影像组学特征评分;S108、将患者的影像组学特征评分转化为患者放射治疗敏感性的概率。

具体地,采集接收放射治疗的肺癌患者的原始医学影像,把肺癌患者按比例随机分为训练集和验证集,训练集的原始医学影像是验证组中原始医学影像的2至4倍,通过高分辨的计算机断层扫描勾勒出原始医学影像的病灶区域,并从病灶区域中提取影像组学特征,经处理后得到目标影像组学特征,对训练集中的目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在验证集中验证模型,在预测模型的基础上计算每个患者的影像组学特征评分,从而得到患者放射治疗敏感性的概率,图4为影像组学特征评分与概率的换算表;本发明按照传统影像组学研究流程,对肺癌患者的肺部CT图像进行肿瘤区域的分割、特征提取、特征筛选并建立影像组学评估模型,结合患者临床信息,对患者的放疗效果进行定性和定量分析,从而辅助医生制定个性化的治疗方案,并辅助医生对病人的存活和复发时间进行评估,同时,对得到的影像组学评估模型的性能进行了验证,保证了影像组学评估模型的准确性。

所述根据高分辨的计算机断层扫描勾勒的病灶区域提取病灶轮廓,并从病灶轮廓中提取影像组学特征,得到初步影像组学特征,所述影像组学特征包括一阶特征18个,形状特征14个,灰度共生矩阵特征24个,灰度相关矩阵特征14个,灰度游程矩阵特征16个,灰度区域大小矩阵特征16个,相邻灰度差分矩阵特征5个,共计107个特征;具体地,灰度级区域大小矩阵量化图像中的灰度级区域,灰度区域定义为具有相同灰度强度的连接体素的数量;灰度行程矩阵量化了灰度游程,定义为像素个数的长度,以及具有相同灰度值的连续像素;灰度不均匀度测量图像中灰度强度值的变异性,较低的值表示强度值更均匀;较高的簇状阴影反映了平均值的不对称性。聚类突是灰度共生矩阵偏度和不对称度的度量,较高的值反映了平均值的不对称性,较低的值表示峰值在平均值附近,此时平均值临近的值变化较少,大面积区域分布是一个测量大面积区域分布的指标,较大的值表示较大的区域和较粗的纹理,高灰度长度分布计算较高灰度值长度的分布。

所述对初步影像组学特征进行分析筛选,得到目标影像组学特征,具体包括:S31、设定方差特征值,排除小于设定的方差阈值的特征;S32、使用单变量特征选择方法中的ANOVA(方差分析)算法,得到数据集中成像表型和治疗反应之间的关系,评估特征在治疗反应不同组间的差异,剔除训练组和验证组中显著性差异程度值@P值超过0.05的特征;S33、采用适合高维数据回归运算的最小绝对值收敛和选择算子回归模型(LASSO)方法,从原始数据集中选取有效的预测特征,采用10倍交叉验证法计算最小均方误差,根据最小均方误差得到了选择算子回归模型的最佳惩罚参数;S34、筛选出系数不为零的特征集。

所述采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选,具体包括:排除患有其他癌症的患者;排除接受过手治疗或放化疗但未完成完整治疗方案的患者;排除将缺乏高分辨率计算机断层扫描图像的患者;具体地,特发性肺纤维化,经临床症状、病原微生物检测证实的急性感染,肿瘤相关间质性肺病,药物相关的间质性肺病,尘肺、肺泡蛋白沉着病,缺乏HRCT数据,反复住院等情况下,对应患者的原始医学图像不进行处理,数据不采纳。

所述临床信息具体包括但不限于:年龄、性别、基础病、病理类型、TMN分期、初治前Hb、WBC平均水平、呼吸困难、咳嗽、咳痰和发热症状。

如图2所示,一种基于CT影像组学的肺癌预后辅助评估系统,包括:预处理模块101:采集使用放射治疗的肺癌患者的原始医学影像和临床信息并进行筛选;分类模块102:把肺癌患者按比例随机分为训练集和验证集,所述训练集用于训练预测模型,所述测试集用于验证预测模型的性能;提取模块103:通过高分辨的计算机断层扫描勾勒出原始医学影像的病灶区域,并从病灶区域中提取影像组学特征,得到初步影像组学特征;筛选模块104:对初步影像组学特征进行分析筛选,得到目标影像组学特征;预测模块105:对训练集中的目标影像组学特征运用机器学习的算法训练预测模型,构建影像组学评估模型,并在验证集中验证模型;验证模块106:确立采用放疗有效的影像组学特征标签,并在验证集中进行验证;评分模块107:在预测模型的基础上计算每个患者的影像组学特征评分;换算模块108:将患者的影像组学特征评分转化为患者放射治疗敏感性的概率。

所述提取模块103中,所述影像组学特征包括一阶特征18个,形状特征14个,灰度共生矩阵特征24个,灰度相关矩阵特征14个,灰度游程矩阵特征16个,灰度区域大小矩阵特征16个,相邻灰度差分矩阵特征5个,共计107个特征。

如图3所示,所述筛选模块104,具体包括:第一筛选单元1041:设定方差特征值,排除小于设定的方差阈值的特征;第二筛选单元1042:使用单变量特征选择方法中的ANOVA(方差分析)算法,得到数据集中成像表型和治疗反应之间的关系,评估特征在治疗反应不同组间的差异,剔除训练组和验证组中显著性差异程度值@P值超过0.05的特征;第三筛选单元1043:采用适合高维数据回归运算的最小绝对值收敛和选择算子回归模型(LASSO)方法,从原始数据集中选取有效的预测特征,采用10倍交叉验证法计算最小均方误差,根据最小均方误差得到了选择算子回归模型的最佳惩罚参数;第四筛选单元1044:筛选出系数不为零的特征集。

一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上所述的基于CT影像组学的肺癌预后辅助评估方法。

处理器可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。

存储器可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器可以运行程序指令,以实现上文的本申请的各个实施例的存储授权变更方法中的步骤以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如光线强度、补偿光强度、滤光片的位置等信息。

一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的一种基于CT影像组学的肺癌预后辅助评估方法。

计算机可读存储介质可以采用一个或多个可读介质的任意组合,可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器((RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 一种基于CT影像组学的肺癌预后辅助评估方法及系统
  • 一种基于增强MRI影像组学的鼻咽癌预后辅助评估方法
技术分类

06120112898208