掌桥专利:专业的专利平台
掌桥专利
首页

一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术

文献发布时间:2023-06-19 10:11:51


一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术

技术领域

本发明涉及一种癌分子特征预测,特别涉及一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术,属于细胞处理技术领域。

背景技术

随着精准肿瘤学的发展,组织病理学图像已经成为肿瘤的诊断分级分期的金标准。与此同时,包括基因组学、转录组学和蛋白质组学在内的组学图谱正在成为常规鉴别肿瘤特征的方法,并用于生存期预测,但是对于病理图像的定量研究以及其巨大的潜在运用价值并没有被完全开发,在肾透明细胞癌中,这方面技术是一片空白。

现有技术对病理图片的分析只能通过肉眼直观感受,大量信息被忽略的同时,肉眼直观的结果也无法量。已有用基因,转录或者蛋白组学预测患者的模型。但是这些模型都需要患者的测序数据,需要大量金钱以及相对长的等待时间。

本发明用一种有高效率、一致性和成本效益高的自动化方法分析肾透明细胞癌的细胞基本以及高阶特征(包括细胞形态,大小,核大小,胞质密度灰度以及细胞邻近关系等),基于这些细胞特征,运用机器学习方法预测肾透明细胞癌的突变,分子亚型以及预后,此外,对于已有基因组学、转录组学和蛋白质组学的数据的患者,我们将病理图片特征与这些数据整合,能显著提高预后能力。

这项技术具有经济高效等特点,并能和患者的其他组学数据进行良好的整合,解决了病理图片的定量以及运用技术难题。此外,这项技术的基础框架也可推广在其他癌症类型中运用,具有较大的运用潜力。

发明内容

本发明的目的在于提供一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术,以解决上述背景技术中提出的、、、的问题。

为实现上述目的,本发明提供如下技术方案:一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术,所述肾透明细胞癌分子特征预测以及预后判断技术包括以下部分:

第一部分:病理图片的特征提取;

第二部分:病理图片预测患者的分子特征;

第三部分:单一病理图片以及病理图片整合多组学预测患者生存期;

作为本发明的一种优选技术方案,所述第一部分的具体操作步骤如下:

S1:采用开源编程软件Python读取病理图片,并将其切割成1000像素*1000像素的小切片;

S2:采用Python每个病人随机选择20张小切片并输出保存在各个病人的相应文件夹;

S3:采用开源软件CellProfiler将每个病人相应的20张小病理切片进行特征提取;

作为本发明的一种优选技术方案,步骤S3中,20张小病理切片中每张图片能提取出包括细胞形态、大小、核大小、胞质密度灰度以及细胞邻近关系等593种特征,采用这20张图片的每个特征的平均值代表这个病人此项特征,通过此操作,能将每位患者的病理图片提取出总共593种特征。

作为本发明的一种优选技术方案,所述第二部分的具体操作步骤如下:

第一步骤:采用开源编程软件Python对上述的病人的593种病理特征进行突变以及分子亚型预测;

第二步骤:使用随机森林算法对病人的病理图片特征进行选择,采用随机森林算法进一步将选择的特征进行突变以及分子亚型的分类建模。

作为本发明的一种优选技术方案,第二步骤中,分类建模后,所述模型能有效的通过病理图片特征预测肾透明细胞癌患者的重要突变(VHL,BAP1,PBRM1,SETD2)状态以及分子亚型(基底型,间质型,经典型,非典型)归属。

作为本发明的一种优选技术方案,所述第三部分的具体操作步骤如下:

a.采用开源编程软件R进行患者预后分析;

b.通过开源编程软件R实现随机生存森林模型,输入病人病理图片特征,能高精度输出病人的预后风险评分。

作为本发明的一种优选技术方案,步骤b中,通过预后风险评分,能精准预测患者1年、3年和5年生存概率,与此同时,结合患者其他组学,如基因组学、转录组学和蛋白组学等数据,可进一步提高该评分的准确性。

与现有技术相比,本发明的有益效果是:

本发明一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术,本发明能快速经济的量化患者病理图片,预测患者重要的突变状态,分子亚型归属以及生存时,对于已有基因,转录或者蛋白组学数据的患者,本技术能快速经济并且更精准的判断患者生存时间。

附图说明

图1为本发明的结构示意图;

图2为本发明中病理图片特征提取流程结构示意图;

图3为本发明CellProfiler特征提取流程的结构示意图;

图4为本发明病理图片特征预测患者分子特征流程的结构示意图;

图5为本发明病理图片特征预测患者生存期流程的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1-5,本发明提供了一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术的技术方案:一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术,肾透明细胞癌分子特征预测以及预后判断技术包括以下部分:

第一部分:病理图片的特征提取;

第二部分:病理图片预测患者的分子特征;

第三部分:单一病理图片以及病理图片整合多组学预测患者生存期;

第一部分的具体操作步骤如下:

S1:采用开源编程软件Python读取病理图片,并将其切割成1000像素*1000像素的小切片;

S2:采用Python每个病人随机选择20张小切片并输出保存在各个病人的相应文件夹;

S3:采用开源软件CellProfiler将每个病人相应的20张小病理切片进行特征提取;

步骤S3中,20张小病理切片中每张图片能提取出包括细胞形态、大小、核大小、胞质密度灰度以及细胞邻近关系等593种特征,采用这20张图片的每个特征的平均值代表这个病人此项特征,通过此操作,能将每位患者的病理图片提取出总共593种特征。

第二部分的具体操作步骤如下:

第一步骤:采用开源编程软件Python对上述的病人的593种病理特征进行突变以及分子亚型预测;

第二步骤:使用随机森林算法对病人的病理图片特征进行选择,采用随机森林算法进一步将选择的特征进行突变以及分子亚型的分类建模。

第二步骤中,分类建模后,所述模型能有效的通过病理图片特征预测肾透明细胞癌患者的重要突变(VHL,BAP1,PBRM1,SETD2)状态以及分子亚型(基底型,间质型,经典型,非典型)归属。

第三部分的具体操作步骤如下:

a.采用开源编程软件R进行患者预后分析;

b.通过开源编程软件R实现随机生存森林模型,输入病人病理图片特征,能高精度输出病人的预后风险评分。

步骤b中,通过预后风险评分,能精准预测患者1年、3年和5年生存概率,与此同时,结合患者其他组学,如基因组学、转录组学和蛋白组学等数据,可进一步提高该评分的准确性。

根据图1-3所示,开源编程软件Python的版本为3.6.3,开源软件CellProfiler的版本为2.2.0,开源编程软件R的版本为3.5.3。

根据图1所示,具体的,此技术分主要分为三步:1)病理图片特征提取;2)病理图片特征预测患者分子特征;3)病理图片特征预测患者生存期;

根据图2所示,具体的,病理图片特征提取流程分为以下几步:

1.将患者病理图片作为输入,整张病理图片通过编程软件Python的OpenSlide库读取,并切割成1000像素*1000像素的病理小切片,从这些小切片中随机选择20张,用作后续分析。

2.通过CellProfiler软件将上述20张小切片的593种特征提取,并取平均值汇总。

根据图3所示,具体的,CellProfiler特征提取流程如下:

1.图像处理,将20张小切片作为输入,图像处理包括图像输入,颜色校正,明度校正,灰度校正步骤。

2.将上述20张已处理的小切片作为输入,通过CellProfiler编写物体识别模块,先识别细胞核,接着细胞体以及细胞质识别。

3.将上述以识别的细胞作为输入,通过CellProfiler编写特征提取模块,提取病人细胞的593特征,包括基本以及高阶特征(包括细胞形态,大小,核大小,胞质密度灰度以及细胞邻近关系等)。

根据图4所示,具体的,病理图片特征预测患者分子特征流程:

1.将已提取的病人病理图片特征作为输入,通过编程软件Python的random库进行随机森林算法筛选特征。

2、将上步提取出的重要特征作为输入,采用编程软件Python的random库已构建完成的随机森林算法模型,对患者的重要突变状态以及分子亚型归属进行预测。

根据图5所示,具体的,病理图片特征预测患者生存期流程:

1.将病人的593种病理特征作为输入,通过编程软件R的randomForestSRC包已构建完成的随机生存森林算法模型,输出患者的病人疾病风险得分以及1,3,5年分别的生存概率。

2.将病人的的593种病理特征与其他组学数据(包括基因组学,蛋白组学,转录组学)作为输入,能输出一个更精准的病人疾病风险得分,以及更准确的1,3,5年生存概率。

其中,编程软件Python以及R可由MATLAB、C++、Java等编程语言替代。

在本发明的描述中,需要理解的是,指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

在本发明中,除非另有明确的规定和限定,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术
  • 一种基于病理图片的肾透明细胞癌分子特征预测以及预后判断技术
技术分类

06120112454436