掌桥专利:专业的专利平台
掌桥专利
首页

适用于肿瘤患者的骨髓抑制风险预测方法、装置及存储介质

文献发布时间:2023-06-19 12:21:13


适用于肿瘤患者的骨髓抑制风险预测方法、装置及存储介质

技术领域

本发明涉及骨髓抑制检测技术,尤其涉及一种适用于肿瘤患者的骨髓抑 制风险预测方法、装置及存储介质。

背景技术

骨髓抑制是指肿瘤患者在接受化学治疗和放射治疗以及其它抗肿瘤治疗 方法时,骨髓中的造血干细胞的活性降低,通常表现为血液中的红细胞、白 细胞、中性粒细胞、血小板含量低于正常值。其确诊方法通常主要依靠血常 规检查,一般根据血液中的血细胞含量可以将骨髓抑制定性分为四种,包括 等级1、2、3、4级,其中3级及以上的骨髓抑制反应需要给予干预性治疗。 当前,骨髓抑制预测的准确性较低。

发明内容

本发明实施例提供一种适用于肿瘤患者的骨髓抑制风险预测方法、装置 及存储介质,能够有效的对骨髓抑制进行预测,并对患者提供一种最优的治 疗方案,实用性较高。

本发明实施例的第一方面,提供一种适用于肿瘤患者的骨髓抑制风险预 测方法,包括:

获取患者的不同病历数据,对所述不同病历数据分别进行结构化处理后 得到相应的指标信息,对所述指标信息进行量化处理;

基于入院时间和\或检查时间对患者的多个指标信息模块化处理,得到多 个不同时间的指标模块,其中每个指标模块分别包括一个或多个指标信息;

将所述指标模块以及患者当前的治疗信息分别输入至预先训练的深度学 习模型,得到的骨髓抑制患者的骨髓抑制风险预测结果。

可选地,在第一方面的一种可能实现方式中,还包括:

获取当前患者的检查信息和个人信息;

遍历数据库,获取数据库中与当前患者的检查信息和个人信息最相似的 患者;

若判断最相似的患者未发生骨髓抑制和\或发生轻度骨髓抑制,则将最相 似的患者的治疗方案输出。

可选地,在第一方面的一种可能实现方式中,将所述指标模块以及患者 当前的治疗信息分别输入至预先训练的深度学习模型,得到患者的骨髓抑制 风险预测结果包括:

基于以下公式获得风险预测结果,

其中,h(X)为预测结果,x为不同病历中所获得的指标信息,W为不同指 标信息的权重,b为常数。

可选地,在第一方面的一种可能实现方式中,还包括对所述深度学习模 型的训练方法,包括:

基于以下公式计算模型的损失函数:

其中,h为预测结果,y为数据真实结果;

基于以下公式更新模型参数:

其中,x为不同病历中所获得的指标信息,h为预测结果,W为不同 指标信息的权重,E为真实标签和预测结果之间的差距,即损失。

可选地,在第一方面的一种可能实现方式中,所述深度学习模型包括 至少4个子模型,所述4个子模型用于分别对患者放化疗后的血红蛋白、 血小板、中性粒细胞以及白细胞的变化值回归预测;

基于所述变化值结合患者放化疗前的血红蛋白、血小板、中性粒细胞 以及白细胞的值得到相应的相对变化值以及置信度;

基于所述血红蛋白、血小板、中性粒细胞、白细胞的变化值以及置信 度获得抑制风险预测结果。

本发明实施例的第二方面,提供一种适用于肿瘤患者的骨髓抑制风险预 测装置,包括:

结构化-预处理单元,用于获取患者的不同病历数据,对所述不同病历数 据分别进行结构化处理后得到相应的指标信息,对所述指标信息进行量化处 理;

模块化单元,用于基于入院时间和\或检查时间对患者的多个指标信息模 块化处理,得到多个不同时间的指标模块,其中每个指标模块分别包括一个 或多个指标信息;

风险预测单元,用于将所述指标模块以及患者当前的治疗信息分别输入 至预先训练的深度学习模型,得到的骨髓抑制患者的骨髓抑制风险预测结果。

可选地,在第二方面的一种可能实现方式中,还包括:

信息获取模块,用于获取当前患者的检查信息和个人信息;

患者获取模块,用于遍历数据库,获取数据库中与当前患者的检查信息 和个人信息最相似的患者;

治疗方案输出模块,用于若判断最相似的患者未发生骨髓抑制和\或发生 轻度骨髓抑制,则将最相似的患者的治疗方案输出。

可选地,在第二方面的一种可能实现方式中,所述风险预测单元还用于 执行以下步骤,包括:

基于以下公式获得风险预测结果,

其中,h(X)为预测结果,x为不同病历中所获得的指标信息,W为不同指 标信息的权重,b为常数。

可选地,在第二方面的一种可能实现方式中,还包括模型训练单元,所 述模型训练单元用于执行以下步骤,包括:

基于以下公式计算模型的损失函数:

其中,h为预测结果,y为数据真实结果;

基于以下公式更新模型参数:

其中,x为不同病历中所获得的指标信息,h为预测结果,W为不同 指标信息的权重,E为真实标签和预测结果之间的差距,即损失。

本发明实施例的第四方面,提供一种可读存储介质,所述可读存储介质 中存储有计算机程序,所述计算机程序被处理器执行时用于实现本发明第一 方面及第一方面各种可能设计的所述方法。

本发明提供的一种适用于肿瘤患者的骨髓抑制风险预测方法、装置及存 储介质,可以在癌症患者接受放化疗之前,根据患者基本信息、血常规、肝 功能及其他内分泌检查指标,预测出该患者在接受相应放化疗肿瘤治疗之后, 发生骨髓抑制的风险。并可以帮助医生提前做好预防手段,提供发生骨髓抑 制风险较低的相应治疗方案,减轻患者治疗痛苦,节省治疗成本、治疗时间, 为患者提供更加安全有效地治疗。

本发明在通过患者治疗前各项身体检查指标,结合深度学习及集成学习 等多种人工智能算法建立骨髓抑制风险预测分析模型及治疗方案推荐模型, 对该患者在接受当前治疗方案下,发生骨髓抑制风险的概率进行预测及低风 险治疗方案的推荐。

附图说明

图1为适用于肿瘤患者的骨髓抑制风险预测方法的流程图;

图2为适用本方法的模块示意图

图3为患者指标信息模块化的示意图;

图4为模型整体路径的示意图;

图5为抑制预测结果的可视化逻辑图;

图6为适用于肿瘤患者的骨髓抑制风险预测装置的结构图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发 明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述, 显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。 基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下 所获得的所有其他实施例,都属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、 “第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述 特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换, 以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的 顺序实施。

应当理解,在本发明的各种实施例中,各过程的序号的大小并不意味着 执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对 本发明实施例的实施过程构成任何限定。

应当理解,在本发明中,“包括”和“具有”以及他们的任何变形,意 图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、 系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有 清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解,在本发明中,“多个”是指两个或两个以上。“和/或”仅仅 是一种描述关联对象的关联关系,表示可以存在三种关系,例如,和/或B, 可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/” 一般表示前后关联对象是一种“或”的关系。“包含A、B和C”、“包含A、 B、C”是指A、B、C三者都包含,“包含A、B或C”是指包含A、B、C三者 之一,“包含A、B和/或C”是指包含A、B、C三者中任1个或任2个或3 个。

应当理解,在本发明中,“与A对应的B”、“与A相对应的B”、“A 与B相对应”或者“B与A相对应”,表示B与A相关联,根据A可以确定B。 根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其他信息确 定B。A与B的匹配,是A与B的相似度大于或等于预设的阈值。

取决于语境,如在此所使用的“若”可以被解释成为“在……时”或“当…… 时”或“响应于确定”或“响应于检测”。

下面以具体地实施例对本发明的技术方案进行详细说明。下面这几个具 体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例 不再赘述。

本发明提供一种适用于肿瘤患者的骨髓抑制风险预测方法,如图1和图 2所示,包括:

步骤S10、获取患者的不同病历数据,对所述不同病历数据分别进行结 构化处理后得到相应的指标信息,对所述指标信息进行量化处理。在步骤S10 中,包括了对病历数据进行结构化处理以及得到指标信息对指标进行量化的 步骤。

通常患者病历数据在医院系统中存储格式为的非结构化数据,要想对这 些数据进行有效地管理利用,需要对其进行结构化处理,方便后续模型特征 提取及标准化。

在一个实施例中,医院HIS系统中的病历存在大量描述性的语句,例如 “XX患者在XX年XX月XX日在本医院进行病理切片手术,结果为(左上肺肿 物)肺微浸润性腺癌——肿瘤最大径0.7cm;未见胸膜及脉管侵犯。免疫组 (2#):ALK(-)、ALK阴性对照(-)、ROS-1(-)、PD-1(肿瘤细胞-,免疫细胞约3%+)、 PD-L1(肿瘤细胞-,免疫细胞-,抗体克隆号为SP142)。”本发明需要提取其中 关键信息,如时间、手术信息、疾病类型、癌变组织特征等信息,并将这些 信息录入数据库变成可查询,可编辑,可用性很高的数据。

在对指标信息进行量化前,还包括数据预处理步骤。其中数据预处理包 含数据筛选、数据检查名称对齐(数据标准化),缺失值填充,文本特征向 量化。数据筛选是本发明的一个技术难点,在患者进行的多次放化疗及检查 指标中选择合适时间节点的指标及治疗方案作为输入特征进行模型训练预测 至关重要,该部分直接决定了系统进行骨髓移植的效果。

本发明选择患者放化疗前7天的检查指标作为输入,放化疗结束后30天 内的血常规检查作为模型需要学习的标签。但是患者的这些检查往往分布在 多次病历中,需要按时间将病历进行排序,在多份病历中获取需要的指标信 息。

对于患者各项检查指标,不同医院有自己不同的病历录入规则,因此同 一个检查指标的名称及单位在不同医院会有多种表达形式,因此需要对这些 指标进行统一的标准化才能供后续分析使用。例如,最常见的身高,有些医 院以米为单位,有些医院以厘米单位,就需要将其同一单位;另外,对于一 个检查,如“胆红素(BIL)-静脉血”,在一些医院叫这个名称,在另一些医 院有可能叫“总胆红素”、“BIL”这些名称,都需要统一到一个相同的名称 上。

在实际的场景中,一个患者只会进行特定的检查项目,并不会进行所有 的检查,因此对于各个患者都存在有些检查指标缺失的情况,对于这些缺失 的指标,需要对其进行一定的填充,常见的填充方法有均值填充、固定值填 充等。均值填充就是以所有患者某一检查项已有值的均值填充在某一患者该 检查项确实的位置,固定值填充是指将检查项的缺失值填充为该项的正常值。 本发明可以任意采用多种填充方法,不进行限定。

通常患者病历中存在着相对价值较高的文本特征信息,例如主诉、症状 等、文本特征并不能直接放入模型进行训练,需要对其进行数字化编码,即 向量化。

步骤S20、基于入院时间和\或检查时间对患者的多个指标信息模块化处 理,得到多个不同时间的指标模块,其中每个指标模块分别包括一个或多个 指标信息。

指标信息模块化处理是指将患者数据按照其检查类型进行模块化归类。 通常一个患者会有多次入院病历,每份病历对应着多次不同检查。为了更好 的利用管理这些数据,需要按照患者入院时间及检查时间不同对这些检查指 标进行模块化分类。对于患者不同时期不同类型的入院检查指标,将其按照 检查方式及类别划分为多个模块,供模型预测分析使用。如图3所示患者指 标信息模块化后的示意图。

步骤S30、将所述指标模块以及患者当前的治疗信息分别输入至预先训 练的深度学习模型,得到的骨髓抑制患者的骨髓抑制风险预测结果。

在步骤中,还包括:

将所述指标模块以及患者当前的治疗信息分别输入至预先训练的深度学 习模型,得到的骨髓抑制患者的骨髓抑制风险预测结果包括:

风险预测本申请采用的是MLP深度学习模型,其用前向传播获得预测 值,并使用反向传播更新模型参数。前向传播公式如下:

其中,h(X)为预测结果,x为不同病历中所获得的指标信息,W为不 同指标信息的权重,b为常数。

在一个实施例中,深度学习模型包括至少4个子模型,所述4个子模 型用于分别对患者放化疗后的血红蛋白、血小板、中性粒细胞以及白细胞 的变化值回归预测;基于所述变化值结合患者放化疗前的血红蛋白、血小 板、中性粒细胞以及白细胞的值得到相应的相对变化值以及置信度;基于 所述血红蛋白、血小板、中性粒细胞、白细胞的变化值以及置信度获得抑 制风险预测结果。

本申请的深度学习模型(风险预测模型)的输入为模块化好的患者各 项检查指标和当前治疗方案,输出为血常规结果相对变化值和置信度。血 常规检查有血红蛋白、血小板、中性粒细胞、白细胞等四个检查项,对骨 髓抑制进行风险预测就是对患者放化疗后这四个检查项的变化值进行回 归预测,所以骨髓抑制风险预测模型包含四个预测模型,每个模型预测一 个血常规检查项。

本发明根据不同的血常规检查项的特点分别设计不同的深度学习回归 算法模型。如血红蛋白指标预测模型网络的宽度为128,正负样本损失函 数权重0.6:0.4,以适应血红蛋白数据正负样本比例相对平衡的特点;类 似地,根据不同指标预测模型数据特点,其他三个预测模型网络宽度和正 负样本损失函数权重也各不一样。

当这四个深度学习模型预测得到放化疗后患者的血常规四个检查指标 的相对变化值,加上放化疗前的这四个检查指标的值即可得到放化疗后的 值,在输出相对变化值的同时模型也会输出此变化值的置信度。在医学上 根据血常规中血红蛋白、血小板、中性粒细胞、白细胞这4个指标的值在 不同的区间给骨髓抑制划分不同的等级,例如血红蛋白低于110为1级抑 制,低于95为2级抑制,低于80为3级抑制,低于65为4级抑制,其 他三个也有类似的区间来确定抑制等级。

模型预测出各个指标的放化疗后的值以后,按照医学上这个规则即可 确定各个指标的骨髓抑制等级,而总的骨髓抑制等级以最严重的为准。另 外,模型置信度是衡量模型输出准确率的指标,置信度的大小与患者检查 类型即模块的齐全度呈正相关,模块越齐全,置信度越高。模型整体路径 如图4所示。

在一个实施例中,还包括对所述深度学习模型的训练方法,包括:

基于以下公式计算模型的损失函数:

其中,h为预测结果,y为数据真实结果;

基于以下公式更新模型参数:

其中,x为不同病历中所获得的指标信息,h为预测结果,W为不同 指标信息的权重,E为真实标签和预测结果之间的差距,即损失。

在一个实施例中,还包括:

步骤S40、获取当前患者的检查信息和个人信息;

步骤S50、遍历数据库,获取数据库中与当前患者的检查信息和个人信 息最相似的患者;

步骤S60、若判断最相似的患者未发生骨髓抑制和\或发生轻度骨髓抑制, 则将最相似的患者的治疗方案输出。

其中步骤S40至步骤S60中,基于预先设置的治疗方案推荐模型完成。

治疗方案推荐模型采用的是深度学习模型限制玻尔兹曼机(RBM),其参数 优化过程同MLP。此模型可根据患者的情况推荐不会引起该患者骨髓抑制的 最优治疗方案。该模型的输入为模块化好的患者各项检查指标,通过推荐算 法推荐本发明数据库中各项检查指标类似但放化疗后未发生骨髓抑制或发生 轻度骨髓抑制的患者的治疗方案以供医生进行参考选择。该部分所使用的算 法为协同过滤,其能基于当前患者的各项身体检查结果和个人情况自动适配 数据库中相似患者,并筛选出他们中未发生骨髓抑制或发生轻度骨髓抑制的 治疗方案。

例如,当前患者的年龄55,性别男,放化疗前血红蛋白浓度120等等, 该算法会在数据库中自动匹配年龄段相同(50-60),性别相同,放化疗前 血红蛋白浓度110-130的患者(这里当然也包括其他检查指标相近),并给 出他们中放化疗后未发生骨髓抑制或发生轻度骨髓抑制的治疗方案。同时本 发明还会分别训练缺失某一大类检查项(模块)下的置信度,得到缺失不同 检查模块下的置信度减少值,从而告诉医生补充哪些检查能提高置信度。

如图5所示为抑制预测结果的可视化逻辑图,本发明可以根据现有患者 基本信息及各项检查信息,预测患者接受当前治疗方案后的各项血常规指标 相对于治疗前的相对变化值,并给出当前治疗方案发生骨髓抑制的等级及置 信度。如果医生想要提高结果置信度,还会提示医生补充所推荐的检查指标 以提升预测结果置信度。

本发明还克服了现有技术中的以下技术难点:

1.患者病历中通常包含多种模块的检查信息,模块内及模块间检查指标 的存储格式多种多样,例如文本、浮点、布尔及选项特征等,本发明需要将 这些多模态特征提取对齐,才能供后续的模型开发使用,针对这些不同类型 的特征需要用到多种不同的数据预处理方法。

2.患者在医院内可能有着多次的住院经历及多次检查放化疗,长时间跨 度的检查指标与放化疗治疗方案会影响本发明对患者骨髓抑制风险的预测准 确度,因此在患者进行的多次放化疗及检查指标中选择合适时间节点的指标 及治疗方案,对于模型训练预测至关重要。

3.由于本发明既要实现发生骨髓抑制的风险预测,又要针对患者当前的 身体状况推荐合适的治疗方案。运用单一的模型框架很难同时满足风险预测 及方案推荐系统设计需求,因此需要结合深度学习及集成学习方法多模型融 合预测提高模型整体泛化能力减小误差。

本发明还提供一种适用于肿瘤患者的骨髓抑制风险预测装置,如图6所 示,包括:

结构化-预处理单元,用于获取患者的不同病历数据,对所述不同病历数 据分别进行结构化处理后得到相应的指标信息,对所述指标信息进行量化处 理;

模块化单元,用于基于入院时间和\或检查时间对患者的多个指标信息模 块化处理,得到多个不同时间的指标模块,其中每个指标模块分别包括一个 或多个指标信息;

风险预测单元,用于将所述指标模块以及患者当前的治疗信息分别输入 至预先训练的深度学习模型,得到的骨髓抑制患者的骨髓抑制风险预测结果。

在一个实施例中,还包括:

信息获取模块,用于获取当前患者的检查信息和个人信息;

患者获取模块,用于遍历数据库,获取数据库中与当前患者的检查信息 和个人信息最相似的患者;

治疗方案输出模块,用于若判断最相似的患者未发生骨髓抑制和\或发生 轻度骨髓抑制,则将最相似的患者的治疗方案输出。

在一个实施例中,所述风险预测单元还用于执行以下步骤,包括:

基于以下公式获得风险预测结果,

其中,h(X)为预测结果,x为不同病历中所获得的指标信息,W为不同指 标信息的权重,b为常数。

在一个实施例中,还包括模型训练单元,所述模型训练单元用于执行以 下步骤,包括:

基于以下公式计算模型的损失函数:

基于以下公式更新模型参数:

其中,x为不同病历中所获得的指标信息,h为预测结果,W为不同 指标信息的权重,E为真实标签和预测结果之间的差距,即损失。

其中,可读存储介质可以是计算机存储介质,也可以是通信介质。通 信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。计 算机存储介质可以是通用或专用计算机能够存取的任何可用介质。例如, 可读存储介质耦合至处理器,从而使处理器能够从该可读存储介质读取信 息,且可向该可读存储介质写入信息。当然,可读存储介质也可以是处理 器的组成部分。处理器和可读存储介质可以位于专用集成电路(Application Specific Integrated Circuits,简称:ASIC)中。另外, 该ASIC可以位于用户设备中。当然,处理器和可读存储介质也可以作为 分立组件存在于通信设备中。可读存储介质可以是只读存储器(ROM)、 随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

本发明还提供一种程序产品,该程序产品包括执行指令,该执行指令存 储在可读存储介质中。设备的至少一个处理器可以从可读存储介质读取该执 行指令,至少一个处理器执行该执行指令使得设备实施上述的各种实施方式 提供的方法。

在上述终端或者服务器的实施例中,应理解,处理器可以是中央处理单 元(英文:Central Processing Unit,简称:CPU),还可以是其他通用处 理器、数字信号处理器(英文:Digital Signal Processor,简称:DSP)、 专用集成电路(英文:Application SpecificIntegrated Circuit,简称: ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处 理器等。结合本发明所公开的方法的步骤可以直接体现为硬件处理器执行完 成,或者用处理器中的硬件及软件模块组合执行完成。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对 其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通 技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改, 或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并 不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

相关技术
  • 适用于肿瘤患者的骨髓抑制风险预测方法、装置及存储介质
  • 一种配电终端的模块化风险预测方法、装置及可存储介质
技术分类

06120113268379