掌桥专利:专业的专利平台
掌桥专利
首页

一种基于肺结节预测概率的健康管理方法及其相关设备

文献发布时间:2024-04-18 19:58:26


一种基于肺结节预测概率的健康管理方法及其相关设备

技术领域

本申请涉及人工智能技术和数据医疗领域,尤其涉及一种基于肺结节预测概率的健康管理方法及其相关设备。

背景技术

医院信息化是大势所趋,当前医院基础配置已支持了医疗信息数据,但电子病例存在大量非结构化的描述,缺乏数据治理的能力、数据与知识之间的关联能力,无法直接应用大数据与人工智能能力。需要通过科学的数据分析和挖掘将自由文本转换成规范化、标准化和结构化的数据,并对其加以分析利用。

传统医疗场景的CT(Computed Tomography,电子计算机断层扫描)影像文字报告存在大量专业性描述,由于病人对医学知识不够了解、不懂医学术语,导致患者对影像报告诊断理解上存在困难。特别是报告异常时,很容产生一定的焦虑情绪。由于病人不能获得便捷的自诊服务,无法正确判断当前的身体健康状况。可能还存在部分轻症患者不放心导致的“过度医疗”,部分高危病人未引起重视导致病情延误等医疗资源错配情况。

另外,在门诊短时间内,医生可能无法充分向患者解释病情,那病人很有可能受到网络上错误的医疗信息引导,会让患者压力倍增,浪费大量的人力、物力、财力,且无法最大限度地得到医疗保健服务。

发明内容

本申请实施例的目的在于提出一种基于肺结节预测概率的健康管理方法、装置、计算机设备及存储介质,以解决现有技术中患者对影像报告诊断理解上存在困难,无法正确判断当前的身体健康状况,且容易受到误导,无法最大限度地得到医疗保健服务的技术问题。

为了解决上述技术问题,本申请实施例提供一种基于肺结节预测概率的健康管理方法,采用了如下所述的技术方案:

获取目标患者的待测CT影像报告数据,从所述待测CT影像报告数据中提取目标基础信息和目标肺结节特征信息;

基于构建好的肺结节概率预测模型,从所述目标基础信息和所述目标肺结节特征信息中获得目标肺结节风险因子;

将所述目标肺结节风险因子输入所述肺结节概率预测模型,得到肺结节预测概率;

基于所述预测概率确定所述目标患者的肺结节风险等级;

根据所述风险等级为所述目标患者匹配相应的健康管理方案,并将所述健康管理方案发送给所述目标患者。

进一步的,在所述获取目标患者的待测CT影像报告数据的步骤之前还包括:

获取历史CT影像文字报告数据,从所述历史CT影像文字报告数据中提取患者的基础信息和历史肺结节特征信息;

对所述历史肺结节特征信息进行实体关系标注,得到实体关系标注数据;

基于所述实体关系标注数据训练得到实体关系联合抽取模型;

根据所述基础信息获取所述患者的最新CT影像报告数据,将所述最新CT影像报告数据输入所述实体关系联合抽取模型进行实体关系抽取,得到肺部实体关系;

基于所述基础信息和所述肺部实体关系,利用Logistics回归获得肺结节概率预测模型。

进一步的,所述基于所述实体关系标注数据训练得到实体关系联合抽取模型的步骤包括:

将所述实体关系标注数据按照预设比例划分为训练集和测试集;

将所述标注数据训练集输入预构建初始模型,输出预测实体关系三元组;

根据所述预测实体关系三元组和所述训练集中的实体关系计算损失函数;

基于所述损失函数调整所述初始模型的模型参数,直至模型收敛,输出待验证模型;

将所述测试集输入所述待验证模型进行验证,得到验证结果;

在所述验证结果符合预设条件时,输出最终的实体关系联合抽取模型。

进一步的,所述初始模型包括输入层、编码层、头实体识别层以及关系与尾实体联合识别层,所述将所述标注数据训练集输入预构建初始模型,输出预测实体关系三元组的步骤包括:

通过所述输入层将所述训练集传输至所述编码层进行特征提取,获得含有上下文语义信息的词编码向量;

将所述词编码向量输入所述头实体识别层进行识别,输出所有头实体;

将每个所述头实体与对应的所述词编码向量进行融合,得到每个所述头实体的实体编码向量;

将所述实体编码向量输入所述关系与尾实体联合识别层进行识别,得到每个所述头实体的所有特定关系和尾实体;

基于所述头实体、所述特定关系和所述尾实体得到预测实体关系三元组。

进一步的,所述将所述词编码向量输入所述头实体识别层进行识别,输出所有头实体的步骤包括:

通过所述头实体识别层计算所述词编码向量分别作为开始位置和结束位置的概率,得到第一开始概率和第一结束概率;

根据所述第一开始概率和所述第一结束概率,利用最近匹配原则得到所有头实体。

进一步的,所述将每个所述头实体与对应的所述词编码向量进行融合,得到每个所述头实体的实体编码向量的步骤包括:

获取每个所述头实体中每个词对应的所述词编码向量,得到实体词编码向量;

计算所有所述实体词编码向量的平均向量,并将所述头实体和所述平均向量进行融合,得到实体编码向量。

进一步的,所述基于所述基础信息和所述肺部实体关系,利用Logistics回归获得肺结节概率预测模型的步骤包括:

基于所述基础信息获取基础影响因素,并从所述肺部实体关系中提取肺部异常影响因素;

将所述基础影响因素和所述肺部异常影响因素作为肺结节风险因子,利用Logistics回归对所述肺结节风险因子进行分析,得到每个所述肺结节风险因子的回归系数;

根据所述回归系数获得肺结节概率预测模型。

为了解决上述技术问题,本申请实施例还提供一种基于肺结节预测概率的健康管理装置,采用了如下所述的技术方案:

提取模块,用于获取目标患者的待测CT影像报告数据,从所述待测CT影像报告数据中提取目标基础信息和目标肺结节特征信息;

获取模块,用于基于构建好的肺结节概率预测模型,从所述目标基础信息和所述目标肺结节特征信息中获得目标肺结节风险因子;

概率预测模块,用于将所述目标肺结节风险因子输入所述肺结节概率预测模型,得到肺结节预测概率;

等级判断模块,用于基于所述预测概率确定所述目标患者的肺结节风险等级;

匹配模块,用于根据所述风险等级为所述目标患者匹配相应的健康管理方案,并将所述健康管理方案发送给所述目标患者。

为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:

该计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的基于肺结节预测概率的健康管理方法的步骤。

为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:

所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的基于肺结节预测概率的健康管理方法的步骤。

与现有技术相比,本申请实施例主要有以下有益效果:

本申请通过构建好的肺结节概率预测模型来预测患者的肺结节概率,用肺结节概率来评估患者的肺结节风险等级,使得患者更为直观地了解自身的健康状况,降低患者的焦虑程度;根据风险等级和基础信息为患者匹配相应的健康管理方案,实现患者的个体化管理,提升治疗效率,同时,最大限度地保证患者得到医疗保健服务,降低医疗滥用,减少手术滥用,避免大量人力、物力、财力的浪费。

附图说明

为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请可以应用于其中的示例性系统架构图;

图2是根据本申请的基于肺结节预测概率的健康管理方法的一个实施例的流程图;

图3是根据本申请的基于肺结节预测概率的健康管理方法的另一个实施例的流程图;

图4是图3中步骤S303的一种具体实施方式的流程图;

图5是根据本申请的基于肺结节预测概率的健康管理装置的一个实施例的结构示意图;

图6是根据本申请的计算机设备的一个实施例的结构示意图。

具体实施方式

除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。

在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。

为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。

本申请提供了一种基于肺结节预测概率的健康管理方法,涉及人工智能,可以应用于如图1所示的系统架构100中,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。

用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。

终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器。

需要说明的是,本申请实施例所提供的基于肺结节预测概率的健康管理方法一般由服务器/终端设备执行,相应地,基于肺结节预测概率的健康管理装置一般设置于服务器/终端设备中。

应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。

继续参考图2,示出了根据本申请的基于肺结节预测概率的健康管理方法的一个实施例的流程图,包括以下步骤:

步骤S201,获取目标患者的待测CT影像报告数据,从待测CT影像报告数据中提取目标基础信息和目标肺结节特征信息。

早期及时发现患者潜在的肺癌微小病灶并加以治疗,对于降低肺癌患者的发病率和死亡率具有重要作用。肺结节是肺癌中最重要的征象之一,胸部CT检查是常见的肺结节的常规评估手段,可显示肺结节位置、大小、形态、密度、边缘及内部特征等信息。

在本实施例中,获取目标患者的待测CT影像报告数据,CT影像报告数据中包括患者的基础信息和肺结节特征信息,其中,基础信息包括但不限于年龄、性别、吸烟情况(是否吸烟、吸烟量、吸烟史、戒烟时间等)、现肿瘤病史、既往肿瘤病史;肺结节特征信息包括但不限于肺部位置、结节类型、结节直径大小、毛刺征等。

需要强调的是,为进一步保证CT影像报告数据的私密和安全性,上述CT影像报告数据还可以存储于一区块链的节点中。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

步骤S202,基于构建好的肺结节概率预测模型,从目标基础信息和目标肺结节特征信息中获得目标肺结节风险因子。

肺结节概率预测模型是利用Logistics回归模型进行变量分析得到的,其中,变量即为肺结节风险因子,肺结节风险因子包括年龄、吸烟史、恶性肿瘤史(肺结节发现前的胸腔外恶性肿瘤史)、结节直径、毛刺征和结节位置等。Logistics回归模型以θ

肺结节概率预测模型的输出结果为0-1,其中,吸烟史、恶性肿瘤史、毛刺征等为定性指标,“是”记为1,“否”记为0。

在本实施例中,根据肺结节概率预测模型的肺结节风险因子从目标基础信息和目标肺结节特征信息中提取相应的信息,即为目标肺结节风险因子。

步骤S203,将目标肺结节风险因子输入肺结节概率预测模型,得到肺结节的预测概率。

在本实施例中,将目标肺结节风险因子输入肺结节概率预测模型中,即可计算出肺结节预测概率。

步骤S204,基于预测概率确定目标患者的肺结节风险等级。

肺结节风险等级可以根据实际情况进行设置,预测概率越高,肺结节风险等级越高,越容易得肺癌。

示例的,将肺结节风险划分为5个风险等级,0<P≤0.2为极低风险;0.2<P≤0.4为低风险;0.4<P≤0.6为中风险;0.6<P≤0.8为高风险;0.8<P≤1为极高风险。

步骤S205,根据风险等级为目标患者匹配相应的健康管理方案,并将健康管理方案发送给目标患者。

在本实施例中,根据风险等级,结合目标患者的基础信息以及肺结节特征信息,为目标患者匹配相应的健康管理方案,可以实现针对不同风险等级的患者配制个性化管理方案,帮助患者控制肺结节发展,预防和治疗相关疾病,提高生活质量,减少患者的医疗费用和社会成本。

健康管理方案具体包括如下内容:

1)推荐随访频率:根据肺结节患者的风险等级和具体情况,制定随访频率。一般来说,高危患者需要更频繁的随访,而低危患者可以适当减少随访次数。即风险等级越高,随访频率越高

2)倡导生活方式:肺结节患者需要保持健康的生活方式,包括戒烟、饮食调整、适量运动等。此外,还需要避免空气污染、呼吸道感染等对肺部的伤害。

3)健康教育与心理支持:提供患者相关的健康教育,帮助肺结节患者科学看待病情,提高患者的健康意识和健康素养,并提供专业心理上的支持和关爱,避免患者因患病而产生焦虑、抑郁等负面情绪。

4)建议检查方案:根据肺结节的性质和患者的具体情况,并制定个性化治疗方案,密切监测患者的病情变化。肺结节患者除定期的胸部CT检查外,还需要进行肺功能检查、血液检查、尿液检查等,以评估肺结节对身体的影响。此外,根据肺结节的变化情况和患者的病情发展动态调整治疗方案。

本申请通过构建好的肺结节概率预测模型来预测患者的肺结节概率,用肺结节概率来评估患者的肺结节风险等级,使得患者更为直观地了解自身的健康状况,降低患者的焦虑程度;根据风险等级和基础信息为患者匹配相应的健康管理方案,实现患者的个体化管理,提升治疗效率,同时,最大限度地保证患者得到医疗保健服务,降低医疗滥用,减少手术滥用,避免大量人力、物力、财力的浪费。

在一些可选的实现方式中,在上述获取目标患者的待测CT影像报告数据的步骤之前还包括构建肺结节概率预测模型,肺结节概率预测模型的构建方法包括以下步骤:

步骤S301,获取历史CT影像文字报告数据,从历史CT影像文字报告数据中提取患者的基础信息和历史肺结节特征信息。

在本实施例中,历史CT影像文字报告数据可以是医生根据临床肺部CT扫描图像检测后对CT图像中的肺结节进行注释后生成的文字报告数据,其中,注释内容可以包括但不限于肺部位置、结节类型、结节直径大小、毛刺征等。

将历史CT影像文字报告数据作为样本集,并从样本集中提取各个历史CT影像文字报告数据下的患者的基础信息和历史肺结节特征信息。

步骤S302,对历史肺结节特征信息进行实体关系标注,得到实体关系标注数据。

根据相关医学信息进行实体定义和标注规范,明确抽取实体间存在既定关系的主客体,示例的,实体包括肺部位置、结节类型、结节直径、结节毛刺征等。

实体定义如下:

在本实施例中,根据实体和实体之间的主客关系确定标注标签,标注标签包括实体标签和关系标签,根据实体标签和关系标签对历史肺结节特征信息进行标注,得到实体关系标注数据,实体关系标注数据包括(头实体,关系,尾实体)三元组,头实体为主体,尾实体为客体。

步骤S303,基于实体关系标注数据训练得到实体关系联合抽取模型。

在本实施例中,实体关系联合抽取模型采用基于CasRel的实体关系抽取模型进行实体关系联合抽取。该模型会识别所有可能的主语;然后在给定关系类别下,再去识别与主语相关的宾语。这里把关系看着是一个函数fr(sub)->obj,头实体sub是自变量,尾实体obj是因变量,先抽取出头实体,然后结合各关系类别,进一步抽取出对应的尾实体。

示例的,以“右中肺见分叶状结节影,长径约15mm,周围可见毛刺影”为例,实体为右中肺、分叶状结节影、15mm和毛刺影,实体关系标注数据的三元组包括(右中肺,结节类型,分叶状结节影)、(右中肺,结节直径,15mm)以及(右中肺,毛刺征,毛刺影)。

以实体关系标注数据对预构建的实体关系联合抽取模型进行训练,得到训练完成的实体关系联合抽取模型,该模型可以用于识别CT影像报告数据中的实体。

步骤S304,根据基础信息获取患者的最新CT影像报告数据,将最新CT影像报告数据输入实体关系联合抽取模型进行实体关系抽取,得到肺部实体关系。

在本实施例中,根据基础信息中的个人信息获取患者最新CT影像报告数据,最新CT影像报告数据可以体现患者肺结节的变化情况和最新的病情发展。

将最新CT影像报告数据输入实体关系联合抽取模型进行实体关系抽取,得到肺部实体关系。

步骤S305,基于基础信息和肺部实体关系,利用Logistics回归获得肺结节概率预测模型。

从基础信息和肺部实体关系中筛选出引发肺结节的危险因素作为肺结节因子,利用Logistics回归模型获得肺结节概率预测模型。

具体的,基于基础信息获取基础影响因素,并从肺部实体关系中提取肺部异常影响因素;将基础影响因素和肺部异常影响因素作为肺结节风险因子,利用Logistics回归对肺结节风险因子进行分析,得到每个肺结节风险因子的回归系数;根据回归系数获得肺结节概率预测模型。

其中,基础影响因素为年龄、吸烟史和恶性肿瘤史;肺部异常影响因素为结节直径、毛刺征以及结节位置,将这些影响因素作为肺结节风险因子,代入Logistics回归模型进行分析,得到的肺结节概率预测模型为:

其中,X=-6.8272+(0.0391×年龄)+(0.7917×吸烟史)+(1.3388×恶性肿瘤史)+(0.1274×结节直径)+(1.0407×毛刺征)+(0.7838×结节位置)。

将肺结节风险因子具体的值代入肺结节概率预测模型,即可得到肺结节预测概率。以上肺结节风险因子均是通过对病人的询问或者常规检查得出来的,不涉及有创检查或操作,为患者最大限度减少病痛;利用Logistics回归获得的模型,这种方法基于临床“大数据”方法的应用,可靠性高。

本申请通过训练实体关系联合抽取模型进行实体关系抽取,以抽取得到能更好地表示实体的向量,提高实体关系抽取的准确性;同时,本申请提供的肺结节概率预测模型简单易用,并且所用的指标均是常规检查就能得出来的指标,易于采用,根据这种模型可以给医生进一步诊断治疗提供有效的中间参考信息,具有较高的参考价值。

在本实施例的一些可选的实现方式中,上述基于实体关系标注数据训练得到实体关系联合抽取模型的步骤包括:

步骤S401,将实体关系标注数据按照预设比例划分为训练集和测试集。

具体的,可以按照7:3划分为训练集和测试集,也可以按照8:2划分为训练集和测试集,具体的比例可以根据实际情况进行选择,通常训练集数据比测试集数据要多。

步骤S402,将标注数据训练集输入预构建初始模型,输出预测实体关系三元组。

在本实施例中,初始模型包括输入层、编码层、头实体识别层以及关系与尾实体联合识别层。其中,输入层的作用是将输入数据转化为模型内部可以处理的格式。

通过输入层将训练集传输至编码层进行特征提取,获得含有上下文语义信息的词编码向量。采用预训练好的BERT作为编码层,能学习到更多的语句特征,对标注数据训练集中的实体标注数据进行特征提取,捕获词在上下文的语义信息,获得含有语义信息的词编码向量。

将词编码向量组成输入序列h

需要说明的是,词编码向量为广义的词向量,可以是一个中文汉字对应的向量,也可以是一个英文单词对应的向量,在本实施例中,一个词编码向量为一个token。

在本实施例中,通过头实体识别层对编码的输入序列h

其中,

最近匹配原则为:得到所有

识别头实体后就要进行关系和尾实体的联合识别,每一层关系与尾实体联合识别层的结构与头实体识别层是一样的。obj实体(尾实体)解码类似于sub实体(头实体)的解码,关系与尾实体联合识别层与头实体识别层的不同在于:在输入时加入了编码层含有上下文语义信息的词编码向量,且同时考虑了头实体识别层所提取出来的头实体特征信息,将关系建模作为头实体映射到尾实体的函数。

在输入关系与尾实体联合识别层之前,将每个头实体与对应的词编码向量进行融合,得到每个头实体的实体编码向量。具体的,获取每个头实体中每个词对应的词编码向量,得到实体词编码向量;计算所有实体词编码向量的平均向量,并将头实体和平均向量进行融合,得到实体编码向量。通过这种方式,能够提高CT影像报告数据中特定关系下肺结节尾实体识别的准确性。

将实体编码向量输入关系与尾实体联合识别层进行识别,得到每个头实体的所有特定关系和尾实体。

在本实施例中,关系与尾实体联合识别层具体采用如下公式进行计算:

其中,

需要注意的是,当start_o和end_o经过二分判断,概率都为0时,表示该特定关系下没有对应的obj实体,也即该sub为头实体时不存在这个关系的三元组。

本实施例通过采用基于CasRel的实体关系抽取模型,可以解决实体关系中的EPO(Entity Pair Overlap:同一对实体存在多种关系)/SEO(Single Entity Overlap:多个实体与同一实体存在关联关系)实体重叠问题。

步骤S403,根据预测实体关系三元组和训练集中的实体关系计算损失函数。

在本实施例中,损失函数为头实体识别层解码损失L(S)和关系与尾实体联合识别层解码损失L(O)两部分的和,采用二分类交叉熵损失函数。

训练集中的实体关系标注数据包含所有实际实体关系三元组,根据预测实体三元组和实际实体关系三元组,可以计算得到头实体识别层解码损失L(S)和关系与尾实体联合识别层解码损失L(O)。

步骤S404,基于损失函数调整初始模型的模型参数,直至模型收敛,输出待验证模型。

根据损失函数调整模型参数,继续进行迭代训练,模型训练到一定程度,此时,模型的性能达到最优状态,损失函数值无法继续下降,即收敛,输出待验证模型。

步骤S405,将测试集输入待验证模型进行验证,得到验证结果。

为了准确验证模型的抽取效果,以及对模型的各项性能进行全面分析,本实施例将使用在机器学习中常用的三个评价指标对实验结果进行测评:准确率P(Precision)、召回率R(Recall)及F值(F-Score)。

具体地,将测试集输入待验证模型,输出抽取结果,基于抽取结果与实际实体关系三元组计算出准确率、召回率和F值。

步骤S406,在验证结果符合预设条件时,输出最终的实体关系联合抽取模型。

在验证结果符合预设条件,即准确率、召回率和F值达到预设阈值时,说明该模型的实体关系抽取效果达到最优,能够对CT影像文字报告数据中的实体关系进行有效提取,同时证明了本申请中的实体关系联合抽取方法的有效性。在验证结果不符合预设条件时,可以重新获取训练集进行训练,直至验证结果符合预设条件。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

进一步参考图5,作为对上述图2所示方法的实现,本申请提供了一种基于肺结节预测概率的健康管理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。

如图5所示,本实施例所述的基于肺结节预测概率的健康管理装置500包括:提取模块501、获取模块502、概率预测模块503、等级判断模块504以及匹配模块505。其中:

提取模块501用于获取目标患者的待测CT影像报告数据,从所述待测CT影像报告数据中提取目标基础信息和目标肺结节特征信息;

获取模块502用于基于构建好的肺结节概率预测模型,从所述目标基础信息和所述目标肺结节特征信息中获得目标肺结节风险因子;

概率预测模块503用于将所述目标肺结节风险因子输入所述肺结节概率预测模型,得到肺结节预测概率;

等级判断模块504用于基于所述预测概率确定所述目标患者的肺结节风险等级;

匹配模块505用于根据所述风险等级为所述目标患者匹配相应的健康管理方案,并将所述健康管理方案发送给所述目标患者。

需要强调的是,为进一步保证CT影像报告数据的私密和安全性,上述CT影像报告数据还可以存储于一区块链的节点中。

基于上述基于肺结节预测概率的健康管理装置,通过构建好的肺结节概率预测模型来预测患者的肺结节概率,用肺结节概率来评估患者的肺结节风险等级,使得患者更为直观地了解自身的健康状况,降低患者的焦虑程度;根据风险等级和基础信息为患者匹配相应的健康管理方案,实现患者的个体化管理,提升治疗效率,同时,最大限度地保证患者得到医疗保健服务,降低医疗滥用,减少手术滥用,避免大量人力、物力、财力的浪费。

在一些可选的实现方式中,基于肺结节预测概率的健康管理装置500还包括标注模块、训练模块、实体抽取模块以及构建模块,其中:

获取模块用于获取历史CT影像文字报告数据,从所述历史CT影像文字报告数据中提取患者的基础信息和历史肺结节特征信息;

标注模块用于对所述历史肺结节特征信息进行实体关系标注,得到实体关系标注数据;

训练模块用于基于所述实体关系标注数据训练得到实体关系联合抽取模型;

实体抽取模块用于根据所述基础信息获取所述患者的最新CT影像报告数据,将所述最新CT影像报告数据输入所述实体关系联合抽取模型进行实体关系抽取,得到肺部实体关系;

构建模块用于基于所述基础信息和所述肺部实体关系,利用Logistics回归获得肺结节概率预测模型。

通过训练实体关系联合抽取模型进行实体关系抽取,以抽取得到能更好地表示实体的向量,提高实体关系抽取的准确性;同时,本申请提供的肺结节概率预测模型简单易用,并且所用的指标均是常规检查就能得出来的指标,易于采用,根据这种模型可以给医生进一步诊断治疗提供有效的中间参考信息,具有较高的参考价值。

在本实施例中,训练模块包括划分子模块、实体预测子模块、损失子模块、调整子模块以及验证子模块,其中:

划分子模块用于将所述实体关系标注数据按照预设比例划分为训练集和测试集;

实体预测子模块用于将所述标注数据训练集输入预构建初始模型,输出预测实体关系三元组;

损失子模块用于根据所述预测实体关系三元组和所述训练集中的实体关系计算损失函数;

调整子模块用于基于所述损失函数调整所述初始模型的模型参数,直至模型收敛,输出待验证模型;

验证子模块用于将所述测试集输入所述待验证模型进行验证,得到验证结果;在所述验证结果符合预设条件时,输出最终的实体关系联合抽取模型。

本实施例能够对CT影像文字报告数据中的实体关系进行有效提取,同时证明了实体关系联合抽取方法的有效性。

在本实施例的一些可选的实现方式中,实体预测子模块包括特征提取单元、头实体识别单元、融合单元、关系与尾实体识别单元以及组合单元,其中:

特征提取单元用于通过输入层将训练集传输至编码层进行特征提取,获得含有上下文语义信息的词编码向量;

头实体识别单元用于将词编码向量输入头实体识别层进行识别,输出所有头实体;

融合单元用于将每个头实体与对应的词编码向量进行融合,得到每个头实体的实体编码向量;

关系与尾实体识别单元用于将实体编码向量输入关系与尾实体联合识别层进行识别,得到每个头实体的所有特定关系和尾实体;

组合单元用于基于头实体、特定关系和尾实体得到预测实体关系三元组。

本实施例可以解决实体关系中的EPO/SEO实体重叠问题。

在本实施例中,头实体识别单元进一步用于:通过所述头实体识别层计算所述词编码向量分别作为开始位置和结束位置的概率,得到第一开始概率和第一结束概率;根据所述第一开始概率和所述第二结束概率,利用最近匹配原则得到所有头实体。

本实施例能够提高CT影像报告数据中肺结节头实体识别的准确性。

在本实施例中,融合单元进一步用于:获取每个所述头实体中每个词对应的所述词编码向量,得到实体词编码向量;计算所有所述实体词编码向量的平均向量,并将所述头实体和所述平均向量进行融合,得到实体编码向量。

本实施例能够提高CT影像报告数据中特定关系下肺结节尾实体识别的准确性。

在一些可选的实现方式中,构建模块包括提取子模块、分析子模块以及构建子模块,其中:

提取子模块用于基于所述基础信息获取基础影响因素,并从所述肺部实体关系中提取肺部异常影响因素;

分析子模块用于将所述基础影响因素和所述肺部异常影响因素作为肺结节风险因子,利用Logistics回归对所述肺结节风险因子进行分析,得到每个所述肺结节风险因子的回归系数;

构建子模块用于根据所述回归系数获得肺结节概率预测模型。

本实施例中的肺结节风险因子均是通过对病人的询问或者常规检查得出来的,不涉及有创检查或操作,为患者最大限度减少病痛;利用Logistics回归获得的模型,这种方法基于临床“大数据”方法的应用,可靠性高。

为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图6,图6为本实施例计算机设备基本结构框图。

所述计算机设备6包括通过系统总线相互通信连接存储器61、处理器62、网络接口63。需要指出的是,图中仅示出了具有组件61-63的计算机设备6,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。

所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

所述存储器61至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器61可以是所述计算机设备6的内部存储单元,例如该计算机设备6的硬盘或内存。在另一些实施例中,所述存储器61也可以是所述计算机设备6的外部存储设备,例如该计算机设备6上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器61还可以既包括所述计算机设备6的内部存储单元也包括其外部存储设备。本实施例中,所述存储器61通常用于存储安装于所述计算机设备6的操作系统和各类应用软件,例如基于肺结节预测概率的健康管理方法的计算机可读指令等。此外,所述存储器61还可以用于暂时地存储已经输出或者将要输出的各类数据。

所述处理器62在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器62通常用于控制所述计算机设备6的总体操作。本实施例中,所述处理器62用于运行所述存储器61中存储的计算机可读指令或者处理数据,例如运行所述基于肺结节预测概率的健康管理方法的计算机可读指令。

所述网络接口63可包括无线网络接口或有线网络接口,该网络接口63通常用于在所述计算机设备6与其他电子设备之间建立通信连接。

本实施例通过处理器执行存储在存储器的计算机可读指令时实现如上述实施例基于肺结节预测概率的健康管理方法的步骤,通过构建好的肺结节概率预测模型来预测患者的肺结节概率,用肺结节概率来评估患者的肺结节风险等级,使得患者更为直观地了解自身的健康状况,降低患者的焦虑程度;根据风险等级和基础信息为患者匹配相应的健康管理方案,实现患者的个体化管理,提升治疗效率,同时,最大限度地保证患者得到医疗保健服务。

本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的基于肺结节预测概率的健康管理方法的步骤,通过构建好的肺结节概率预测模型来预测患者的肺结节概率,用肺结节概率来评估患者的肺结节风险等级,使得患者更为直观地了解自身的健康状况,降低患者的焦虑程度;根据风险等级和基础信息为患者匹配相应的健康管理方案,实现患者的个体化管理,提升治疗效率,同时,最大限度地保证患者得到医疗保健服务。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。

显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。

相关技术
  • 一种孤立性肺结节恶性概率预测模型的建立方法
  • 一种孤立性肺结节恶性概率预测模型的建立方法
技术分类

06120116488058