掌桥专利:专业的专利平台
掌桥专利
首页

一种身体状态评估装置、电子设备及存储介质

文献发布时间:2023-06-19 11:27:38


一种身体状态评估装置、电子设备及存储介质

技术领域

本发明涉及人工智能技术领域,尤其涉及一种身体状态评估装置、电子设备及存储介质。

背景技术

随着医疗科技的进步,我们逐渐从过去的看病治疗的时代在向病前预防的时代进步,因此对人们进行合理的健康评估,评估出人群患病的风险等是非常重要的。

AI(Artificial-Intelligence,人工智能)是指利用计算机等现代化工具来模拟人类的思维和行动的技术。随着AI技术的日渐进步,基于健康大数据及用户画像,利用AI算法评估身体健康状态的平台系统已经出现。

但是现有的用户画像,大多数都是通过专家或者产品经验使用规则建立的固定维度的画像。例如定义属性标签,兴趣标签。然后定义各个标签的取值范围,最终构建了一个相对固定的、静态用户画像。

此外,传统的用户画像都是基于文本生成的,很少基于影像的方式生成。

更进一步的,目前的画像评估和身体指数大都是基于上述的静态用户画像来生成,通过构建一个基于特定规则和医学经验的静态专家模型,来生成一个用户的指数或者状态来评估用户的健康状态。

发明内容

为解决上述问题,本发明提供一种身体状态评估装置、电子设备及存储介质,通过人工提供的种子用户画像、医学知识图谱和专家标注的健康语料,使用人工智能的方法自动学习用户画像,自动学习评估算法来评估用户的大致健康状态,并进行评分。

为了实现上述目的,本发明提供的具体技术方案如下:

第一方面,本申请提供了一种身体状态评估装置,包括:

基础构建模块,用于构建初始的种子医学知识图谱及种子用户画像;

实体扩充模块,用于扩充所述种子医学知识图谱中的实体及实体关系,以形成最终的医学知识图谱;

合并模块,用于将所述医学知识图谱中的关联实体加入用户画像;

添加模块,用于将用户的病历、影像资料及生活资料填充到所述用户画像中;

评估模块,用于根据所述用户画像计算用户的健康指数。

结合第一方面,在一些可能的实现方式中,在所述基础构建模块中,所述种子医学知识图谱的实体类型包括疾病、症状、检查及检验,实体关系包括症状—疾病和检查/检验—疾病;所述种子用户画像的实体类型包括用户的基本信息和患病信息,所述患病信息包括:疾病名称、症状及所做检查。

结合第一方面,在一些可能的实现方式中,所述实体扩充模块包括第一获取单元、第一确定单元和校对单元;

所述第一获取单元,用于获取所有的实体;

所述第一确定单元,用于根据所获取的实体进行序列标注模型的训练,针对所述序列标注模型所输出的结果,在现有知识图谱中进行查询,将查询成功的输出结果进行保留;

所述校对单元,用于专家对保留的输出结果进行审核,形成最终的医学知识图谱。

结合第一方面,在一些可能的实现方式中,在所述第一确定单元中,所述序列标注模型的输入样本为病人病历或健康资讯,输出结果为医学知识图谱的实体及实体标注;所述现有知识图谱包括FreeBase,Yago或百度百科。

结合第一方面,在一些可能的实现方式中,所述合并模块,具体用于:

从所述种子用户画像中提取实体;

根据提取的实体,在所述医学知识图谱中查询关联实体及关系;

将关联实体加入用户画像;

专家对加入用户画像的关联实体进行审核并确认。

结合第一方面,在一些可能的实现方式中,所述添加模块包括第二获取单元、第二确定单元、第三获取单元及第三确定单元;

所述第二获取单元,用于获取用户的影像数据;

所述第二确定单元,用于通过卷积神经网络提取所述影像数据中病灶位置及疾病类型,并确定具体疾病病灶类型、级别和大小,经过预设的启发式规则存储至用户画像中;

所述第三获取单元,用于获取用户的病历及生活资料的文本数据;

所述第三确定单元,用于通过预设的分类和识别模型,将所述文本数据与具体的实体类型相匹配,并使用关系抽取模型取出两个实体间可能具有的关系,再经过预设的启发式规则存储至用户画像中。

结合第一方面,在一些可能的实现方式中,所述评估模块包括第一评分单元、第二评分单元、第三评分单元及映射单元;

所述第一评分单元,用于由专家根据所述用户画像中的健康维度对用户身体状态进行总评分,分值范围为1-1000;所述健康维度为所述用户画像的实体中最小的分类;所述总评分的分数用于通过主成分分析的方式自动学习所述健康维度的权重;

所述第二评分单元,用于通过启发式规则计算每个所述健康维度的具体评分;

所述第三评分单元,用于计算用户最终的健康值,最终的健康值H=健康维度1*具体评分1*权重1+健康维度2*具体评分2*权重2+…+健康维度n*具体评分n*权重n;

所述映射单元,用于通过逻辑回归映射函数将健康值H映射到上述1-1000的分值范围内,得到用户的健康指数;所述逻辑回归映射函数为:

结合第一方面,在一些可能的实现方式中,所述第二评分单元,还用于通过主成分分析的方式计算每个所述健康维度的权重,包括:

构建一个矩阵X,行是用户ID,列是所述健康维度;

通过主成分分析的方法得到每个所述健康维度的特征值,所述特征值为每个所述健康维度的所述权重。

第二方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器;

所述存储器用于存储计算机程序;

所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如第一方面所述的装置所实现的功能。

第三方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如第一方面所述的装置所实现的功能。

由此可见,本发明实施例提供了一种身体状态评估装置、电子设备及存储介质,首先通过算法构建了一个种子医学知识图谱,以用于基础服务;然后构建了一个种子预定义的画像,通过构建画像,使用人工智能和NLP技术去病历中进行自动化构建一个用户画像,这个用户画像不但综合了用户文本化病历数据,而且综合了影像方面的数据。形成用户画像后然后使用专家打分的方式,根据用户病历和健康档案对每个用户的健康状态打一个1-1000的评分。使用PCA主成分分析的方式,自动学习每个维度在该得分的权重。最终构建了一个预测病人健康指数的动态模型,能够更加准确地呈现出用户目前的健康状态并对潜在风险进行预警或提示。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

图1为本发明实施例的身体状态评估方法的示意性流程图;

图2为本发明实施例的扩充所述种子医学知识图谱的步骤流程图;

图3为本发明实施例中将医学知识图谱中的关联实体加入用户画像的步骤流程图;

图4为本发明实施例的身体状态评估装置的整体框架图。

具体实施方式

通过结合附图对本发明实施例进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本发明实施例的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。

本发明实施例提供了一种身体状态评估方法,图1为本发明实施例的身体状态评估方法的示意性流程图。如图1所示,本发明实施例的身体状态评估方法,包括步骤S110,构建初始的种子医学知识图谱及种子用户画像;步骤S120,扩充所述种子医学知识图谱中的实体及实体关系,以形成最终的医学知识图谱;步骤S130,将所述医学知识图谱中的关联实体加入用户画像;步骤S140,将用户的病历、影像资料及生活资料填充到所述用户画像中;步骤S150,根据所述用户画像计算用户的健康指数。

本发明实施例中,种子医学知识图谱的实体类型包括疾病、症状、检查及检验,实体关系包括症状—疾病,检查—疾病,检验—疾病,症状—检查,症状—检验;种子用户画像的实体类型包括用户的基本信息和患病信息,基本信息包括性别、年龄等,患病信息包括疾病名称、症状及所做检查/检验等。

图2为本发明实施例的扩充所述种子医学知识图谱的一种优选实施例的步骤流程图。如图2所示,根据本发明身体状态评估方法的一种实施方式,在进行医学知识图谱扩充时,包括:步骤S210,获取全部实体;步骤S220,训练一个序列标注模型;步骤S230,输入病人病历及健康资讯;步骤S240,输出医学知识图谱实体及实体标注;步骤S250,和现有知识图谱进行重合检验;步骤S260,专家对重合的实体进行审核,加入医学知识图谱。

具体地,现有比较成熟的知识图谱包括FreeBase,Yago或百度百科等。在进行重合检验时如果查询成功则保留,否则删除。对于专家审核后的实体加入种子医学知识图谱,完成扩充。当构建好一个具有一定规模(优选大于100万实体,1000万关系)的健康/医学领域的知识图谱后,可以进入下一步骤。

在实际应用中,在进行关系扩展时的具体步骤可以是:将文本“多饮、多尿、多食和消瘦、乏力是2型糖尿病的主要症状”输入预先训练好的序列标注模型,检验是否存在于现有知识图谱,若存在进行专家审核,加入医学知识图谱。

图3为本发明实施例中将医学知识图谱中的关联实体加入用户画像的一种优选实施例的步骤流程图。如图3所示,根据本发明身体状态评估方法的一种实施方式,在将医学知识图谱中的关联实体加入用户画像时,包括:步骤S310,获取种子画像实体;步骤S320,在医学知识图谱中查询关联实体、关系;步骤S330,把关联实体加入种子用户画像;步骤S340,专家审核最终用户画像。

在实际应用中,将知识图谱中的关联实体加入用户画像的具体步骤可以是:例如构建的种子画像里面有糖尿病,通过查询扩展,查询出治疗方式运动方案、饮食方案,该方案也属于知识图谱中实体,则会把运动方案和饮食方案加入用户画像。

根据本发明身体状态评估方法的一种实施方式,在将用户的影像资料填充到用户画像中时,首先经过卷积神经网络等方式提取影像数据中的病灶位置和病的种类,然后经过实体分类和链接步骤确定病灶类型、级别和大小,再经过预设的启发式规则存储至用户画像中。

在实际应用中,可以利用Faster R-CNN,Class Activation Mapping等方式提取影像数据中所需要的信息,该方式为现有技术;在实体分类和链接步骤中,单独训练一个识别和提取的网络,也即上述的Faster R-CNN,Class Activation Mapping等技术。预设的启发式规则可以举例为:影像数据经提取后为乳腺疾病,存储到疾病史,并且风险预警可能存在乳腺癌的风险,提醒进一步筛查和预防。

根据本发明身体状态评估方法的一种实施方式,在将用户的病历及生活资料填充到用户画像中时,文本数据首先进行实体抽取,然后经过预设的分类和识别模型(知识图谱中实体匹配),与具体的实体类型相匹配,再使用关系抽取模型 (Assembled CNNExtractor )提取出两个实体可能具有的关系,并从知识图谱中验证关系的正确性。最后把抽取的规则,使用启发式规则写入到病人的画像中,以形成一个比较完整的、描述一个用户的健康档案及画像,当批量生成一定规模(优选为1万个)的用户画像后可以进入下一步骤。

根据本发明身体状态评估方法的一种实施方式,当批量生成的用户画像数量到达1万时,开始计算用户健康指数。

首先由专家根据用户画像中的健康维度对用户身体状态进行一个1-1000分的总评分,代表用户的健康状态。所述健康维度为所述用户画像的实体中最小的分类,例如性别、家族史、疾病史;当家族史、疾病史存在有多个值时,需要将其拆分为单值。例如,疾病史:糖尿病,高血压,拆分成:疾病史:糖尿病;疾病史:高血压;所述总评分的分数用于通过主成分分析的方式自动学习所述健康维度的权重。

然后通过主成分分析(PCA)的方式计算每个所述健康维度的权重,具体包括:构建一个矩阵X,行是用户ID,列是所述健康维度;通过主成分分析的方法得到每个所述健康维度的特征值,所述特征值即为每个所述健康维度的所述权重。

通过启发式规则计算每个健康维度的具体评分,例如:某病人家族史维度,有患有高血压,则根据规则,该分数为40分,满分100分,得分越高,表示该维度越健康。

最终的健康值H=健康维度1*具体评分1*权重1+健康维度2*具体评分2*权重2+…+健康维度n*具体评分n*权重n;

最后通过逻辑回归映射函数将健康值H映射到上述1-1000的分值范围内,得到用户的健康指数;所述逻辑回归映射函数为:

另一方面,本发明实施例提供了一种身体状态评估装置,图4为本发明实施例的身体状态评估装置的整体框架图。如图4所示,本发明实施例的身体状态评估装置包括:基础构建模块401,用于构建初始的种子医学知识图谱及种子用户画像;实体扩充模块402,用于扩充所述种子医学知识图谱中的实体及实体关系,以形成最终的医学知识图谱;合并模块403,用于将所述医学知识图谱中的关联实体加入用户画像;添加模块404,用于将用户的病历、影像资料及生活资料填充到所述用户画像中;评估模块405,用于根据所述用户画像计算用户的健康指数。

根据本发明身体状态评估装置的一种实施方式,在所述基础构建模块401中,所述种子医学知识图谱的实体类型包括疾病、症状、检查及检验,实体关系包括症状—疾病和检查/检验—疾病;所述种子用户画像的实体类型包括用户的基本信息和患病信息,所述患病信息包括:疾病名称、症状及所做检查。

根据本发明身体状态评估装置的一种实施方式,所述实体扩充模块402包括第一获取单元、第一确定单元和校对单元;所述第一获取单元,用于获取所有的实体;所述第一确定单元,用于根据所获取的实体进行序列标注模型的训练,针对所述序列标注模型所输出的结果,在现有知识图谱中进行查询,将查询成功的输出结果进行保留;所述校对单元,用于专家对保留的输出结果进行审核,形成最终的医学知识图谱。

根据本发明身体状态评估装置的一种实施方式,在所述确定单元中,所述序列标注模型的输入样本为病人病历或健康资讯,输出结果为医学知识图谱的实体及实体标注;所述现有知识图谱包括FreeBase,Yago或百度百科。

根据本发明身体状态评估装置的一种实施方式,所述合并模块403,具体用于:从所述种子用户画像中提取实体;根据提取的实体,在所述医学知识图谱中查询关联实体及关系;将关联实体加入用户画像;专家对加入用户画像的关联实体进行审核并确认。

根据本发明身体状态评估装置的一种实施方式,所述添加模块404包括第二获取单元、第二确定单元、第三获取单元及第三确定单元;所述第二获取单元,用于获取用户的影像数据;所述第二确定单元,用于通过卷积神经网络提取所述影像数据中病灶位置及疾病类型,并确定具体疾病病灶类型、级别和大小,经过预设的启发式规则存储至用户画像中;所述第三获取单元,用于获取用户的病历及生活资料的文本数据;所述第三确定单元,用于通过预设的分类和识别模型,将所述文本数据与具体的实体类型相匹配,并使用关系抽取模型取出两个实体间可能具有的关系,再经过预设的启发式规则存储至用户画像中。

根据本发明身体状态评估装置的一种实施方式,所述评估模块405包括第一评分单元、第二评分单元、第三评分单元及映射单元;所述第一评分单元,用于由专家根据所述用户画像中的健康维度对用户身体状态进行总评分,分值范围为1-1000;所述健康维度为所述用户画像的实体中最小的分类;所述总评分的分数用于通过主成分分析的方式自动学习所述健康维度的权重;所述第二评分单元,用于通过启发式规则计算每个所述健康维度的具体评分;所述第三评分单元,用于计算用户最终健康值,最终健康值H=健康维度1*具体评分1*权重1+健康维度2*具体评分2*权重2+…+健康维度n*具体评分n*权重n;所述映射单元,用于通过逻辑回归映射函数将健康值H映射到上述1-1000的分值范围内,得到用户的健康指数;所述逻辑回归映射函数为:

根据本发明身体状态评估装置的一种实施方式,所述第二评分单元,还用于通过主成分分析的方式计算每个所述健康维度的权重,包括:构建一个矩阵X,行是用户ID,列是所述健康维度;通过主成分分析的方法得到每个所述健康维度的特征值,所述特征值为每个所述健康维度的所述权重。

在一个可能的设计中,身体状态评估装置的结构中包括处理器和存储器,该存储器用于存储支持身体状态评估装置执行上述身体状态评估方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。

又一方面,本发明实施例提供了一种计算机设备,包括存储器和处理器;存储器用于存储计算机程序;处理器,用于执行所述计算机程序并在执行所述计算机程序时实现上述身体状态评估方法中任一所述的方法。

又一方面,本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时使所述处理器实现上述身体状态评估方法中任一所述的方法。

与现有技术相比,本申请的有益效果在于:

通过人工提供的种子用户画像、医学知识图谱和专家标注的健康语料,使用人工智能的方法自动学习用户画像,自动学习评估算法来评估用户的大致健康状态,并进行评分。其中,医学知识图谱可以动态的扩展,用户画像则基于动态的医学知识图谱而生成并动态扩展,大大减少了人力的构建工作,有别于现有的知识图谱及用户画像构建方式;此外,本申请中的用户画像在基于文本资料生成的基础上,还提取了影像特征,并将影像特征也加入到了知识图谱及用户画像;进一步地,本申请中用户画像的维度权重自动生成,并最终动态生成用户的健康指数,能够更加准确地呈现出用户目前的健康状态并对潜在风险进行预警或提示。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。其中装置实施方式与方法的实施方式相对应,因此装置的实施方式描述比较简略,相关描述可参照方法的实施方式的描述即可。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

相关技术
  • 一种身体状态评估装置、电子设备及存储介质
  • 人体身体状态检测方法、装置、存储介质及电子设备
技术分类

06120112938187