掌桥专利:专业的专利平台
掌桥专利
首页

一种基于口酸的疾病辅助诊断系统、设备、存储介质

文献发布时间:2023-06-19 09:26:02


一种基于口酸的疾病辅助诊断系统、设备、存储介质

技术领域

本发明涉及疾病辅助诊断设备领域,一种基于口酸的疾病辅助诊断系统、设备、存储介质。

背景技术

俗话说,“鼻闻香臭,舌尝五味”。酸、甜、苦、辣、咸五味的信息,是靠舌面上密布的细小乳头,称为舌蕾的味觉细胞来传递的,再经大脑皮质味觉中枢产生兴奋,由反馈环路神经体液系统完成整个味的分析活动。但是有的人在进食时,口中会有异味感,或者不进食口腔内也觉得有异常味道。这常常提示可能得了某种疾病。中医认为,口酸多为肝胆之热侵脾所致,是肝气上溢的征兆,常伴有胸闷胁痛、恶心、食后腹胀、舌苔薄黄、脉弦等症状。常见于胃炎和消化性溃疡,与胃酸过多有关。比如,胃炎、胃酸、感冒和胃及十二指肠溃疡胃酸等。

现有技术中很难根据直接根据口腔异味直接做出准确的疾病诊断,需要借助多种辅助检测设备并结合医师经验判断,诊断过程繁琐且有主观性影响。

发明内容

有鉴于此,本发明提出了一种基于口酸的疾病辅助诊断系统、设备、存储介质,用于解决现有技术无法根据口酸进行快速疾病辅助诊断问题。

本发明第一方面,公开一种基于口酸的疾病辅助诊断系统,所述系统包括:

样本获取模块:从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;

样本标记模块:根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;

模型构建模块:通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;

辅助诊断模块:获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。

优选的,所述样本获取模块和辅助诊断模块中,基于TextRank算法进行关键词提取,分别对病例样本和待诊断病例进行向量化表示,其具体过程包括:

对病例的症状描述信息进行分词、去停用词处理,得到候选关键词,构建构建候选关键词图G=(V,E),其中V为节点集,E为边集合,任两点Vi,Vj之间边的权重为ω

In(V

优选的,所述样本标记模块中,将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作为第二标记。

优选的,所述模型构建模块中,预先统计样本标记模块中各类第一标记对应的样本量,设定样本量阈值,将样本量超过所述阈值的作为多数类样本,其余为少数类样本;对于多数类样本,通过欧式距离法计算各类别中心点,筛选出与所述类别中心点在预设距离范围内的样本,使筛选出的样本与少数类样本均衡,筛选出的样本与少数类样本共同组成样本集。

优选的,所述模型构建模块中,采用决策树模型作为疾病分类模型的基分类器。

优选的,所述辅助诊断模块中,所述通过计算语义相似度的方式进行病例第二次分类具体为:根据病例第一次分类结果,获取第一标签下各个第二标签对应的疾病症状信息,计算待诊断病例的症状信息的特征向量与第二标签对应的疾病症状信息特征向量之间的语义相似度,取语义相似度最高的第二标签作为辅助诊断结果。

本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;

其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明第一方面所述的系统。

本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现权利要求1~6任一项所述的系统。

本发明相对于现有技术具有以下有益效果:

本发明通过Adaboost算法构建疾病分类模型,实现了以口酸为第一主诉症状的快速疾病辅助诊断,通过Adaboost算法构建疾病分类模型并进行初步分类,再根据初步分类结果根据语义相似度进行二次分类,可以比较准确地推导和预测出可能的疾病和健康问题,是一种简单实用的辅助诊断系统。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于口酸的疾病辅助诊断系统的结构示意图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1所示,本发明第一方面,公开一种基于口酸的疾病辅助诊断系统,所述系统包括:样本获取模块100、样本标记模块200、模型构建模块300、辅助诊断模块400。

样本获取模块100,从病例库中获取以口酸为第一主诉症状的病例,提取病例症状信息及对应的疾病名称,构建向量化的病例样本;

口酸指病人自觉口中有酸味,或泛酸,甚至闻之有酸腐气味的症状,可伴见恶心、呕吐、胸闷胁痛、腹胀、苔黄、脉弦等症状;比如,胃炎表现为上腹部不适、反酸、烧心、打嗝、嗳气、恶心、呕吐、腹胀等症状;肝胃不合型症状有:口中发酸,嘈杂吞酸,食少纳呆,嗳气,胁肋胀痛,舌淡苔薄脉弦;宿食停滞型临床表现:主要表现为口中发酸,或嗳气酸腐,纳呆恶食,脘腹胀满,舌淡苔厚浊腻,脉滑等。

样本标记模块200,根据病例样本的疾病的发病原因,将口酸分为胃酸过多、肝火旺盛、消化不良几个大类,对病例样本标记;

具体的,将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作为第二标记。

模型构建模块300,通过Adaboost算法构建疾病分类模型,通过所述病例样本训练所述疾病分类模型;

Adaboost的目的就是从训练数据中学习一系列弱分类器或基本分类器,然后将这些弱分类器组合成一个强分类器。可采用决策树模型作为疾病分类模型的基分类器。预先统计样本标记模块中各类第一标记对应的样本量,设定样本量阈值,将样本量超过所述阈值的作为多数类样本,其余为少数类样本;对于多数类样本,通过欧式距离法计算各类别中心点,筛选出与所述类别中心点在预设距离范围内的样本,使筛选出的样本与少数类样本均衡,筛选出的样本与少数类样本共同组成样本集。

辅助诊断模块400,获取待诊断病例的症状信息并进行向量化表示,通过训练好的疾病分类模型进行病例第一次分类,通过计算语义相似度的方式进行病例第二次分类,将第二次分类结果作为辅助诊断结果。

所述样本获取模块100和辅助诊断模块400中,基于TextRank算法进行关键词提取,分别对病例样本和待诊断病例进行向量化表示,其具体过程包括:

对病例的症状描述信息进行分词、去停用词处理,得到候选关键词,构建构建候选关键词图G=(V,E),其中V为节点集,E为边集合,任两点Vi,Vj之间边的权重为ω

In(V

所述通过计算语义相似度的方式进行病例第二次分类具体为:根据病例第一次分类结果,获取第一标签下各个第二标签对应的疾病症状信息,计算待诊断病例的症状信息的特征向量与第二标签对应的疾病症状信息特征向量之间的语义相似度,取语义相似度最高的第二标签作为辅助诊断结果。

本发明将胃酸过多、肝火旺盛、消化不良几个大类作为样本的第一标记,将每个样本对应的疾病名称作为第二标记,通过Adaboost算法构建疾病分类模型并进行初步分类,再根据初步分类结果进行二次分类,初步分类将多种疾病根据病因划分成一个大类,可避免由于相关的疾病种类过多需要大量训练样本的问题,二次分类是进行进行精细化划分,通过语义相似度获取精确的疾病辅助诊断结果。

本发明还公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现本发明前述的基于现行的心血管系统感染诊断标准智能识别心血管系统感染病例的系统,包括样本获取模块、样本标记模块、模型构建模块、辅助诊断模块。

本发明还公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明实施例所述的全部系统或部分系统。例如包括样本获取模块、样本标记模块、模型构建模块、辅助诊断模块。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的衙要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种基于口酸的疾病辅助诊断系统、设备、存储介质
  • 一种基于聚类的疾病辅助诊断系统、设备、存储介质
技术分类

06120112165255