掌桥专利:专业的专利平台
掌桥专利
首页

一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质

文献发布时间:2023-06-19 09:38:30


一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质

技术领域

本发明属于疾病辅助诊断设备,涉及一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质。

背景技术

鼻出血(epistaxis)是鼻腔疾病的常见症状之一,也可由全身疾病引起,偶有鼻腔邻近病变出血经鼻腔流出者,后者称之为借道鼻出血。鼻出血是身体发出的求救信号。引起鼻出血的原因非常复杂,包括全身性和局部性两种,很多时候,鼻出血是疾病的一种表现。其中,全身性疾病包括:高血压、动脉硬化,老年人更常见,因体内血管脆度增加导致鼻部易出血;白血病、再生障碍性贫血、血友病等血液系统疾病;长期使用抗凝药物,例如支架手术后患者等,凝血机制遭到一定程度破坏;营养不均衡,平时摄入维生素较少;肝肾功能障碍等慢性病。局部性原因则包括鼻外伤,过敏性鼻炎,急慢性鼻窦炎,鼻中隔偏曲,鼻腔、鼻窦及鼻咽部肿瘤等。

目前,鼻出血诊断的方法一般有:局部一般详细检查鼻腔、鼻咽部,必要时进行X线平片、CT扫描、鼻及鼻窦内窥镜检查;对伴有高热者,一般通过血液及细菌学的检查,以排除血液病及急性传染病。现有的诊断方法仍然依靠繁琐的辅助筛查,缺乏一种简单实用的辅助诊断系统。

发明内容

有鉴于此,本发明提出了一种基于鼻出血伴随症状预测疾病的系统、设备、存储介质,用于解决现有鼻出血诊断筛查方式繁琐的问题,提供一种简单实用的鼻出血辅助诊断系统。

本发明第一方面,提出一种基于鼻出血伴随症状预测疾病的系统,所述系统包括:

数据获取模块:用于从病例库中获取以鼻出血作为临床第一主诉症状病例,获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;

数据划分模块:用于根据鼻出血发病的原因,将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;

向量化模块:用于分别提取数据集中每类疾病对应的鼻出血伴随症状的关键特征,对鼻出血伴随症状进行向量化表示;

数据聚类模块:用于分别采用基于改进的鲸鱼算法优化的聚类算法对对局部疾病数据集和全身疾病数据集聚类;

疾病预测模块:用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测。

优选的,所述聚类模块具体用于:

初始化鲸鱼优化算法所需参数和鲸群位置;

通过适应度函数计算鲸群个体的适应度,筛选出最佳位置;

基于当前最佳位置进行包围猎物、狩猎行为、搜索猎物,搜索猎物的过程中通过莱维飞行优化搜索位置;

若位置更新后的鲸群个体的适应度高于更新前的适应度,采用更新后的位置替代原位置,否则保留原位置;迭代更新直到达到设定迭代次数或者适应度值小于设定精度。

优选的,所述包围猎物和狩猎行为时,计算系数向量A、C:

A=2ar

C=2r

r

当|A|<1,鲸鱼有P

p为[0,1]之间的一个随机数,P

优选的,当|A|≥1,搜索猎物,通过莱维飞行优化搜索位置的位置更新公式为:

其中,X

Γ为标准的gamma函数,u、v均服从正态分布。

优选的,所述预测模块具体包括:

数据划分单元:用于分别从向量化的局部疾病数据集和全身疾病数据集中随机选取多个向量,分别计算上述多个向量的均值向量,分别计算待测病例的鼻出血伴随症状特征向量与所述均值向量之间的欧式距离,选取距离最小的均指向量所在数据集作为待测病例的数据划分结果;

聚类单元:用于计算待测病例的鼻出血伴随症状特征向量与对应的数据集的聚类中心点之间的欧式距离,对待测疾病聚类;

相似度计算单元:用于计算待测病例的鼻出血伴随症状特征向量与待测疾病聚类类别中各个样本的余弦相似度,并将对应的疾病名称按照相似度降序排列作为疾病预测结果。

本发明第二方面,公开一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;

其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现版本发明第一方面所述的系统。

本发明第三方面,公开一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明第一方面所述的系统。

本发明相对于现有技术具有以下有益效果:

本发明在对数据集初步划分之后,在鲸鱼优化算法中引入莱维飞行策略并应用于数据集的K均值聚类,莱维飞行可以提高不确定环境下的搜索效率,莱维飞行具有更广泛的搜索能力,因此能够扩大搜索范围,应用于鲸鱼优化算法能够提高鲸群的活力和跳跃能力,避免陷入局部最优,提高算法的全局寻优能力,从而实现鼻出血相关疾病的高精度聚类,聚类之后再通过计算语义相似度的方式有针对性的进行疾病细分,可有效减少不必要计算,提高辅助诊断速度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明基于鼻出血伴随症状预测疾病的系统结构示意图。

具体实施方式

下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

如图1所示,本发明提出一种基于鼻出血伴随症状预测疾病的系统,所述系统包括数据获取模块100、数据划分模块200、数据聚类模块400、疾病预测模块500;

数据获取模块100:用于从病例库中获取以鼻出血作为临床第一主诉症状病例,获取病例鼻出血伴随症状以及对应的疾病名称,建立鼻出血疾病原始数据集;

首先进行鼻出血的鉴别,具体依据有,1)、出血前的先兆症状:鼻部热胀感,或鼻腔异物感上腹部疼痛,恶心呕吐咳嗽、胸闷,胸部不适,喉痒感等;2)、出血的排出形式:多从前鼻孔溢出,剧烈时常同时从口鼻涌出呕出,也可呈喷射状,凶猛时可同时从口鼻中涌出咳出,凶猛时亦可同时从口鼻涌出;3)、排出血液的性状:鲜红色,一般无混杂物,有时可混有鼻涕或痰液胃或十二指肠性呕血多为咖啡样或棕褐色,无泡沫,但常混有食物残渣和胃液,常呈酸性反应;食管性呕血则为鲜红或暗红色由暗红至鲜红色,混有气泡或痰液,常呈碱性;4)、出血后后续症状:一般出血后数日内可有鼻涕中带血丝有血便,很少有痰中带血痰中带血,可持续数日,除非血液咽下,一般无血便;在进行数据获取时应先鉴别病例样本是否是以鼻出血为临床第一主诉症状,筛选出相应病例组成原始数据集。

鼻出血常见症状,比如:鼻溢液、鼻塞排出脓性或血性分泌物、下鼻甲或中鼻甲肥大、恶心与呕吐、带血粘脓鼻涕、女性周期性鼻塞和鼻衄、鼻腔中后部出血、脉速而无力、反复鼻出血、咳巧克力色痰、呼吸异常、红鼻头、眩晕、鼻粘膜溃疡、鼻出血出血可发生在鼻腔的任何部位,但以鼻中隔前下区最为多见,有时可见喷射性或搏动性小动脉出血。鼻腔后部出血常迅速流入咽部,从口吐出。一般说来,局部疾患引起的鼻出血,多限于一侧鼻腔,而全身疾病引起者,可能两侧鼻腔内交替或同时出血等。

鼻出血的常见疾病有:急性鼻炎、急性鼻窦炎、干燥性鼻炎、萎缩性鼻炎、鼻中隔黏膜糜烂、白喉、鼻中隔偏曲、穿孔、鼻中隔毛细血管瘤、鼻腔鼻窦血管瘤、鼻腔鼻窦恶性肿瘤、恶性肉芽肿、鼻咽纤维血管瘤、鼻咽癌、高血压、动脉硬化、肺气肿、肺源性心脏病、颈内动脉破裂、维生素缺乏、中毒等。比如,鼻咽纤维血管瘤主要发生在男性、青年,好发部位在鼻咽顶部。本病的主要症状是一侧进行性鼻阻塞,反复大量鼻出血。检查鼻腔后、鼻咽顶部有紫红色、光滑、质硬、不活动的肿物;鼻腔鼻窦恶性肿瘤常发生于中年以上患者,症状表现为一侧鼻阻塞,少量鼻出血。上颌窦癌的早期限于下壁或上壁时,牙痛或面颊部麻木感是重要的症状。至于眼眶、硬腭或面部的隆起,则属晚期表现等;对于每一类鼻出血相关疾病,至少获取10个病例样本。

数据划分模块200:用于根据鼻出血发病的原因,将鼻出血分为局部疾病和全身疾病,并对鼻出血疾病原始数据集进行数据划分;将鼻出血疾病原始数据集划分成局部疾病数据集和全身疾病数据集。

鼻出血可能与全身系统疾病有关,如血液系统疾病、糖尿病、心血管疾病、肝肾功能异常、肿瘤等。当鼻出血患者遇到以下情况时,应考虑血液疾病的可能性:1)、鼻出血频繁或持续,经使用常规止血药或止血方法不能止血;2)、经治疗后能暂时止血,但随后反复出血;3)、牙龈无肿胀、发红、却有鼻出血;4)、鼻出血伴有头晕、疲乏等症状;5)、鼻出血伴有鼻出血;6)、外伤后鼻出血不止;7)、鼻出血伴有周身散发性出血点或瘀斑;8)、鼻出血伴有月经多、经期延长;9)、鼻出血伴有发热及淋巴结肿大。

向量化模块300:用于分别提取数据集中每个病例对应的鼻出血伴随症状的关键特征,对鼻出血伴随症状进行向量化表示;

具体的,利用TF-IDF选取特征项,构建向量空间模型,对鼻出血伴随症状进行向量化表示。

数据聚类模块400:用于分别采用基于改进的鲸鱼算法优化的聚类算法对局部疾病数据集和全身疾病数据集聚类;

所述聚类模块具体用于:

初始化鲸鱼优化算法(鲸鱼优化算法(whale optimization algorithm,WOA))所需参数和鲸群位置;

通过适应度函数计算鲸群个体的适应度,筛选出最佳位置;

基于当前最佳位置进行包围猎物、狩猎行为、搜索猎物,搜索猎物的过程中通过莱维飞行优化搜索位置;首先计算系数向量A、C:

A=2ar

C=2r

r

当|A|<1,鲸鱼有P

p为[0,1]之间的一个随机数,P

当|A|≥1,搜索猎物,通过莱维飞行优化搜索位置的位置更新公式为:

其中,X

Γ为标准的gamma函数,u、v均服从正态分布。

若位置更新后的鲸群个体的适应度高于更新前的适应度,采用更新后的位置替代原位置,否则保留原位置;迭代更新直到达到设定迭代次数或者适应度值小于设定精度。

莱维飞行可以提高不确定环境下的搜索效率,具有更广泛的搜索能力,因此能够扩大搜索范围,应用于鲸鱼优化算法能够提高鲸群的活力和跳跃能力,避免陷入局部最优,从而提高算法的全局寻优能力,实现鼻出血相关疾病的高精度聚类,

疾病预测模块500:用于对待测病例进行数据划分和聚类,在聚类类别中通过计算语义相似度的方式进行疾病预测。所述预测模块具体包括:

数据划分单元:用于分别从向量化的局部疾病数据集和全身疾病数据集中随机选取多个向量,分别计算上述多个向量的均值向量,分别计算待测病例的鼻出血伴随症状特征向量与所述均值向量之间的欧式距离,选取距离最小的均指向量所在数据集作为待测病例的数据划分结果;

聚类单元:用于计算待测病例的鼻出血伴随症状特征向量与对应的数据集的聚类中心点之间的欧式距离,对待测疾病聚类;

相似度计算单元:用于计算待测病例的鼻出血伴随症状特征向量与待测疾病聚类类别中各个样本的余弦相似度,并将对应的疾病名称按照相似度降序排列作为疾病预测结果。

本发明还提出一种电子设备,包括:至少一个处理器、至少一个存储器、通信接口和总线;

其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;

所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令,以实现版本发明所述的系统。

本发明还提出一种计算机可读存储介质,所述计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机实现本发明所述的系统。所述存储介质包括:U盘、移动硬盘、只议存储器ROM、随机存取存储器RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上所描述的系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以分布到多个网络单元上。可以根据实际的衙要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

技术分类

06120112240314