掌桥专利:专业的专利平台
掌桥专利
首页

基于云计算和人工智能的融合多维度医疗数据的肿瘤精细分类系统

文献发布时间:2023-06-19 16:09:34



技术领域

本发明创造涉及医疗大数据领域,具体涉及一种基于云计算和人工智能的融合多维度医疗数据的肿瘤精细分类系统。

背景技术

癌症是人类健康的重大威胁,癌症早期筛查与诊断是公认的降低癌症死亡率的有效方法。但是,不断恶化的癌症形势与专业人员的相对紧缺是当前癌症形势下所面临的一对尖锐矛盾。随着医疗技术的快速发展,医疗数据的种类和数量在不断丰富和增加,与肿瘤相关的影像数据、临床数据等医疗数据的不断积累为肿瘤的智能筛查与诊断提供了有力的材料。在众多医疗数据中影像数据最为常见,通常格式规范且易于获取,同时,影像在肿瘤的诊断过程中起着关键作用,包括早期诊断、疗效监测和预后评估都与医疗影像密不可分。通过对医学图像的图像特征进行提取从而获取医学图像的高维图像特征,并结合临床数据,借助计算机辅助技术来帮助医生更加全面准确地分析这些高维图像特征和临床数据,在临床诊断和治疗方面显得尤为重要。支持向量机是机器学习中十分重要的一个算法,由于其较好的性能在被应用于肿瘤分类中能够获得较好的分类结果,但其性能容易受到其参数的影响,因此,其参数优化问题成为使用支持向量机的关键问题。

发明内容

针对上述问题,本发明旨在提供一种基于云计算和人工智能的融合多维度医疗数据的肿瘤精细分类系统。

本发明创造的目的通过以下技术方案实现:

基于云计算和人工智能的融合多维度医疗数据的肿瘤精细分类系统,包括医疗数据收集模块、医疗数据管理模块、肿瘤诊断模型更新模块和智能肿瘤分类模块;

医疗数据收集模块用于收集带有肿瘤疾病诊断标签的医疗数据,并将收集的医疗数据输入医疗数据管理模块;

医疗数据管理模块包括医疗数据预存储单元和医疗数据更新检测单元,医疗数据预存储单元根据所述医疗数据带有的肿瘤疾病诊断标签将相同肿瘤疾病类型的医疗数据划分为一类进行存储,医疗数据更新检测单元用于对医疗数据预存储单元中存储的各肿瘤疾病类型对应的医疗数据进行检测,当一个肿瘤疾病类型对应的医疗数据的总数量达到给定的更新阈值时,则令医疗数据预存储单元将该肿瘤疾病类型对应的医疗数据输入肿瘤诊断模型更新模块;

肿瘤诊断模型更新模块包括医疗数据处理单元、各肿瘤疾病类型对应的医疗数据库和肿瘤诊断模型更新单元,医疗数据处理单元用于对接收到的医疗数据进行处理,将处理后的医疗数据作为医疗样本数据,并根据其对应的肿瘤疾病诊断标签输入对应的医疗数据库,医疗数据库将接收到的新的医疗样本数据进行存储,并在其先前存储的医疗样本数据中随机选取和新接收到的医疗样本数据相同数量的医疗样本数据舍弃,从而实现医疗数据库中医疗样本数据的更新,肿瘤诊断模型更新单元用于实时对其对应的医疗数据库进行检测,当检测到其对应的医疗数据库中存在医疗样本数据的更新时,则调取其对应的医疗数据库中的医疗样本数据重新构建该肿瘤疾病类型对应的肿瘤诊断模型;

智能肿瘤分类模块用于对待诊断病患的医疗数据进行处理,并将处理后的待诊断病患的医疗数据和各肿瘤疾病类型对应的医疗数据库中存储的医疗样本数据进行相似检测,选取和待诊断病患的医疗数据最为相似的医疗数据库对应的肿瘤疾病类型为待诊断病患的肿瘤疾病检测类型,并将待诊断病患的医疗数据输入该肿瘤疾病类型对应的肿瘤诊断模型中,所述肿瘤诊断模型的输出值即为该病患的肿瘤疾病诊断结果。

进一步的,所述医疗数据包括病患的医学图像和临床医学数据。

进一步的,医疗数据处理单元用于对接收到的医疗数据进行处理,包括医学图像处理部分和医学数据处理部分,医学图像处理部分用于对接收到的医学图像进行目标分割和特征提取,从而构建所述医学图像对应的图像特征向量,医学数据处理部分用于对接收到的临床医学数据进行处理,去除所述临床医学数据中的噪声数据。

进一步的,肿瘤诊断模型更新单元调取其对应的医疗数据库中的医疗样本数据对支持向量机进行训练和测试,所述医疗样本数据作为支持向量机的输入值,医疗样本数据对应的肿瘤疾病诊断标签作为支持向量机的输出值,从而获得各肿瘤疾病类型对应的肿瘤诊断模型。

进一步的,肿瘤诊断模型更新单元通过调取的医疗样本数据对支持向量机进行训练时,采用萤火虫算法确定所述支持向量机的惩罚因子和核函数参数,在采用萤火虫算法对支持向量机的惩罚因子和核函数参数进行寻优的过程中,每只萤火虫采用轮盘赌法则选择向着比自身荧光亮度高的个体移动,并根据吸引力确定每只萤火虫的移动距离,在此基础上,设萤火虫i选择向着萤火虫j进行移动,最终实现第(t+1)次的迭代更新,具体的位置更新公式如下:

在上式中,x

进一步的,将在第t次迭代更新后萤火虫j对于萤火虫i的吸引度β

在上式中,

进一步的,将在第t次迭代更新后萤火虫i向着萤火虫j进行随机移动的随机项系数α

将种群中各萤火虫在进行第(t+1)次迭代更新时选取的作为移动方向的萤火虫组成的集合表示为K(t),当集合K(t)中存在重复的作为移动方向的萤火虫时则仅保留这些重复的萤火虫中的一个,定义θ

在上式中,M

当θ

当θ

在上式中,α

本发明创造的有益效果:通过对医学图像的图像特征进行提取从而获取医学图像的高维图像特征,并结合临床数据,构建各肿瘤疾病类型对应的肿瘤诊断模型,从而实现各肿瘤疾病类型的高效、精确的诊断,对于肿瘤疾病的诊断和早期筛查具有重大意义;将萤火虫算法应用到对支持向量机的参数的寻优中,并对萤火虫算法固有的缺陷进行改进,使得通过改进的萤火虫算法确定的参数能够有效的提高支持向量机的分类精度。

附图说明

利用附图对发明创造作进一步说明,但附图中的实施例不构成对本发明创造的任何限制,对于本领域的普通技术人员,在不付出创造性劳动的前提下,还可以根据以下附图获得其它的附图。

图1是本发明结构示意图。

具体实施方式

结合以下实施例对本发明作进一步描述。

参见图1,本实施例的基于云计算和人工智能的融合多维度医疗数据的肿瘤精细分类系统,包括医疗数据收集模块、医疗数据管理模块、肿瘤诊断模型更新模块和智能肿瘤分类模块;

医疗数据收集模块用于收集带有肿瘤疾病诊断标签的医疗数据,并将收集的医疗数据输入医疗数据管理模块;

医疗数据管理模块包括医疗数据预存储单元和医疗数据更新检测单元,医疗数据预存储单元根据所述医疗数据带有的肿瘤疾病诊断标签将相同肿瘤疾病类型的医疗数据划分为一类进行存储,医疗数据更新检测单元用于对医疗数据预存储单元中存储的各肿瘤疾病类型对应的医疗数据进行检测,当一个肿瘤疾病类型对应的医疗数据的总数量达到给定的更新阈值时,则令医疗数据预存储单元将该肿瘤疾病类型对应的医疗数据输入肿瘤诊断模型更新模块;

肿瘤诊断模型更新模块包括医疗数据处理单元、各肿瘤疾病类型对应的医疗数据库和肿瘤诊断模型更新单元,医疗数据处理单元用于对接收到的医疗数据进行处理,将处理后的医疗数据作为医疗样本数据,并根据其对应的肿瘤疾病诊断标签输入对应的医疗数据库,医疗数据库将接收到的新的医疗样本数据进行存储,并在其先前存储的医疗样本数据中随机选取和新接收到的医疗样本数据相同数量的医疗样本数据舍弃,从而实现医疗数据库中医疗样本数据的更新,肿瘤诊断模型更新单元用于实时对其对应的医疗数据库进行检测,当检测到其对应的医疗数据库中存在医疗样本数据的更新时,则调取其对应的医疗数据库中的医疗样本数据重新构建该肿瘤疾病类型对应的肿瘤诊断模型;

智能肿瘤分类模块用于对待诊断病患的医疗数据进行处理,并将处理后的待诊断病患的医疗数据和各肿瘤疾病类型对应的医疗数据库中存储的医疗样本数据进行相似检测,选取和待诊断病患的医疗数据最为相似的医疗数据库对应的肿瘤疾病类型为待诊断病患的肿瘤疾病检测类型,并将待诊断病患的医疗数据输入该肿瘤疾病类型对应的肿瘤诊断模型中,所述肿瘤诊断模型的输出值即为该病患的肿瘤疾病诊断结果。

优选的,所述医疗数据包括病患的医学图像和临床医学数据。

优选的,医疗数据处理单元用于对接收到的医疗数据进行处理,包括医学图像处理部分和医学数据处理部分,医学图像处理部分用于对接收到的医学图像进行目标分割和特征提取,从而构建所述医学图像对应的图像特征向量,医学数据处理部分用于对接收到的临床医学数据进行处理,去除所述临床医学数据中的噪声数据。

本实施例对医学图像的图像特征进行提取从而获取医学图像的高维图像特征,并结合临床数据,构建各肿瘤疾病类型对应的肿瘤诊断模型,从而实现各肿瘤疾病类型的高效、精确的诊断,对于肿瘤疾病的诊断和早期筛查具有重大意义。

优选的,肿瘤诊断模型更新单元调取其对应的医疗数据库中的医疗样本数据对支持向量机进行训练和测试,所述医疗样本数据作为支持向量机的输入值,医疗样本数据对应的肿瘤疾病诊断标签作为支持向量机的输出值,从而获得各肿瘤疾病类型对应的肿瘤诊断模型。

本实施例将萤火虫算法应用到对支持向量机的参数的寻优中,并对萤火虫算法固有的缺陷进行改进,使得通过改进的萤火虫算法确定的参数能够有效的提高支持向量机的分类精度。

优选的,肿瘤诊断模型更新单元通过调取的医疗样本数据对支持向量机进行训练时,采用萤火虫算法确定所述支持向量机的惩罚因子和核函数参数,在采用萤火虫算法对支持向量机的惩罚因子和核函数参数进行寻优的过程中,每只萤火虫采用轮盘赌法则选择向着比自身荧光亮度高的个体移动,并根据吸引力确定每只萤火虫的移动距离,在此基础上,设萤火虫i选择向着萤火虫j进行移动,最终实现第(t+1)次的迭代更新,具体的位置更新公式如下:

在上式中,x

优选的,将在第t次迭代更新后萤火虫j对于萤火虫i的吸引度β

在上式中,

具体的,在萤火虫算法中,萤火虫的绝对荧光亮度值越高,该萤火虫代表的解越优,萤火虫向着比自身荧光亮度高的个体移动,通过每一代萤火虫的移动,最终使得萤火虫聚集到最优萤火虫位置的周围,即找到最优极值点,从而达到种群寻优的目的。萤火虫的移动距离直接关系着萤火虫的收敛速度和寻优精度,在传统萤火虫算法中,萤火虫的移动距离由萤火虫之间的吸引度决定,而吸引度与萤火虫之间的距离成反比,即随着距离的增大,吸引度随之减小,然而在实际的寻优过程中,仅仅通过距离决定萤火虫的移动距离,使得算法缺乏自适应,为了通过调节萤火虫的移动距离来更好的平衡算法的收敛速度和寻优精度,本实施例引入了历史调节系数,该历史调节系数用于统计萤火虫和其选取的作为移动方向的较优萤火虫之间形成的区域在历史迭代过程中被萤火虫进行寻优的平均次数,当该区域在历史迭代过程中被较多的萤火虫搜索过时,通过历史调节系数减小该较优萤火虫的吸引度,从而减少对该较优萤火虫区域过多的重复搜索,增加其他较优萤火虫区域被搜索的机会,从而增加算法解的多样性,相反的,当该区域在历史迭代过程中被较少的萤火虫搜索过时,通过历史调节系数增加该萤火虫的吸引度,使得萤火虫对该区域进行挖掘,提高算法的局部挖掘精度。即设置历史调节系数根据实际的寻优情况使得萤火虫在位置更新时的移动距离可以获得更好的收敛速度和寻优精度。

优选的,将在第t次迭代更新后萤火虫i向着萤火虫j进行随机移动的随机项系数α

将种群中各萤火虫在进行第(t+1)次迭代更新时选取的作为移动方向的萤火虫组成的集合表示为K(t),当集合K(t)中存在重复的作为移动方向的萤火虫时则仅保留这些重复的萤火虫中的一个,定义θ

在上式中,M

当θ

当θ

在上式中,α

具体的,在萤火虫算法中,每只萤火虫采用轮盘赌法则选择向着比自身荧光亮度高的个体移动,因此,采用轮盘赌法则选取的作为移动方向的萤火虫仅与萤火虫当前的绝对荧光亮度相关,而选取的作为移动方向的较优萤火虫在寻优的过程中起着引导种群的寻优方向的作用,因此,当选取的较优萤火虫在当前的寻优基础上分布的过于片面时,就不能很全面的带领种群中萤火虫的迭代寻优,则容易使得种群出现陷入局部最优的情况,因此,本实施例通过改进种群中萤火虫在进行位置更新时的随机项来避免算法陷入局部最优的情况,随机项中随机项系数的选取直接关系到随机项的扰动范围,从而影响算法的搜索精度,因此,本实施例对萤火虫算法中的随机项系数进行改进,使得随机项在避免算法陷入局部最优的同时,提高算法的搜索精度。在设置种群中各萤火虫在进行位置更新时的随机项系数时,首先通过定义的移动方向属性值对种群当前选取的作为移动方向的较优萤火虫进行检测,当种群选取的不同的作为移动方向的较优萤火虫的数量越多,并且这些较优萤火虫之间的分布在当前寻优的基础上较为分散时,则表明种群当前选取的作为移动方向的较优萤火虫能够带领种群进行较为全面的寻优,此时设置较小的随机项系数,使得位置更新公式中的随机项的作用为加强种群的区域搜索精度,而当种群选取的不同的作为移动方向的较优萤火虫的数量较少,或者这些较优萤火虫在当前寻优的基础上分布的较为片面,此时设置较大的随机项系数,扩大随机项的扰动范围,使得位置更新公式中的随机项的作用为帮助萤火虫跳出局部最优。即根据选取的作为移动方向的萤火虫的实际情况来设置随机项系数的值,从而通过随机项系数来加强种群的搜索精度和帮助种群跳出局部最优,使得通过萤火虫算法确定的参数能有效提高支持向量机的分类精度。

最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细地说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。

技术分类

06120114722948