掌桥专利:专业的专利平台
掌桥专利
首页

一种基于机器学习的弱视矫治效果预测方法、装置及设备

文献发布时间:2023-06-19 19:30:30


一种基于机器学习的弱视矫治效果预测方法、装置及设备

技术领域

本申请涉及医疗数据处理技术领域,尤其涉及一种基于机器学习的弱视矫治效果预测方法、装置及设备。

背景技术

弱视严重影响青少年儿童学习生活,弱视如得不到及时治理,会导致患者终身视力受损,给家庭和社会带来沉重负担。然而,弱视眼在矫治上存在病程长、矫治落实难度大,患者年龄越小,矫治效果越好等特点。因此,青少年儿童弱视矫治是一个争分夺秒的过程。但在临床场景下,医生只有在拥有丰富的临床经验和学习较多临床研究报告之后,才能开出较好的矫治方案和对矫治效果有较为粗略的估计。

弱视患者矫治整体方案包括具体矫治措施制定,矫治效果预测以及复诊安排等,高度依赖医生的丰富临床经验,还需要消耗医生较多的时间和精力。此外,我国医疗资源分布很不均衡,每次诊治弱视患者,对乡镇社区卫生机构及欠发达地区县一二级医院在内的基层眼科医生来说都是一次“大数据”的挑战。相比起人脑的记忆分析,机器学习可以帮助分析预测,从而辅助医生做出更合理的决策。毫无疑问,弱视矫治效果预测无论是对初诊病人,还是复诊病人都至关重要。因为:弱视矫治效果预测可以帮助制定更精准的矫治方案;有助于避免因诊断错误与处理不当使患者错过治疗时机。

发明内容

本申请提供了一种基于机器学习的弱视矫治效果预测方法、装置及设备,用于解决现有技术难以预见当前弱视矫治方案的治疗效果,无法控制并避免误诊耽误治疗时机的技术问题。

有鉴于此,本申请第一方面提供了一种基于机器学习的弱视矫治效果预测方法,包括:

获取弱视矫治相关数据,所述弱视矫治相关数据包括患者基础信息、裸眼视力、球镜度数和矫治措施;

采用随机森林算法基于决策树对所述弱视矫治相关数据进行特征筛选分析,得到特征集;

将所述特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果。

优选地,所述获取弱视矫治相关数据,之后还包括:

对所述弱视矫治相关数据进行第一预处理操作,所述第一预处理操作包括缺失值处理。

优选地,所述获取弱视矫治相关数据,之后还包括:

对所述弱视矫治相关数据进行第二预处理操作,所述第二预处理操作包括离散化处理和One-hot编码处理。

优选地,所述采用随机森林算法基于决策树对所述弱视矫治相关数据进行特征筛选分析,得到特征集,包括:

采用随机森林算法计算每颗决策树中所述弱视矫治相关数据对应的样本特征的重要性;

将所有的所述样本特征的重要性进行降序排列,并按照预设百分比筛选所述样本特征,得到特征集。

优选地,所述将所述特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果,包括:

将所述特征集分别输入多种不同的基础预测模型中进行效果预测,得到基础预测结果;

基于预设线性融合公式和所述基础预测结果计算融合结果,得到预测结果,所述预设线性融合公式包括融合权重。

本申请第二方面提供了一种基于机器学习的弱视矫治效果预测装置,包括:

数据获取单元,用于获取弱视矫治相关数据,所述弱视矫治相关数据包括患者基础信息、裸眼视力、球镜度数和矫治措施;

特征筛选单元,用于采用随机森林算法基于决策树对所述弱视矫治相关数据进行特征筛选分析,得到特征集;

效果预测单元,用于将所述特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果。

优选地,还包括:

第一预处理单元,用于对所述弱视矫治相关数据进行第一预处理操作,所述第一预处理操作包括缺失值处理。

优选地,还包括:

第二预处理单元,用于对所述弱视矫治相关数据进行第二预处理操作,所述第二预处理操作包括离散化处理和One-hot编码处理。

优选地,所述特征筛选单元,具体用于:

采用随机森林算法计算每颗决策树中所述弱视矫治相关数据对应的样本特征的重要性;

将所有的所述样本特征的重要性进行降序排列,并按照预设百分比筛选所述样本特征,得到特征集。

本申请第三方面提供了一种基于机器学习的弱视矫治效果预测设备,所述设备包括处理器以及存储器;

所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;

所述处理器用于根据所述程序代码中的指令执行第一方面所述的基于机器学习的弱视矫治效果预测方法。

从以上技术方案可以看出,本申请实施例具有以下优点:

本申请中,提供了一种基于机器学习的弱视矫治效果预测方法,包括:获取弱视矫治相关数据,弱视矫治相关数据包括患者基础信息、裸眼视力、球镜度数和矫治措施;采用随机森林算法基于决策树对弱视矫治相关数据进行特征筛选分析,得到特征集;将特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果。

本申请提供的基于机器学习的弱视矫治效果预测方法,以机器学习为基础,获取弱视矫治相关数据,这些数据除了包括患者基础信息,还包括一些客观检测信息,例如裸眼视力和球镜度数等;然后采用随机森林算法基于弱视矫治相关数据进行特征筛选分析,确保特征提取的准确性;在效果预测阶段,采用多种不同的预测模型进行融合性预测,从而得到更加可靠的预测结果。因此,本申请能够解决现有技术难以预见当前弱视矫治方案的治疗效果,无法控制并避免误诊耽误治疗时机的技术问题。

附图说明

图1为本申请实施例提供的一种基于机器学习的弱视矫治效果预测方法的流程示意图;

图2为本申请实施例提供的一种基于机器学习的弱视矫治效果预测装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了便于理解,请参阅图1,本申请提供的一种基于机器学习的弱视矫治效果预测方法的实施例,包括:

步骤101、获取弱视矫治相关数据,弱视矫治相关数据包括患者基础信息、裸眼视力、球镜度数和矫治措施。

本实施例中的数据筛选自中山大学中山眼科中心与罗定市人民医院合作的CREST项目,具体的筛选自2014~2022年期间该项目长期随访的屈光性弱视青少年儿童患者数据。筛选的弱视矫治相关数据的属性包括患者基础信息,例如性别、年龄、就诊时间等,还有一些客观检测信息,例如裸眼视力、球镜度数、柱镜度数、柱镜轴位和眼压等,还有类似于最佳矫正视力这样的基准数据,以及矫治措施等。其中,矫治措施包括配镜、遮眼、精细目力训练、视功能训练、放松睫状肌、增强眼肌肌力与眼部调节力等操作。矫治措施可以通过数据化的方式描述表达,便于后续的数据分析和效果预测,具体的数据转换方法在此不作限定。

进一步地,步骤101,之后还包括:

对弱视矫治相关数据进行第一预处理操作,第一预处理操作包括缺失值处理。

第一预处理操作的目的是提高弱视矫治相关数据的质量,例如缺失值处理,可以对弱视矫治相关数据中的时序数据的缺失值进行填补和删除操作;若是少量缺失,则进行均值填补;若是缺失程度较大,则删除该列数据。还可以增加其他的预处理过程,主要是改善数据质量,具体的在此不作限定。

进一步地,步骤101,之后还包括:

对弱视矫治相关数据进行第二预处理操作,第二预处理操作包括离散化处理和One-hot编码处理。

第二预处理操作的目的是为了统一量纲,由于弱视矫治相关数据中存在多种不同维度的数据和信息,第二预处理操作可以将数据信息统一成算法方便处理的数据形式。

例如离散化处理就是将球镜>+5.00D的情况归类为高度远视,将0<球镜<=+5.00D的情况归类为中低度远视,将-6.00D<=球镜<0的情况归类为中低度近视,将球镜<-6.00D的情况归类为高度近视。还有柱镜分类:0<=柱镜<=2.50D的情况为中低度散光,柱镜>2.50D的情况为高度散光。此外,还需要进行依从性分析,由于患者治疗效果与依从性息息相关,但往往缺乏量化指标,为此本实施例以患者复诊时间间隔作为依从性判断依据,例如将复诊时间间隔<=3个月的归类为依从性高,将复诊时间间隔介于3~6个月的归类为依从性中,将复诊时间间隔大于6个月的归类为依从性低。

而One-hot编码处理就是针对矫治措施的量化表达过程,将矫治措施进行热编码处理,即配镜、遮眼、精细目力训练、视功能训练、放松睫状肌、增强眼肌肌力与眼部调节六类治疗措施单独成列,并以0和1标识措施是否进行,例如执行了眼部调节操作,则标识为1,否则为0。

步骤102、采用随机森林算法基于决策树对弱视矫治相关数据进行特征筛选分析,得到特征集。

进一步地,步骤102,包括:

采用随机森林算法计算每颗决策树中弱视矫治相关数据对应的样本特征的重要性;

将所有的样本特征的重要性进行降序排列,并按照预设百分比筛选样本特征,得到特征集。

经过预处理操作后的弱视矫治相关数据可以采用具体算法进行统一处理,本实施例采用随机森林算法对弱视矫治相关数据的相关特征进行筛选分析,确保特征表达的准确性,进而提高预测结果的可靠性。

计算随机森林中每颗决策树袋外数据误差

其中,

将每个特征计算的重要性进行降序排列,依次表述为特征减弱,在按照预设百分比筛选样本特征时,可以直接按照预置比例删除靠后的弱特征,得到未删除的特征,形成特征集。此外,还可以根据样本特征对应的均方误差进行误差变化分析,选取均方误差最小的特征集。预设百分比、预置比例等可以根据实际情况设置,在此不作限定。

步骤103、将特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果。

进一步地,步骤103,包括:

将特征集分别输入多种不同的基础预测模型中进行效果预测,得到基础预测结果;

基于预设线性融合公式和基础预测结果计算融合结果,得到预测结果,预设线性融合公式包括融合权重。

本实施例选取的基础预测模型包括SVM、XGboos(XGB_Reg)、LightGBM、GBDT四种,这四个基础预测模型的模型参数都是预先训练过的,已经达到了各自的最优预测状态,基于此可以进行效果预测,得到基础预测结果。然后,使用线性混合Linear Blending方法进行线性融合,具体的融合过程可以表达为:

其中,

可以理解的是,基础预测模型还可以根据实际情况选取,数量也可以自行制定,在此仅作一个示例,不作具体限定;融合权重也可以适时配置。此外,本实施例的预测效果仅仅用于辅助弱视矫治过程,不作为核心治疗手段或者主要的参考标准,不能单独成为治疗依据。

本申请实施例提供的基于机器学习的弱视矫治效果预测方法,以机器学习为基础,获取弱视矫治相关数据,这些数据除了包括患者基础信息,还包括一些客观检测信息,例如裸眼视力和球镜度数等;然后采用随机森林算法基于弱视矫治相关数据进行特征筛选分析,确保特征提取的准确性;在效果预测阶段,采用多种不同的预测模型进行融合性预测,从而得到更加可靠的预测结果。因此,本申请实施例能够解决现有技术难以预见当前弱视矫治方案的治疗效果,无法控制并避免误诊耽误治疗时机的技术问题。

为了便于理解,请参阅图2,本申请提供了一种基于机器学习的弱视矫治效果预测装置的实施例,包括:

数据获取单元201,用于获取弱视矫治相关数据,弱视矫治相关数据包括患者基础信息、裸眼视力、球镜度数和矫治措施;

特征筛选单元202,用于采用随机森林算法基于决策树对弱视矫治相关数据进行特征筛选分析,得到特征集;

效果预测单元203,用于将特征集分别输入多种不同的基础预测模型中进行效果预测,再进行融合操作,得到预测结果。

进一步地,还包括:

第一预处理单元204,用于对弱视矫治相关数据进行第一预处理操作,第一预处理操作包括缺失值处理。

进一步地,还包括:

第二预处理单元205,用于对弱视矫治相关数据进行第二预处理操作,第二预处理操作包括离散化处理和One-hot编码处理。

进一步地,特征筛选单元202,具体用于:

采用随机森林算法计算每颗决策树中弱视矫治相关数据对应的样本特征的重要性;

将所有的样本特征的重要性进行降序排列,并按照预设百分比筛选样本特征,得到特征集。

本申请还提供了一种基于机器学习的弱视矫治效果预测设备,设备包括处理器以及存储器;

存储器用于存储程序代码,并将程序代码传输给处理器;

处理器用于根据程序代码中的指令执行上述方法实施例中的基于机器学习的弱视矫治效果预测方法。

在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:Random Access Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

技术分类

06120115929609