掌桥专利:专业的专利平台
掌桥专利
首页

一种医疗数据学习系统

文献发布时间:2023-06-19 16:11:11



技术领域

本申请涉及人工智能技术领域,具体而言,涉及一种医疗数据学习系统。

背景技术

目前,越来越多的医疗机构使用了人工智能(Artificial Intelligence,AI)来辅助治疗和病例管理。在AI技术中,最常见的就是使用机器学习(Machine Learning,ML)、深度学习(Deep Learning,DL)技术来从医疗机构的医疗数据中抽取知识、整合知识,并转变成医院的任务,如辅助治疗、质量控制、数据上报等。而AI技术的效果依赖于医疗机构的医疗数据,当前由于医疗数据的隐私性,获取大量医疗数据的难度大、成本高,而且在数据传递过程中可能产生数据隐私风险,因此医疗机构并不希望将医疗数据传输到外部服务器中与其他机构共享。由于开源的数据集较少,导致应用在医疗机构中的医学模型的学习效果不好,从而使得医学模型的准确率较低,降低医学模型的使用效果。

发明内容

有鉴于此,本申请的目的在于提供一种医疗数据学习系统,能够通过多个医疗终端的本地医疗数据样本训练医学模型,以提高医疗终端本地的医学模型的准确率,达到显著提升医学模型的使用效果的目的。

第一方面,本申请实施例提供了一种医疗数据学习系统,所述系统包括云服务器和多个医疗终端,所述云服务器包括预先训练完成的多个医学模型,每个医学模型对应一种功能标识;其中,所述预先训练完成的多个医学模型中的每个医学模型均是通过所述多个医疗终端的本地医疗数据样本训练得到的;

云服务器,用于接收目标医疗终端发起的携带有目标功能标识的功能请求,并基于所述目标功能标识从所述多个医学模型中调取与所述功能请求对应的目标医学模型,将该目标医学模型的模型参数下发至该目标医疗终端;其中,所述目标医疗终端为所述多个医疗终端中的其中一个;

目标医疗终端,用于根据所述目标医学模型的模型参数得到所述目标医疗终端本地的医学模型。

本申请的一种可选实施例中,所述预先训练完成的多个医学模型包括医疗费用预测模型、医学实体识别模型、专科病症预测模型和医学实体关系抽取模型。

本申请的一种可选实施例中,医疗终端:用于发送医疗费用预测模型的模型参数至云服务器;其中,医疗费用预测模型是通过与医疗费用标识对应的本地医疗数据样本训练得到的;

云服务器:用于利用联邦平均算法对各个医疗终端发送的医疗费用预测模型的模型参数进行处理,得到更新后的模型参数,发送更新后的模型参数至每个医疗终端;

医疗终端:用于根据更新后的模型参数更新医疗费用预测模型,并判断针对所述医疗费用预测模型的训练轮数是否达到预设轮数阈值;若所述训练轮数未达到预设轮数阈值,则重复执行向云服务器发送更新后的医疗费用预测模型的模型参数,以使云服务器利用联邦平均算法对各个医疗终端发送的更新后的医疗费用预测模型的模型参数进行处理,再次得到更新后的模型参数,发送再次更新后的模型参数至每个医疗终端,以使医疗终端继续根据更新后的模型参数更新医疗费用预测模型的步骤,直至所述训练轮数达到预设轮数阈值,得到最终训练完成的医疗费用预测模型。

本申请的一种可选实施例中,云服务器,用于基于开源数据集或共享医学数据集对医学实体识别模型进行预训练,得到初始医学实体识别模型,并将所述初始医学实体识别模型的模型参数下发至一个医疗终端;

医疗终端,用于根据云服务器下发的初始医学实体识别模型的模型参数更新该医疗终端本地的医学实体识别模型,并基于与医学实体标识对应的本地医疗数据样本训练本地更新后的医学实体识别模型,得到该医疗终端上训练完成的医学实体识别模型;将所述训练完成的医学实体识别模型的模型参数发送至云服务器;

云服务器,用于将一个医疗终端发送的训练完成的医学实体识别模型的模型参数下发至下一医疗终端,以使下一医疗终端根据云服务器发送的上一医疗终端的医学实体识别模型的模型参数更新其本地的医学实体识别模型,并基于该医疗终端上与医学实体标识对应的本地医疗数据样本训练更新后的医学实体识别模型,得到该医疗终端上训练完成的医学实体识别模型,继续将所述训练完成的医学实体识别模型的模型参数发送至所述云服务器,直至所述多个医疗终端上与医学实体标识对应的本地医疗数据样本均参与模型训练,得到训练完成的医学实体识别模型的最终模型参数,并将最终模型参数发送至每个医疗终端,以使每个医疗终端根据所述最终模型参数重新更新其本地的医学实体识别模型。

本申请的一种可选实施例中,所述本地医疗数据样本包括本地医疗数据正样本和本地医疗数据负样本;

所述本地医疗数据正样本包括带有医学实体标注结果的医疗数据,

所述本地医疗数据负样本包括未带有医学实体标注结果的医疗数据。

本申请的一种可选实施例中,当一个医疗终端包括多个医疗子终端时,

医疗子终端,用于发送医学实体识别模型的模型参数至所述云服务器;其中,所述医学实体识别模型是通过与医学实体标识对应的本地医疗数据样本训练得到的;

云服务器,用于接收多个医疗子终端发送的本地的医学实体识别模型的模型参数,对多个医学实体识别模型的模型参数进行聚合,得到聚合后的模型参数;发送所述聚合后的模型参数至每个医疗子终端;

医疗子终端,还用于根据聚合后的模型参数更新其本地的医学实体识别模型,并判断针对所述医学实体识别模型的训练轮数是否达到预设轮数阈值;若所述训练轮数未达到预设轮数阈值,则重复执行向云服务器发送更新后的医学实体识别模型的模型参数,以使云服务器对接收到的各个医疗子终端发送的更新后的模型参数进行聚合,再次得到聚合后的模型参数,发送再次聚合后的模型参数至每个医疗子终端,以使医疗子终端继续根据聚合后的模型参数更新医学实体识别模型的步骤,直至所述训练轮数达到预设轮数阈值,得到最终训练完成的医学实体识别模型。

本申请的一种可选实施例中,云服务器,用于根据开源数据集或共享医学数据集对表征模型进行训练,将训练完成的表征模型的模型参数下发至每个医疗终端;

医疗终端,用于根据所述表征模型的模型参数更新本地的表征模型,并根据更新后的表征模型从本地医疗数据中提取出针对专科病症的医学实体表征,并获取针对该医学实体表征的标注结果,将提取出的医学实体表征和获取到的针对该医学实体表征的标注结果上传至所述云服务器;

云服务器,用于将多个医疗终端发送的医学实体表征和针对该医学实体表征的标注结果进行聚合,得到聚合后的医学实体表征和针对聚合后的医学实体表征的标注结果;将聚合后的医学实体表征和针对聚合后的医学实体表征的标注结果作为正样本,将除专科病症对应的医疗数据之外的本地医疗数据作为负样本,对专科病症预测模型进行训练;将训练完成的专科病症预测模型的模型参数下发至每个医疗终端,以使每个医疗终端根据训练完成的专科病症预测模型的模型参数更新其本地的专科病症预测模型。

本申请的一种可选实施例中,云服务器,用于基于开源数据集或共享医学数据集对语言表征模型进行预训练,得到预训练完成的语言表征模型,并将所述预训练完成的语言表征模型的模型参数下发至每个医疗终端;

医疗终端,用于根据所述预训练完成的语言表征模型的模型参数更新本地的语言表征模型,并基于本地医疗数据对本地更新后的语言表征模型进行训练,得到训练完成的语言表征模型,将训练完成的语言表征模型的模型参数发送给所述云服务器;

云服务器,用于将每个医疗终端发送的语言表征模型的模型参数进行融合,得到融合后的语言表征模型的模型参数并得到与融合后的模型参数对应的最终语言表征模型,将最终语言表征模型拼接判别式模型得到医学实体关系抽取模型并进行训练,将训练完成的医学实体关系抽取模型的模型参数下发至每个医疗终端,以使每个医疗终端根据所述云服务器下发的医学实体关系抽取模型的模型参数得到本地的医学实体关系抽取模型。

本申请的一种可选实施例中,所述系统还包括数据分类装置,所述数据分类装置用于:

采集医疗终端的医疗数据,并根据功能标识对所述医疗数据进行分类,得到与功能标识对应的本地医疗数据样本;其中,所述功能标识包括医疗费用标识、医学实体标识和专科疾病标识中的至少一个。

本申请的一种可选实施例中,所述云服务器上搭建有联邦学习框架,所述联邦学习框架用于支撑所述多个医学模型的训练。

本申请实施例提供了一种医疗数据学习系统,系统包括云服务器和多个医疗终端,云服务器包括预先训练完成的多个医学模型,每个医学模型对应一种功能标识;其中,预先训练完成的多个医学模型中的每个医学模型均是通过多个医疗终端的本地医疗数据样本训练得到的;云服务器接收目标医疗终端发起的携带有目标功能标识的功能请求,并基于目标功能标识从多个医学模型中调取与功能请求对应的目标医学模型,将该目标医学模型的模型参数下发至该目标医疗终端;其中,目标医疗终端为多个医疗终端中的其中一个;目标医疗终端根据目标医学模型的模型参数得到目标医疗终端本地的医学模型。本申请能够通过多个医疗终端的本地医疗数据样本训练医学模型,以提高医疗终端本地的医学模型的准确率,达到显著提升医学模型的使用效果的目的。

为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种医疗数据学习系统的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的每个其他实施例,都属于本申请保护的范围。

目前,越来越多的医疗机构使用了人工智能(Artificial Intelligence,AI)来辅助治疗和病例管理。在AI技术中,最常见的就是使用机器学习(Machine Learning,ML)、深度学习(Deep Learning,DL)技术来从医疗机构的医疗数据中抽取知识、整合知识,并转变成医院的任务,如辅助治疗、质量控制、数据上报等。而AI技术的效果依赖于医疗机构的医疗数据,当前由于医疗数据的隐私性,获取大量医疗数据的难度大、成本高,而且在数据传递过程中可能产生数据隐私风险,因此医疗机构并不希望将医疗数据传输到外部服务器中与其他机构共享。由于开源的数据集较少,导致应用在医疗机构中的医学模型的学习效果不好,从而使得医学模型的准确率较低,降低医学模型的使用效果。

基于此,本申请实施例提供了一种医疗数据学习系统,能够通过多个医疗终端的本地医疗数据样本训练医学模型,以提高医疗终端本地的医学模型的准确率,达到显著提升医学模型的使用效果的目的。

请参阅图1,图1为本申请实施例所提供的一种医疗数据学习系统的结构示意图。如图1中所示,本申请实施例提供了一种医疗数据学习系统,该系统100包括云服务器110和多个医疗终端120,云服务器110包括预先训练完成的多个医学模型,每个医学模型对应一种功能标识;其中,预先训练完成的多个医学模型中的每个医学模型均是通过多个医疗终端的本地医疗数据样本训练得到的。

这里,医疗终端为医疗机构所在的终端,一个医疗机构对应一个医疗终端。云服务器上搭建有联邦学习框架,该联邦学习框架用于支撑多个医学模型的训练。

举例说明,云服务器上搭建有联邦学习框架,联邦学习框架包括联邦学习模型、联邦算法学习模块、联邦预处理模块和平台管理模块。每个医疗终端上包括本地的医学模型,数据导入模块,数据清洗模块和数据存储模块。

具体地,联邦学习模型可以包括联邦回归模型、联邦分类模型、联邦树模型、联邦注意力模型、联邦融合模型等;联邦算法学习模块对应的学习算法可以包括联邦随机梯度算法、联邦平均算法、概率联邦网络匹配算法、差分隐私联邦随机梯度、差分隐私联邦平均算法、迁移学习算法等;联邦预处理模块对应的预处理方式可以包括特征聚合、模型合并、预加载模型初始化、特征优化和预训练数据采样等;平台管理模块能够实现结点管理、安全认证、网络传输、模型开发、任务管理、管理界面等。

每个医疗终端上包括本地的医学模型,本地的医学模型用于根据本地医疗数据进行训练;数据导入模块用于导入医疗数据;数据清洗模块用于对医疗数据进行清洗,包括脱敏、字段切分、简单特征化等;数据存储模块用于存储医疗数据。

在上述医疗数据学习系统中,云服务器可以将医学模型的特征参数、医学模型的模型参数或医学模型下发至每个医疗终端,每个医疗终端可以将医学模型的模型参数或医学模型上传至云服务器进行保存。

通过上述医疗数据学习系统,不需要频繁大量的数据传输过程,既保证了对医疗数据的隐私保护,又将联邦学习模型应用在更复杂的医学AI领域,使医疗数据能够共用、共享、共建。这里的医疗数据学习系统具有医学模型下发功能。也就是医学模型不一定是要在医疗机构中事先定义,而是可以通过云服务器来将医学模型下发到各医疗机构,这样支持医学模型的随时更新。在云服务器上定义了通用性的医学领域的联邦学习框架,在联邦学习框架的支撑下添加了多种模型学习方式,并且联邦学习框架对于模型模块的设计足够包容,使得里面的模型模块可以支持更多种类的模型,并且增加了模型下发的过程,可以使得一些模型通过云服务器下发,从而可以达到各个医疗机构的系统在无需重新部署的条件下,就能在一些特定业务中使用新的模型。

具体在应用上述医疗数据学习系统时,云服务器和目标医疗终端分别执行如下过程:

云服务器,用于接收目标医疗终端发起的携带有目标功能标识的功能请求,并基于目标功能标识从多个医学模型中调取与功能请求对应的目标医学模型,将该目标医学模型的模型参数下发至该目标医疗终端;其中,目标医疗终端为多个医疗终端中的其中一个;

目标医疗终端,用于根据目标医学模型的模型参数得到目标医疗终端本地的医学模型。

通过上述方式,目标医疗终端可以随时从云服务器上调取目标医疗终端所需要的目标医学模型,且调取的目标医学模型是经过多个医疗终端的本地医疗数据样本训练得到的,随着医疗终端的本地医疗数据样本的更新,云服务器上保存的目标医疗终端也会随着更新,从而可以保证目标医疗终端调取的目标医学模型的准确率。

一种可选的实施例中,目标医疗终端还可以用于根据目标医学模型的模型参数以及本地医疗数据更新目标医疗终端本地的医学模型。

通过上述方式,目标医疗终端所对应的医疗机构可以获取到精确度较高的医学模型进行医疗数据学习,进而提高医学模型的应用效果。

进一步的,系统还包括数据分类装置,数据分类装置用于:

采集医疗终端的医疗数据,并根据功能标识对医疗数据进行分类,得到与功能标识对应的本地医疗数据样本;其中,功能标识包括医疗费用标识、医学实体标识和专科疾病标识中的至少一个。

这里,由于医疗数据的种类繁多,在训练某个医学模型时,可能不需要使用全部的医疗数据,这样在训练医学模型之前将医疗数据进行分类,可以提高医学模型训练的速度。本申请实施例中,根据医学模型的功能属性,如医学实体识别、医学实体关系抽取、医疗费用预测以及专科病症预测等,定义一些功能标识,并将大量的医疗数据进行分类,每一类医疗数据对应一个功能标识。

示例性的,医学实体标识对应的医疗数据用于训练医学实体识别模型和医学实体关系抽取模型,医疗费用标识对应的医疗数据用于训练医疗费用预测模型,专科疾病标识对应的医疗数据用于训练专科病症预测模型。其中,专科疾病标识包括脓毒血症标识、深静脉血栓标识等。

一种可选的实施例中,预先训练完成的多个医学模型包括医疗费用预测模型、医学实体识别模型、专科病症预测模型和医学实体关系抽取模型;其中,医疗费用预测模型用于医疗费用预测,医学实体识别模型用于医学实体识别,专科病症预测模型用于专科病症预测,医学实体关系抽取模型用于医学实体关系抽取。其中,医学实体关系抽取模型先进行医学实体表征生成,再利用生成的医学实体表征进行医学实体关系抽取。

下面针对多个医学模型包括医疗费用预测模型、医学实体识别模型、专科病症预测模型和医学实体关系抽取模型的模型训练方法分别进行详细介绍:

第一种实施例中,当医学模型为医疗费用预测模型时,医疗数据学习系统通过以下方式训练医疗费用预测模型:

医疗终端:用于发送医疗费用预测模型的模型参数至云服务器;其中,医疗费用预测模型是通过与医疗费用标识对应的本地医疗数据样本训练得到的。

其中,预先将医疗终端本地的医疗数据进行分类,会得到与医疗费用标识对应的本地医疗数据样本,基于与医疗费用标识对应的本地医疗数据样本对医疗费用预测模型进行训练,得到医疗终端本地的医疗费用预测模型。

云服务器:用于利用联邦平均算法对各个医疗终端发送的医疗费用预测模型的模型参数进行处理,得到更新后的模型参数,发送更新后的模型参数至每个医疗终端。

这里,利用联邦平均算法对各个医疗终端发送的医疗费用预测模型的模型参数进行聚合,得到聚合后的模型参数,并将聚合后的模型参数发送至每个医疗终端。

医疗终端:用于根据更新后的模型参数更新医疗费用预测模型,并判断针对医疗费用预测模型的训练轮数是否达到预设轮数阈值;若训练轮数未达到预设轮数阈值,则重复执行向云服务器发送更新后的医疗费用预测模型的模型参数,以使云服务器利用联邦平均算法对各个医疗终端发送的更新后的医疗费用预测模型的模型参数进行处理,再次得到更新后的模型参数,发送再次更新后的模型参数至每个医疗终端,以使医疗终端继续根据更新后的模型参数更新医疗费用预测模型的步骤,直至训练轮数达到预设轮数阈值,得到最终训练完成的医疗费用预测模型。

示例性的,医疗费用预测模型可以用于医疗费用预测,具体地,可以用于疾病诊断相关分组(DRG)费用预测,下面以医疗费用预测模型为疾病诊断相关分组费用预测模型为例进行举例说明:

进而,上述疾病诊断相关分组费用预测模型的训练过程包括如下步骤:

步骤101:云服务器发起训练操作;

步骤102:各医疗终端同时启动相同的疾病诊断相关分组费用预测模型进行一轮训练;

步骤103:各医疗终端完成1轮(或多轮)训练后,将疾病诊断相关分组费用预测模型的模型参数上传给云服务器;

步骤104:云服务器根据迁移学习算法,对疾病诊断相关分组费用预测模型的模型参数进行聚合后下发最新的疾病诊断相关分组费用预测模型的模型参数给各个医疗终端;

步骤105:各个医疗终端收到云服务器发送的疾病诊断相关分组费用预测模型的模型参数后更新其本地的疾病诊断相关分组费用预测模型,继续进行步骤103和步骤104,直到达到结束状态;其中,结束状态为训练轮数达到预设轮数阈值;

步骤106:云服务器将最终的疾病诊断相关分组费用预测模型的模型参数下发给各个医疗终端,以使各个医疗终端完成本地的疾病诊断相关分组费用预测模型的更新过程。

由于每个医疗机构中医生的操作习惯、使用药物的情况、给病人做检查的情况或是诊疗手段等都可能不同,导致各个医疗机构的医疗数据存在较大区别,这样结合各个医疗机构的医疗数据对疾病诊断相关分组费用预测模型进行训练,由于各个医疗机构的医疗数据组合后的丰富度和规范性更高,这样训练出来的模型准确性也更高,从而使得疾病诊断相关分组费用预测模型在预测费用时更加准确。

第二种实施例中,当医学模型为医学实体识别模型时,医疗数据学习系统通过以下方式训练医学实体识别模型:

云服务器,用于基于开源数据集或共享医学数据集对医学实体识别模型进行预训练,得到初始医学实体识别模型,并将初始医学实体识别模型的模型参数下发至一个医疗终端;

医疗终端,用于根据云服务器下发的初始医学实体识别模型的模型参数更新该医疗终端本地的医学实体识别模型,并基于与医学实体标识对应的本地医疗数据样本训练本地更新后的医学实体识别模型,得到该医疗终端上训练完成的医学实体识别模型;将训练完成的医学实体识别模型的模型参数发送至云服务器;

云服务器,用于将一个医疗终端发送的训练完成的医学实体识别模型的模型参数下发至下一医疗终端,以使下一医疗终端根据云服务器发送的上一医疗终端的医学实体识别模型的模型参数更新其本地的医学实体识别模型,并基于该医疗终端上与医学实体标识对应的本地医疗数据样本训练更新后的医学实体识别模型,得到该医疗终端上训练完成的医学实体识别模型,继续将训练完成的医学实体识别模型的模型参数发送至云服务器,直至多个医疗终端上与医学实体标识对应的本地医疗数据样本均参与模型训练,得到训练完成的医学实体识别模型的最终模型参数,并将最终模型参数发送至每个医疗终端,以使每个医疗终端根据最终模型参数重新更新其本地的医学实体识别模型。

上述步骤中,开源数据集或共享医学数据集是所有医疗机构开放共享的医疗数据,可以供全部医疗机构调取使用。

具体地,本地医疗数据样本包括本地医疗数据正样本和本地医疗数据负样本;本地医疗数据正样本包括带有医学实体标注结果的医疗数据,本地医疗数据负样本包括不带有医学实体标注结果的医疗数据。其中,本地医疗数据负样本可以是随机选取的医疗数据,随机选取的医疗数据中不包括上述医学实体,进而不存在该医疗实体的标注结果。

这里,医学实体识别模型用于医学实体识别,医学实体可以包括从电子病历中提取时间、方位、解剖部位、诊断、肿瘤分期、实验室检查、药品名称、手术名称和存在状态等实体。提取出的医学实体可以构成一个知识图谱,提取出的实体也可以做很多的业务,比如临床决策支持系统(Clinical Decision Support System,CDSS),数据上报,还可以通过命名实体识别(NER)出一些词做逻辑判断,比如:诊断出什么疾病,使用什么药物,具体看业务需求。因此,下面对该医学实体识别模型的训练进行如下示例性说明:

示例性的,以多个医疗终端包括医疗终端A和医疗终端B为例进行举例说明:

步骤201:由云服务器使用开源数据集或医疗机构内共享医学数据集进行医学实体识别模型的预训练,得到初始医学实体识别模型,并将初始医学实体识别模型的模型参数下发给医疗终端A;

步骤202:医疗终端A使用云服务器下发的医学实体识别模型的模型参数初始化其本地的医学实体识别模型,再使用本地医疗数据对其初始化后的医学实体识别模型进行微调;

步骤203:医疗终端A 微调其本地的医学实体识别模型结束后,将微调后的医学实体识别模型的模型参数发送给云服务器,并由云服务器将微调后的医学实体识别模型的模型参数再下发给医疗终端B;

步骤204:医疗终端B重复步骤202和步骤203的操作(即:医疗终端B使用云服务器下发的经过医疗终端A微调后的医学实体识别模型的模型参数初始化其本地的医学实体识别模型,再使用本地医疗数据对其初始化后的医学实体识别模型进行微调;医疗终端B 微调其本地的医学实体识别模型结束后,得到最终的医学实体识别模型,并将最终的医学实体识别模型的模型参数发送给云服务器),最终使用医疗终端A和医疗终端B的本地医疗数据一起完成医学实体识别模型的训练;

步骤205:云服务器将最终的医学实体识别模型的模型参数分别下发给医疗终端A和医疗终端B,使医疗终端A和医疗终端B完成本地的医学实体识别模型的更新过程。

由于各个医疗机构不希望将医疗数据传输到外部服务器中与其他机构共享,导致开源的数据集较少,在此基础上,本申请实施例依次通过各个医疗终端的本地医疗数据分别对医学实体识别模型进行训练,从而实现依次对医学实体识别模型的模型参数更新的目的,达到了结合所有医疗机构的本地医疗数据对医学实体识别模型训练的效果,从而提高医学实体识别模型的准确率,这样在使用本申请实施例中的医学实体识别模型进行医学实体识别时,可以使得医学实体识别的更加准确。

在相关方案中,一个医疗终端包括多个医疗子终端,如,某医院总部包括多个医院分部,其中,医院总部可以收集各个医院分部上报的医疗数据,这里,医院总部作为一个医疗终端,各个医疗分部作为医疗子终端,这样一来,医疗子终端的数据可以汇总至医疗终端进行处理。针对多个医疗子终端本地的医学实体识别模型的训练方式如下所示:

医疗子终端,用于发送医学实体识别模型的模型参数至云服务器;其中,医学实体识别模型是通过与医学实体标识对应的本地医疗数据样本训练得到的;

云服务器,还用于接收多个医疗子终端发送的本地的医学实体识别模型的模型参数,对多个医学实体识别模型的模型参数进行聚合,得到聚合后的模型参数;发送聚合后的模型参数至每个医疗子终端;

医疗子终端,还用于根据聚合后的模型参数更新其本地的医学实体识别模型,并判断针对医学实体识别模型的训练轮数是否达到预设轮数阈值;若训练轮数未达到预设轮数阈值,则重复执行向云服务器发送更新后的医学实体识别模型的模型参数,以使云服务器对接收到的各个医疗子终端发送的更新后的模型参数进行聚合,再次得到聚合后的模型参数,发送再次聚合后的模型参数至每个医疗子终端,以使医疗子终端继续根据聚合后的模型参数更新医学实体识别模型的步骤,直至训练轮数达到预设轮数阈值,得到最终训练完成的医学实体识别模型。

同理,每个医疗子终端上的医学实体识别模型也可以用于医学实体识别,针对每个医疗子终端上的医学实体识别模型,训练的示例性步骤如下所示:

步骤2011:云服务器发起训练操作;

步骤2022:各医疗子终端同时启动相同的医学实体识别模型进行一轮训练;

步骤2033:各医疗子终端完成1轮(或多轮)训练后,将医学实体识别模型的模型参数上传给云服务器;

步骤2044:云服务器根据迁移学习算法,对医学实体识别模型的模型参数进行聚合后下发最新的医学实体识别模型的模型参数给各个医疗子终端;

步骤2055:各个医疗子终端收到云服务器发送的医学实体识别模型的模型参数后更新其本地的医学实体识别模型,继续进行步骤2033和步骤2044,直到达到结束状态;其中,结束状态为训练轮数达到预设轮数阈值;

步骤2066:云服务器将最终的医学实体识别模型的模型参数下发给各个医疗子终端,以使各个医疗子终端完成本地的医学实体识别模型的更新过程。

由于各个医疗子终端的本地医疗数据可以上传至医疗终端,所以针对每个医疗子终端的医学实体识别模型的训练过程与各个医疗终端的医学实体识别模型的训练过程不同,主要原因是各个医疗子终端的医疗数据可以共享,而各个医疗终端的医疗数据不可以共享,进而采用本申请实施例提供的上述模型训练方法可以克服上述存在的问题,且可以充分的应用各个医疗终端或医疗子终端的医疗数据,进而提高医学实体识别模型的训练速度和训练准确性。

第三种实施例中,当医学模型为专科病症预测模型时,医疗数据学习系统通过以下方式训练专科病症预测模型:

云服务器,用于根据开源数据集或共享医学数据集对表征模型进行训练,将训练完成的表征模型的模型参数下发至每个医疗终端;

医疗终端,用于根据表征模型的模型参数更新本地的表征模型,并根据更新后的表征模型从本地医疗数据中提取出针对专科病症的医学实体表征,并获取针对该医学实体表征的标注结果,将提取出的医学实体表征和获取到的针对该医学实体表征的标注结果上传至云服务器;

云服务器,用于将多个医疗终端发送的医学实体表征和针对该医学实体表征的标注结果进行聚合,得到聚合后的医学实体表征和针对聚合后的医学实体表征的标注结果;将聚合后的医学实体表征和针对聚合后的医学实体表征的标注结果作为正样本,将除专科病症对应的医疗数据之外的本地医疗数据作为负样本,对专科病症预测模型进行训练;将训练完成的专科病症预测模型的模型参数下发至每个医疗终端,以使每个医疗终端根据训练完成的专科病症预测模型的模型参数更新其本地的专科病症预测模型。

示例性的,专科病症预测模型可以用于专科疾病预测,专科疾病可以包括脓毒血症,深静脉血栓等,这里,以专科病症预测模型用于预测脓毒血症为例进行说明,具体地,专科病症预测模型可以为脓毒血症预测模型。

一种实施例中,当表征模型为Embedding模型时,通过以下步骤对脓毒血症预测模型进行训练:

步骤301:云服务器分别将表征模型下发给医疗终端A、医疗终端B;

步骤302:医疗终端A、医疗终端B使用Embedding模型生成本地医疗数据的医学实体表征;

步骤303:医疗终端A、医疗终端B将医学实体表征和医学实体表征的标注结果(0,1)加密后上传到云服务器;

步骤304:云服务器融合医疗终端A和医疗终端B的医学实体表征,并在开源数据集或医疗机构内的共享医学数据集上进行负样本采样,并基于负样本得到医学实体表征;

步骤305:将正负样本的医学实体表征作为完整的模型训练数据,在云服务器进行脓毒血症预测模型的训练;

步骤306:将训练完成的脓毒血症预测模型的模型参数下发给医疗终端A和医疗终端B,以完成医疗终端A和医疗终端B本地的脓毒血症预测模型的更新过程。

这里,医学实体表征是指可以替代医学实体的符号或信号,如向量,可以侧重于医学实体的语义表达,其中,医学实体表征包含医疗数据样本中的上下文信息等。

举例说明,若医学实体表征用于表示心律不齐,标注结果0表示患者未发生心率不齐,标注结果1表示患者发生心率不齐。

另一种实施例中,当表征模型为w2v模型时,通过以下方式对脓毒血症(AKI)预测模型进行训练:

在该模式下,每个医疗终端并不进行模型训练,只是通过表征模型从医疗数据中得到医学实体表征:

步骤一:中心端(云服务器)使用开源数据集或医疗机构内共享医学数据集进行w2v模型(表征模型)训练,生成w2v参数;

步骤二:中心端将w2v参数下发给各个医疗终端,医疗终端通过w2v参数初始化本地的w2v模型,并生成医疗终端对于脓毒症患者病历的医学实体表征;

步骤三:医疗终端将脓毒症患者的医学实体表征发送给中心端;

步骤四:中心端进行负样本采样,并进行非脓毒症患者的医学实体表征表示,同时进行AKI预测模型训练;

步骤五:训练完成的AKI预测模型发送给各个医疗终端,完成AKI预测模型的更新过程(注意:该种模型下,每个医疗终端最终都有w2v模型和AKI模型两个模型)。

上述方式中,每个医疗终端只需要一次医学实体特征及标注结果的接收和一次医学实体提取模型的传输,传输次数很少,量也不多,无需多轮训练,无需每轮传参数,适用于网络不稳定的场景,可以保证在网络不稳定的情况下完成脓毒血症(AKI)预测模型的训练,提高模型训练的效率。

第四种实施例中,当医学模型为医学实体关系抽取模型,医疗数据学习系统通过以下步骤训练医学实体关系抽取模型:

云服务器,用于基于开源数据集或共享医学数据集对语言表征模型进行预训练,得到预训练完成的语言表征模型,并将预训练完成的语言表征模型的模型参数下发至每个医疗终端;

医疗终端,用于根据预训练完成的语言表征模型的模型参数更新本地的语言表征模型,并基于本地医疗数据对本地更新后的语言表征模型进行训练,得到训练完成的语言表征模型,将训练完成的语言表征模型的模型参数发送给云服务器;

云服务器,用于将每个医疗终端发送的语言表征模型的模型参数进行融合,得到融合后的语言表征模型的模型参数并得到与融合后的模型参数对应的最终语言表征模型,将最终语言表征模型拼接判别式模型得到医学实体关系抽取模型并进行训练,将训练完成的医学实体关系抽取模型的模型参数下发至每个医疗终端,以使每个医疗终端根据云服务器下发的医学实体关系抽取模型的模型参数得到本地的医学实体关系抽取模型。

其中,判别式模型可以采用CRF模型,其中,CRF模型是自然语言处理中的基础模型。医学实体关系为任意两个医学实体间的关系。具体地,当医学实体包括病历文本中的疾病、症状、检查结果、治疗手段时,医学实体关系可以为上述疾病和症状之间的关系、症状和检查结果之间的关系、疾病和治疗手段之间的关系、时间副词的修饰等。

示例性的,可以通过以下步骤训练医学实体关系抽取模型:

步骤401:云服务器使用开源数据集及医疗机构内的共享医疗数据集进行语言表征模型的预训练过程;

步骤402:云服务器将预训练后的语言表征模型的模型参数下发给各个医疗终端,各医疗终端同时进行语言表征模型的微调;

步骤403:各医疗终端将各自微调的语言表征模型的模型参数上传至云服务器,云服务器将各个语言表征模型的模型参数进行融合得到融合后的语言表征模型的模型参数并得到与融合后的模型参数对应的最终语言表征模型;将最终语言表征模型拼接判别式模型得到医学实体关系抽取模型并基于云服务器上的开源数据集或共享医学数据集进行训练;

步骤404:云服务器将训练完成的医学实体关系抽取模型分发给各个医疗终端,完成各个医疗终端本地的医学实体关系抽取模型的更新过程。

举例说明,以语言表征模型为bert模型举例说明,训练过程如下:

步骤一:中心端(云服务器)使用开源数据集进行bert模型预训练;

步骤二:将bert模型参数下发给各个医疗终端,进行进一步微调;

步骤三:将各个医疗终端微调后的bert模型参数汇聚到中心端,融合各个bert模型参数并形成一个最终语言表征模型;将最终语言表征模型拼接判别式模型得到医学实体关系抽取模型并基于中心端上的开源数据集对医学实体关系抽取模型进行训练,将训练完成的医学实体关系抽取模型的模型参数下发至每个医疗终端,以使每个医疗终端得到本地的医学实体关系抽取模型。

如上所述的四种不同医学模型的训练方式,适用于医学领域的服务器算力有限,带宽资源有限的模式。并且在联邦框架上完成了几种新式AI模型学习的流程,能够在保证医疗终端的医疗数据隔离的基础上,完成医学领域的AI模型的学习过程,并适应日益增长的AI需求和对于数据隔离、数据保护的需求。

上述几种训练医学模型的方法,不需要大量的数据交换和数据传输(数据传输频率和数据体量都较大),能在同样实现医学模型在联邦学习框架下的方案中尽量减少数据交换的频率和体量,适用于互联互通性不强,数据传输有限制的场景(如医院,网络稳定性较差,连接次数有限制,网络传输速度限流)。

综上,本申请实施例提供的医疗数据学习系统,能够通过多个医疗终端的本地医疗数据样本训练医学模型,以提高医疗终端本地的医学模型的准确率,达到显著提升医学模型的使用效果的目的。

可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上所述实施例,仅为本申请的具体实施方式,用以说明本申请的技术方案,而非对其限制,本申请的保护范围并不局限于此,尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

技术分类

06120114731172