掌桥专利:专业的专利平台
掌桥专利
首页

疾病预测方法、装置、设备和介质

文献发布时间:2023-06-19 19:30:30


疾病预测方法、装置、设备和介质

技术领域

本公开一般涉及疾病预测技术领域,具体涉及一种疾病预测方法、装置、设备和介质。

背景技术

随着人工智能的发展,疾病预测功能被广泛应用于线上医疗领域,例如,智能导诊、在线问诊等。相关技术中,通常根据有限的样本及标签训练分类模型,利用分类模型进行疾病预测。在具体应用中,分类模型可以输出模型的输入所命中的一个疾病标签,作为疾病预测结果。

虽然分类模型能够实现疾病的预测,但由于模型所能预测的分类结果(即疾病标签)是非常有限的,且在增加疾病时,需要根据新增加的疾病标签重新训练模型,模型的可扩展性非常有限,也就严重影响了线上医疗系统的功能扩展。

发明内容

鉴于现有技术中的上述缺陷或不足,期望提供一种疾病预测方法、装置、设备和介质,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。

第一方面,本申请实施例提供了一种疾病预测方法,包括:

获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;

获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;

根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。

第二方面,本申请实施例提供了一种疾病预测装置,包括:

第一表达模块,用于获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;

第二表达模块,用于获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;

确定模块,用于根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。

第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。

第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本申请实施例描述的方法。

第五方面,本申请实施例提供了一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如本申请实施例描述的方法。

本申请实施例提出的疾病预测方法,提供语义表达模型,该模型可以对疾病的某个维度的描述信息进行特征提取。在该模型应用于疾病预测时,首先根据候选疾病的描述信息确定候选疾病的表达特征以及根据待预测疾病的描述信息确定待预测疾病的表达特征,然后根据候选疾病的表达特征与待预测疾病的表达特征之间的相似度,对待预测疾病进行预测。本申请应用疾病特征之间的相似度进行疾病预测,在实现疾病预测的同时,通过增加候选疾病即可实现更多疾病的预测,具有很强的可扩展性。例如,可以增加候选疾病并通过语义表达模型获得新增候选疾病的表达特征,将新增候选疾病的表达特征也作为待预测疾病的匹配对象,则可以实现更多类型的疾病预测。有效避免了使用分类模型进行疾病预测时需要根据新增的疾病预测需求重新训练模型,模型扩展性较差等问题,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。

另外,将疾病某一维度的描述信息输入语义表达模型进行特征提取时,语义表达模型提取到的表达特征与疾病其他维度的描述信息具有关联,这样的表达特征在表达语义的同时具有丰富的表达能力。本申请依赖表达特征之间的相似度进行疾病预测,不仅仅关注到疾病描述信息本身的语义,还可关注到不同描述信息之间的关联关系,基于这两方面的特性可以有效匹配到与待预测疾病的表达特征更为相似的特征,根据匹配到的特征进行准确的疾病预测。

本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1示出了本申请实施例提供的疾病预测方法的实施环境架构图;

图2示出了本申请一实施例提供的用户通过应用程序输入描述症状的流程示意图;

图3示出了本申请一实施例提供的疾病预测方法的流程示意图;

图4示出了本申请一实施例提供的表达特征关联关系的示意图;

图5示出了本申请另一实施例提供的疾病预测方法的流程示意图;

图6示出了本申请一实施例提供的基于两个历史病历确定第一损失的原理示意图;

图7示出了本申请一实施例提供的基于历史病历和疾病名称确定第二损失的原理示意图;

图8示出了本申请一实施例提供的基于疾病概述和疾病名称确定第二损失的原理示意图;

图9示出了本申请一实施例提供的基于疾病症状和疾病名称确定第二损失的原理示意图;

图10示出了本申请一实施例提供的基于一个历史病历确定第一损失的原理示意图;

图11示出了本申请又一实施例提供的疾病预测方法的流程示意图;

图12示出了本申请一实施例提供的疾病预测装置的结构框图;

图13示出了本申请另一实施例提供的疾病预测装置的结构框图;

图14示出了适于用来实现本申请实施例的电子设备或服务器的计算机系统的结构示意图。

具体实施方式

下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。

人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。

人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。

语音技术(Speech Technology)的关键技术有自动语音识别技术(ASR)和语音合成技术(TTS)以及声纹识别技术。让计算机能听、能看、能说、能感觉,是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式之一。

自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。

机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。

自动驾驶技术通常包括高精地图、环境感知、行为决策、路径规划、运动控制等技术,自定驾驶技术有着广泛的应用前景,

随着人工智能技术研究和进步,人工智能技术在多个领域展开研究和应用,例如常见的智能家居、智能穿戴设备、虚拟助理、智能音箱、智能营销、无人驾驶、自动驾驶、无人机、机器人、智能医疗、智能客服等,相信随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

本申请实施例提供的方案涉及人工智能的自然语言处理等技术,具体通过如下实施例进行说明。

本申请提出的疾病预测方法具体实施环境参见图1。图1示出了本申请实施例提供的疾病预测方法的实施环境架构图。如图1所示,该实施环境架构包括:客户端101和服务器102。

客户端101为安装在用户终端设备上的应用程序,可以支持线上医疗功能,例如健康卡、卫健小程序等。客户端101用于接收并响应用户的触发操作,并根据上述触发操作与服务器102进行交互。例如,客户端101接收用户输入的疾病描述信息,响应于用户的确认操作将获取到的疾病描述信息发送至服务器102。服务器102基于接收到的疾病描述信息进行疾病预测,并将预测结果发送至客户端101进行展示。

示例性的,如图2所示,在疾病预测场景中客户端101和服务器102可执行如下的操作步骤:

201,客户端101响应于用户在应用程序界面上的选择操作,调用疾病描述界面。

其中,应用程序主页包括多种线上医疗功能的配置项,例如,包括“疾病自测”的配置项。用户可通过触发“疾病自测”的配置项,触发疾病预测流程。示例性的,客户端101接收用户对“疾病自测”控件的选择操作(例如,点击、双击、拖拽等),响应于用户对上述选择操作调用疾病描述界面。

202,客户端101响应于用户在疾病描述界面上的配置操作,获取待预测疾病的描述信息。

疾病描述界面包括多种症状配置项,例如症状输入框或者常见症状选择项。

也就是说,在客户端101呈现疾病描述界面后,用户可通过对疾病描述界面中各配置项的操作输入与自身相应的各种疾病描述信息。例如,用户可以在“常见疾病选择项”中点击“膝关节疼痛”,相应的,客户端101可以接收到该疾病描述信息。

203,客户端101将待预测疾病的描述信息发送至服务器102。

客户端101将用户输入的疾病症状信息作为待预测疾病的描述信息发送至服务器102。其中,客户端101可将多个描述信息短语(例如“膝关节疼痛”、“15天”等)直接发送至服务器102,也可将描述信息短语拼接成描述语句(例如“膝关节疼痛15天”)发送至服务器102。

204,服务器102基于语义表达模型对待预测疾病的描述信息进行语义提取,获得待预测疾病的表达特征。

其中,语义表达模型是基于样本疾病的描述信息训练得到的,基于语义表达模型得到的表达特征能够表征待预测疾病的描述信息与待预测疾病的其他描述信息之间的关联关系。

205,服务器102根据待预测疾病的表达特征以及多个候选疾病的表达特征之间的相似度,从多个候选疾病中确定预测疾病。

也就是说,服务器102在得到待预测疾病的表达特征之后,将待预测疾病的表达特征与提前得到的候选疾病的表达特征之间的相似度,然后根据待预测疾病的表达特征与多个候选疾病的表达特征之间的相似度确定待预测疾病。

206,服务器102将预测疾病信息发送至客户端101。

也就是说,服务器102在进行疾病预测后,获得疾病预测结果(例如,疾病名称)。服务器102还可以根据疾病预测结果确定挂号科室等辅助问诊信息。进一步地,服务器102还可以向客户端101发送疾病预测结果以及辅助问诊信息。客户端101接收疾病预测结果以及辅助问诊的信息后可以通过客户端101的界面进行展示。

本申请实施例提供的疾病预测方法可以在服务器102上被执行,还可以在客户端101上被执行,相应的,本申请以下提及的语义表达模型,可以部署于服务器102,也可以部署于客户端101上,具体可以根据实际应用场景进行调整,例如,本申请的疾病预测方法,可以通过算法程序的方式部署于客户端101中。其中,该客户端可以是具有疾病预测功能的移动电话、个人计算、平台电脑、智能手机、车载终端、可穿戴式设备等,本申请实施例对此不作限定。

服务器102可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。

客户端101与服务器102之间通过有线或无线通信方式进行直接或间接地连接。可选地,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网,也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(MetropolitanArea Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或无线网络、专用网络或者虚拟专用网络的任何组合。

需要说明的是,本申请涉及的各种信息的获取符合相关法律规定,例如,进行疾病预测时获取到的病历、症状等信息。

为了进一步说明本申请实施例提供的技术方案,下面结合附图以及具体实施方式对此进行详细的说明。虽然本申请实施例提供了如下实施例或附图所示的方法操作指令步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作指令步骤。在逻辑上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本申请实施例提供的执行顺序。所述方法在实际的处理过程中或者装置执行时,可按照实施例或者附图所示的方法顺序执行或者并行执行。

请参考图3,图3示出了本申请一实施例提供的疾病预测方法的流程示意图。如图3所示,该方法包括:

301,获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对描述信息进行语义提取,获得候选疾病的表达特征;候选疾病的表达特征用于表征候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系。

其中,候选疾病为可作为预测结果的疾病,例如医学辞典中的疾病等。候选疾病的描述信息为用于对候选疾病进行信息描述的信息数据,包括但不限于候选疾病的疾病名称、疾病病历、疾病概述以及疾病症状中的一项或多项。

应当理解的是,任一候选疾病的每项描述信息,均可基于语义表达模型进行语义提取,从而获得候选疾病的表达特征,多个描述信息的表达特征能够表征不同描述信息之间的关联关系,其中,关联关系可以为相似度关系,例如,同一候选疾病的多项描述信息对应的表达特征之间具有较高相似度,在多维空间坐标系中处于相同或相似的空间区域,不同候选疾病的多项描述信息对应的表达特征之间具有较低相似度,在多维空间坐标系中处于不同的空间区域。

示例性的,如图4所示,在二维空间坐标系中,同一候选疾病的疾病病历的表达特征和疾病名称的表达特征分布在同一空间区域,不同候选疾病的描述信息的表达特征分布在不同的空间区域,其中,属于相同种类的候选疾病(例如属于急性呼吸道疾病的急性上呼吸道感染、急性支气管炎、急性扁桃体炎等)的表达特征分布在相似(相邻)的空间区域。

302,获取待预测疾病的描述信息,基于语义表达模型对待预测疾病的描述信息进行语义提取,获得待预测疾病的表达特征。

需要说明的是,待预测疾病的描述信息为通过客户端交互信息获取到的用户对自身患病症状的描述,可以是症状描述的短语,也可以是句子等其他描述方式,具体可根据客户端引导用户描述症状的方式进行设置,本申请不作具体限定。

在一种可行的实现方式中,为了确保基于待预测疾病的描述信息提取到的表达特征准确,还可在基于语义表达模型对待预测疾病的描述信息进行语义提取之前,还包括对接收到的多个描述信息进行融合处理,其中,融合处理的方式可以为拼接操作。示例性的,将某一用户连续多次输入的多个描述短语,例如“膝盖一直疼”、“15天”等,拼接成该用户对应的待预测疾病的描述信息,例如“膝关节连续疼痛15天”,然后再将拼接得到的待预测疾病的描述信息输入至语义表达模型进行语义提取,得到待预测疾病的表达特征。

应当理解的是,对待预测疾病的描述信息进行语义提取的语义表达模型与对候选疾病的描述信息进行语义提取的语义表达模型为同一语义表达模型,该语义表达模型经过训练使得表达特征能够表征不同描述信息之间的关联关系,因此,基于该语义表达模型得到的待预测疾病的表达特征也包含有待预测疾病其他实质性相关的描述信息的关联关系。

303,根据待预测疾病的表达特征以及多个候选疾病的表达特征之间的相似度,从多个候选疾病中确定待预测疾病。

也就是说,可以将待预测疾病的表达特征分别与多个候选疾病的表达特征进行相似度计算,将相似度满足相似度阈值的至少一种候选疾病确定为待预测疾病,也可以将相似度降序排列中的预设个数的候选疾病确定为待预测疾病,具体确定策略可根据产品需要进行设置,本申请不作具体限定。

其中,相似度可以为余弦相似度,即,通过计算待预测疾病的表达特征与候选疾病的表达特征之间的余弦相似度,将计算结果作为待预测疾病与该候选疾病之间的相似度。当候选疾病的表达特征为多个,即,来自于候选疾病的多个描述信息时,可得到待预测疾病的表达特征与候选疾病的多个表达特征之间的多个相似度,此时,可将多个相似度的平均值作为待预测疾病与候选疾病之间的相似度。

在一种可行的实现方式中,将待预测疾病的表达特征分别与多个候选疾病基于多个描述信息获取的多个表达特征进行相似度比较,得到相似度大于或等于相似度阈值的表达特征,并基于这些表达特征确定至少一个候选疾病,然后将至少一个候选疾病按照相似度进行排序,将序列中相似度最大的2-3个候选疾病确定为待预测疾病,并将预测出的疾病名称发送至客户端,以向用户展示预测结果。或者基于确定的预测出的疾病名称,获取该疾病对应的疾病概述和疾病症状等信息,并将疾病概述和疾病症状等信息发送至客户端,以便用户基于疾病概述和疾病症状等信息对自身症状进行核实、辨析等。

在一种可行的实现方式中,当需要向应用程序中增加候选疾病时,可获取新增候选疾病的描述信息,基于语义表达模型对新增候选疾病的描述信息进行语义提取,获得新增候选疾病的表达特征,从而使得在后进行预测的待预测疾病能够获取到与新增候选疾病的表达特征之间的相似度,有效丰富了疾病预测的可扩展性。

在另一种可行的实现方式中,当任一候选疾病经医疗界确认需要删除时,则可将删除候选疾病的描述信息进行删除,以避免获取删除候选疾病的表达特征,或者,从存储的候选疾病的表达特征中将删除候选疾病的表达特征进行删除处理,以避免待预测疾病的表达特征与删除候选疾病的表达特征进行相似度计算。

由此,本申请实施例提出的疾病预测方法,训练语义表达模型,该模型可以对疾病的某个维度的描述信息进行特征提取。在该模型应用于疾病预测时,首先根据候选疾病的描述信息确定候选疾病的表达特征以及根据待预测疾病的描述信息确定待预测疾病的表达特征,然后根据候选疾病的表达特征与待预测疾病的表达特征之间的相似度,对待预测疾病进行预测。本申请应用疾病特征之间的相似度进行疾病预测,在实现疾病预测的同时,通过增加候选疾病即可实现更多疾病的预测,具有很强的可扩展性。例如,可以增加候选疾病并通过语义表达模型获得新增候选疾病的表达特征,将新增候选疾病的表达特征也作为待预测疾病的匹配对象,则可以实现更多类型的疾病预测。有效避免了使用分类模型进行疾病预测时需要根据新增的疾病预测需求重新训练模型,模型扩展性较差等问题,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。

另外,将疾病某一维度的描述信息输入语义表达模型进行特征提取时,语义表达模型提取到的表达特征与疾病其他维度的描述信息具有关联,这样的表达特征在表达语义的同时具有丰富的表达能力。本申请依赖表达特征之间的相似度进行疾病预测,不仅仅关注到疾病描述信息本身的语义,还可关注到不同描述信息之间的关联关系,基于这两方面的特性可以有效匹配到与待预测疾病的表达特征更为相似的特征,根据匹配到的特征进行准确的疾病预测。

在本申请的另一实施例中,还提供了上述语义表达模型的训练方法。示例性的,参考图5,该方法包括以下步骤:

501,获取多个样本疾病的历史描述信息,将历史描述信息输入初始模型进行语义提取,获得历史描述信息对应的表达特征。

需要说明的是,样本疾病至少部分的包括候选疾病,样本疾病的历史描述信息至少包括样本疾病的历史病历、疾病名称、疾病概述和疾病症状。

在一种可行的实施例中,初始模型可为用于语义提取的特征提取模型或编码模型,例如BERT模型等编码器。

502,基于不同历史描述信息对应的表达特征对初始模型进行迭代训练,在不同历史描述信息对应的表达特征存在关联关系时获得语义表达模型。

也就是说,基于语义表达模型得到的表达特征之间的关联关系,是语义表达模型通过训练得到的。换言之,通过对语义表达模型的训练,能够使得不同历史描述信息对应的表达特征之间存在关联关系,并在不同历史描述信息对应的表达特征存在关联关系时获得语义表达模型。

在一种可行的实现方式中,针对每一样本疾病,根据不同历史描述信息对应的表达特征之间的损失,对初始模型进行迭代训练,在损失达到收敛时获得语义表达模型。

其中,损失包括同一纬度下的不同描述信息对应的表达特征之间的第一损失,以及不同维度下的描述信息对应的表达特征之间的第二损失。

需要说明的是,在传统的神经网络模型的训练过程中,因为希望神经网络模型的输出尽可能的接近真正想要输出的值,所以可以通过比较当前网络的输出值和真正想要的目标值,再根据两者之间的差异情况来更新每一层神经网络的权重向量(当然,在第一次更新之前通常会有初始化的过程,即为神经网络中的各层预先配置参数),比如,如果网络的输出值高了,则调整权重向量让输出值低一些,通过不断的调整,直至神经网络模型能够输出真正想要的目标值或与真正想要的目标值非常接近的值。因此,就需要预先定义“如何比较输出值和目标值之间的差异”,这便是损失函数(loss function)或目标函数(objectivefunction),是用于衡量输出值和目标值的差异的重要方程。其中,以损失函数举例,损失函数的输出值(loss),即损失,越高表示差异越大,那么神经网络模型的训练变成了尽可能缩小这个loss的过程,即,训练损失达到收敛的过程。

在本申请实施例中,可设置损失函数用于表征不同历史描述信息对应的表达特征之间的关联关系,例如,损失函数可基于表达特征之间的相似度进行设置。其中,具有关联关系的表达特征之间的相似度越高,损失越小。

示例性的,任一样本疾病对应的第一损失或第二损失与以下关系式相关:

其中,h

应当理解的是,当第一历史描述信息与第二历史描述信息属于同纬度时,可计算第一损失,当第一历史描述信息与第二历史描述信息属于不同维度时,可计算第二损失。

在一种可行的实现方式中,损失计算可具体采用如下公式:

其中,τ为平滑系数,n为描述信息的数量。

应当理解的是,该损失函数计算公式的分子与样本疾病的第一历史描述信息和第二历史描述信息的相似度相关,分母为样本疾病的任一历史描述信息的表达特征与整个样本集中全部其他历史描述信息的相似度相关。也就是说,在h

因此,当同一样本疾病的两个描述信息对应的表达特征之间的相似度越高,损失loss就越小,当损失loss随着迭代训练不再继续缩小时,确定损失达到收敛,从而获得语义表达模型。

在一种可行的实现方式中,当损失为同一纬度下的不同描述信息对应的表达特征之间的第一损失时,历史描述信息可包括历史病历。也就是说,对于任意疾病,可具有多个历史病历,例如,同一患者的多份历史病历,或者不同患者的多个历史病历,此时,可根据不同历史病历属于同一样本疾病的关联关系,计算第一损失。

示例性的,针对每一样本疾病,基于样本疾病对应的至少两个历史病历的表达特征,确定第一损失,第一损失用于表征至少两个病历之间的关联关系。

也就是说,可将历史病历每两个为一组输入至初始模型中,获取对应的两个表达特征,进而计算相应的第一损失,然后基于得到的第一损失对初始模型进行迭代训练,在第一损失达到收敛时获得语义表达模型。

应当理解的是,为了充分保证其他表达特征对第一损失的影响,即,损失函数的分母中其他表达特征的影响充分,还可同时获取多对历史病历作为一个样本集,以将样本集中不具有关联关系的多个历史病历作为其他表达特征。

示例性的,如图6所示,每对历史病历包括两个基于相同样本疾病的历史病历,例如,样本集中包括样本疾病1对应的历史病历1和历史病历2、样本疾病2对应的历史病历1和历史病历2…样本疾病n对应的历史病历1和历史病历2。然后将样本集中的多对历史病历同时输入至初始模型中,得到每个历史病历的表达特征,然后,针对每对历史病历,将获得的两个表达特征作为正样本(即h

由此,通过基于同一候选疾病对应的两个不同历史病历对初始模型进行训练,能够使得语义表达模型输出的表达特征能够表征历史病历之间的关联关系,属于同一候选疾病的表达特征的相似度更高,具有更强的关联关系,不同候选疾病的表达特征的相似度更低,关联关系的强度更弱。

在一种可行的实现方式中,当损失为不同维度下的描述信息对应的表达特征之间的第二损失时,历史描述信息包括历史病历和疾病名称。

示例性的,针对每一样本疾病,基于样本疾病对应的历史疾病的表达特征和疾病名称的表达特征,确定第二损失,第二损失用于表征历史病历与疾病名称之间的关联关系。

也就是说,可将样本疾病的疾病名称和历史病历输入至初始模型中,得到疾病名称对应的表达特征和历史病历对应的表达特征,进而计算疾病名称对应的表达特征和历史病历对应的表达特征之间的第二损失,然后基于得到的第二损失对初始模型进行迭代训练,在损失达到收敛时获得语义表达模型。

应当理解的是,为了充分保证其他表达特征对损失函数的影响,还可同时获取多组疾病名称和历史病历作为一个样本集。

示例性的,如图7所示,每组样本数据包括样本疾病的疾病名称和历史病历,例如,样本集中包括样本疾病1对应的疾病名称和历史病历、样本疾病2对应的疾病名称和历史病历…样本疾病n对应的疾病名称和历史病历。其中,多个样本疾病对应的疾病名称可以相同也可以不同,例如,样本疾病1和样本疾病2可以相同也可以不同,当样本疾病1和样本疾病2相同时,样本疾病1则包括疾病名称和历史病历1,样本疾病2则包括疾病名称和历史病历2,以通过不同历史病历形成不同的样本疾病。然后将样本集中的疾病名称和历史病历同时输入至初始模型中,得到各样本疾病的疾病名称对应的表达特征和历史病历对应的表达特征,然后,将每个样本疾病对应的疾病名称的表达特征和历史病历的表达特征的作为正样本(即h

由此,通过基于同一候选疾病对应的历史病历和疾病名称对初始模型进行训练,能够使得语义表达模型输出的表达特征能够表征历史病历和疾病名称之间的关联关系,属于同一候选疾病的历史病历的表达特征和疾病名称的表达特征之间的相似度更高,具有更强的关联关系,不同候选疾病的历史病历的表达特征和疾病名称的表达特征之间的相似度更低,关联关系的强度更弱。

在一种可行的实现方式中,当损失为不同维度下的描述信息对应的表达特征之间的第二损失时,历史描述信息包括疾病概述和疾病名称。

示例性的,针对每一样本疾病,基于样本疾病对应的历史疾病的表达特征和疾病名称的表达特征,确定第二损失,第二损失用于表征疾病概述与疾病名称之间的关联关系。

也就是说,可将样本疾病的疾病名称和疾病概述输入至初始模型中,得到疾病名称对应的表达特征和疾病概述对应的表达特征,进而计算疾病名称对应的表达特征和疾病概述对应的表达特征之间的第二损失,然后基于得到的第二损失对初始模型进行迭代训练,在损失达到收敛时获得语义表达模型。

应当理解的是,为了充分保证其他表达特征对损失函数的影响,还可同时获取多组疾病名称和疾病概述作为一个样本集。

示例性的,如图8所示,每组样本数据包括样本疾病的疾病名称和疾病概述,例如,样本集中包括样本疾病1对应的疾病名称和疾病概述、样本疾病2对应的疾病名称和疾病概述…样本疾病n对应的疾病名称和疾病概述。然后将样本集中的疾病名称和疾病概述同时输入至初始模型中,得到各样本疾病的疾病名称对应的表达特征和疾病概述对应的表达特征,然后,将每个样本疾病对应的疾病名称的表达特征和疾病概述的表达特征的作为正样本(即h

由此,通过基于同一候选疾病对应的疾病概述和疾病名称对初始模型进行训练,能够使得语义表达模型输出的表达特征能够表征疾病概述和疾病名称之间的关联关系,属于同一候选疾病的疾病概述的表达特征和疾病名称的表达特征之间的相似度更高,具有更强的关联关系,不同候选疾病的疾病概述的表达特征和疾病名称的表达特征之间的相似度更低,关联关系的强度更弱。

在一种可行的实现方式中,当损失为不同维度下的描述信息对应的表达特征之间的第二损失时,历史描述信息包括疾病症状和疾病名称。

示例性的,针对每一样本疾病,基于样本疾病对应的历史疾病的表达特征和疾病名称的表达特征,确定第二损失,第二损失用于表征疾病症状与疾病名称之间的关联关系。

也就是说,可将样本疾病的疾病名称和疾病症状输入至初始模型中,得到疾病名称对应的表达特征和疾病症状对应的表达特征,进而计算疾病名称对应的表达特征和疾病症状对应的表达特征之间的第二损失,然后基于得到的第二损失对初始模型进行迭代训练,在损失达到收敛时获得语义表达模型。

应当理解的是,为了充分保证其他表达特征对损失函数的影响,还可同时获取多组疾病名称和疾病症状作为一个样本集。

示例性的,如图9所示,每组样本数据包括样本疾病的疾病名称和疾病症状,例如,样本集中包括样本疾病1对应的疾病名称和疾病症状、样本疾病2对应的疾病名称和疾病症状…样本疾病n对应的疾病名称和疾病症状。然后将样本集中的疾病名称和疾病症状同时输入至初始模型中,得到各样本疾病的疾病名称对应的表达特征和疾病症状对应的表达特征,然后,将每个样本疾病对应的疾病名称的表达特征和疾病症状的表达特征的作为正样本(即h

由此,通过基于同一候选疾病对应的疾病症状和疾病名称对初始模型进行训练,能够使得语义表达模型输出的表达特征能够表征疾病症状和疾病名称之间的关联关系,属于同一候选疾病的疾病症状的表达特征和疾病名称的表达特征之间的相似度更高,具有更强的关联关系,不同候选疾病的疾病症状的表达特征和疾病名称的表达特征之间的相似度更低,关联关系的强度更弱。

在一种可行的实现方式中,第二损失也可为历史病历和疾病描述之间的损失,或者历史病历和疾病症状之间的损失,或者疾病描述和疾病症状之间的损失等,本申请不在此一一赘述。

在一种可行的实现方式中,由于第二损失可以为分别来自多种历史描述信息的组合的多个第二损失,例如,第二损失包括历史描述信息为历史病历和疾病名称组合方式的第二损失、历史描述信息为疾病概述和疾病名称组合方式的第二损失以及历史描述信息为疾病症状和疾病名称组合方式的第二损失。因此,在基于第二损失对初始模型进行迭代训练时,可以只基于一种第二损失进行迭代训练(如前述可行的实现方式中介绍),还可以基于多种第二损失进行迭代训练。

示例性的,获取每一样本疾病对应的疾病名称、历史病历、疾病概述和疾病症状,例如,如下表制作多个样本疾病的训练集:

/>

然后,将当前样本疾病对应的疾病名称、历史病历、疾病概述和疾病症状输入至初始模型,分别获取到疾病名称的表达特征、历史病历的表达特征、疾病概述的表达特征和疾病症状的表达特征,然后基于这些表达特征,获取历史病历的表达特征和疾病名称的表达特征之间的第二损失、疾病概述的表达特征和疾病名称的表达特征之间的第二损失、疾病症状的表达特征和疾病名称的表达特征之间的第二损失,记录这些第二损失,获取下一样本疾病对应的疾病名称、历史病历、疾病概述和疾病症状并输入至初始模型,并分别获取下一样本疾病对应的历史病历的表达特征和疾病名称的表达特征之间的第二损失、疾病概述的表达特征和疾病名称的表达特征之间的第二损失、疾病症状的表达特征和疾病名称的表达特征之间的第二损失。将当前样本疾病的各项第二损失与下一样本疾病的各项第二损失分别进行比较,其中任一项第二损失收敛,则认为损失收敛得到语义表达模型。例如,当前样本疾病对应的历史病历的表达特征和疾病名称的表达特征之间的第二损失和下一样本疾病对应的历史病历的表达特征和疾病名称的表达特征之间的第二损失相等,则认为损失收敛,得到语义表达模型。

在一种可行的实现方式中,在对初始模型进行迭代训练时,可交替使用第一损失和第二损失对初始模型进行迭代训练。

示例性的,可先基于第一损失对初始模型进行一次迭代训练,然后再基于第二损失对初始模型进行一次迭代训练,如此往复,当第一损失和第二损失中的至少一个达到收敛时,得到语义表达模型。

以历史描述信息包括历史病历和疾病名称为例,针对每个样本疾病,分别获取样本疾病的至少两个历史病历,例如三个历史病历,将样本疾病的其中两个历史病历作为用于计算第一损失的第一训练样本,将另一个历史病历和疾病名称作为用于计算第二损失的第二训练样本。将第一样本疾病对应的第一训练样本输入至初始模型得到第一样本疾病对应的第一损失,然后再将第一样本疾病对应的第二训练样本输入至初始模型得到第一样本疾病对应的第二损失,基于第一损失和/或第二损失对初始模型进行修正,然后将第二样本疾病对应的第一训练样本输入至初始模型得到第二样本疾病对应的第一损失,然后再将第二样本疾病对应的第二训练样本输入至初始模型得到第二样本疾病对应的第二损失。如果第二样本疾病的第一损失和第二损失中的任一个与第一样本疾病的第一损失和第二损失一致,则确定初始模型收敛得到语义表达模型。

可选的,为了及时确定初始模型收敛获得语义表达模型,还可在每一次获取到损失时进行比较。例如,在获取到第二样本疾病的第一损失时,判断第二样本疾病的第一损失是否与第一样本疾病的第一损失相等,如果相等,则确定损失收敛获得语义表达模型,如果不相等,则基于第二样本疾病的第一损失对初始模型进行修正,并继续获取第二样本疾病的第二损失,判断第二样本疾病的第二损失是否与第一样本疾病的第二损失相等,如果相等,则确定损失收敛获得语义表达模型,如果不相等,则基于第二样本疾病的第二损失对初始模型进行修正,并继续获取第三样本疾病的第一损失,以此类推,直至损失收敛得到语义表达模型。

可选的,为了防止损失收敛是因为样本疾病的相似性或其他因样本相似等偶发原因造成的误触发,还可基于连续多个损失相等确定损失收敛。

示例性的,在获取到第二样本疾病的第一损失时,判断第二样本疾病的第一损失是否与第一样本疾病的第一损失相等,如果相等,则记录第一损失相等的次数,并判断第一损失相等次数是否达到第一预设次数,如果达到了第一预设次数,则确定损失收敛得到语义表达模型,如果未达到第一预设次数,则基于第二样本疾病的第一损失对初始模型进行修正,并继续获取第二样本疾病的第二损失,判断第二样本疾病的第二损失是否与第一样本疾病的第二损失相等,以及在第二损失相等时判断第二损失相等的次数是否达到第二预设次数,如果达到了第二预设次数,则确定损失收敛得到语义表达模型,如果未达到第二预设次数,则基于第二样本的第二损失对初始模型模型进行修正,并继续获取第三样本疾病的第一损失,以此类推,直至损失收敛得到语义表达模型。

在一种可行的实现方式中,在利用第一损失和第二损失交替对初始模型进行迭代训练时,还可以同时使用多项第二损失分别或同时与第一损失进行交替训练。

示例性的,针对每个样本疾病,可以获取两个历史病历和疾病概述、疾病症状生成该样本疾病的样本集。然后再获取16个样本疾病的样本集,构造成当前样本集单元。先将当前样本集单元中的32个历史病历输入至初始单元,得到32个历史病历对应的32个表达特征,基于相同样本疾病的历史病历的表达特征计算历史病历之间的损失,得到16个历史病历之间的损失,对16个历史病历之间的损失取平均数,得到当前样本集单元对应的第一损失,基于当前样本集单元对应的第一损失对初始模型进行修正;然后将当前样本集单元中每个样本疾病的疾病名称和一份历史病历输入至初始单元,得到16组对应的表达特征,计算16组历史病历和疾病名称组合方式的第二损失,并对16组历史病历和疾病名称组合方式的第二损失,得到当前样本集单元对应的历史病历和疾病名称组合方式的第二损失,基于当前样本集单元对应的历史病历和疾病名称组合方式的第二损失对初始模型进行修正;然后将当前样本集单元中每个样本疾病的疾病名称和疾病概述输入至初始单元,得到16组对应的表达特征,计算16组疾病概述和疾病名称组合方式的第二损失,并对16组疾病概述和疾病名称组合方式的第二损失,得到当前样本集单元对应的疾病概述和疾病名称组合方式的第二损失,基于当前样本集单元对应的疾病概述和疾病名称组合方式的第二损失对初始模型进行修正;然后将当前样本集单元中每个样本疾病的疾病名称和疾病症状输入至初始单元,得到16组对应的表达特征,计算16组疾病症状和疾病名称组合方式的第二损失,并对16组疾病症状和疾病名称组合方式的第二损失,得到当前样本集单元对应的疾病症状和疾病名称组合方式的第二损失,基于当前样本集单元对应的疾病症状和疾病名称组合方式的第二损失对初始模型进行修正;

选取下一组样本疾病对应的下一样本集单元,执行上述对当前样本集单元的训练过程,并在下一样本集单元对初始模型训练完成后,判断下一样本集单元对应的第一损失是否等于当前样本集单元对应的第一损失,或者下一样本集单元对应的历史病历和疾病名称组合方式的第二损失是否等于当前样本集单元对应的历史病历和疾病名称组合方式的第二损失,或者下一样本集单元对应的疾病概述和疾病名称组合方式的第二损失是否等于当前样本集单元对应的疾病概述和疾病名称组合方式的第二损失,或者下一样本集单元对应的疾病症状和疾病名称组合方式的第二损失是否等于当前样本集单元对应的疾病症状和疾病名称组合方式的第二损失。如果第一损失或任一种组合方式的第二损失相等,则确定损失收敛得到语义表达模型,如果第一损失和全部组合方式的第二损失均不相等,则确定损失均不收敛,将下一样本集单元作为当前样本集单元,并获取下一样本集单元。

在一种可行的实现方式中,为了确保最终获取的语义表达模型的稳定性,可以在第一损失和全部第二损失均收敛时,确定损失收敛得到语义表达模型。

由此,通过利用候选疾病的多种描述信息分别于疾病名称之间进行关联训练,并叠加不同描述信息之间的交叉迭代训练,能够通过疾病名称作为桥梁,使得其他描述信息对应的表达特征之间具有关联关系,无需对每种描述信息的组合方式都进行遍历式的迭代训练,既保证了语义表达模型输出的表达特征对关联关系的表达能力,又有效降低了数据训练量,大大节约了模型训练时间和成本。

在一种可行的实现方式中,第一损失还可通过对同一描述信息进行不同的语义提取来获取。

示例性的,将历史描述信息中的任意历史病历分别输入初始模型的两个Dropout层进行语义提取,得到历史病历对应的两个表达特征。

需要说明的是,Dropout层为使模型忽略部分节点的策略层,也就是说,在将同一份历史病历输入至初始模型后,通过两个不同的Dropout层能够得到两个历史病历对应的表达特征,两个表达特征来自同一描述信息,因此属于同一纬度,即,两个表达特征之间的损失为第一损失,然后,可以进一步基于第一损失对初始模型进行迭代训练。其中,Dropout可以为0.3,即,随机忽略30%的神经节点,两个Dropout对应的数值可以相同,但随机忽略的神经节点不同,从而使得基于不同忽略结果得到两个不同的表达特征。

在一种可行的实现方式中,利用基于不同Dropout层得到的第一损失对初始模型进行训练时,还可以采用相关系数得到与语义表达模型。

示例性的,如图10所示,可以将多个历史病历制作成样本集,同时输入至初始模型中,在初始模型中的两个Dropout层作用下,每个历史病历分别得到两个对应的表达特征,然后基于每个历史病历的两个表达特征计算每个历史病历对应的第一损失,并计算多个历史病历的第一损失平均值,基于第一损失平均值对初始模型进行修正。与此同时,基于任一个历史病历的两个表达特征,计算两个表达特征之间的相关系数,例如Spearman相关系数,如果计算出的相关系数达到预设阈值,例如0.9,则确定得到语义表达模型,如果计算出的相关系数未达到预设阈值,则继续获取下一样本集对初始模型进行训练,直至相关系数达到预设阈值,得到语义表达模型。

在一种可行的实现方式中,由于Dropout层的介入会造成被忽略的节点无法被更好的悬链,因此,还可先基于Dropout层对初始模型进行训练,当达到退出条件时,再继续基于第一损失和第二损失继续对初始模型进行训练,既实现对语义表达模型中全部节点进行训练的目的,还进一步提高了语义表达模型对疾病名称、疾病概述和疾病正症状等多种描述信息之间的关联关系的表达能力。

示例性的,获取样本疾病的历史病历,将历史病历制作成多个样本集,并在初始模型中添加两个Dropout层,基于多个历史病历对应的样本集对初始模型进行迭代训练,当任一历史病历的两个表达特征之间的相关系数达到预设阈值时,结束当前训练阶段。

然后,取消初始模型中的两个Dropout层,基于样本疾病的两个历史病历、疾病名称、疾病概述和疾病症状构造样本集,先将当前样本集中样本疾病对应的两个历史病历输入至训练好的初始模型中继续训练,得到每个历史病历的表达特征,并计算第一损失,然后基于第一损失对初始模型继续修正,并将历史病历和疾病名称输入至修正后的初始模型,得到历史病历的表达特征和疾病名称的表达特征,并计算历史病历和疾病名称之间的第二损失,然后基于历史病历和疾病名称之间的第二损失对初始模型进行修正,并将疾病概述和疾病名称输入至修正后的初始模型,得到疾病概述的表达特征和疾病名称的表达特征,并计算疾病概述和疾病名称之间的第二损失,然后基于疾病概述和疾病名称之间的第二损失对初始模型进行修正,并将疾病症状和疾病名称输入至修正后的初始模型,得到疾病症状的表达特征和疾病名称的表达特征,并计算疾病症状和疾病名称之间的第二损失,记录上述第一损失和三个第二损失,获取下一样本集并得到对应的第一损失和三个第二损失,分别判断下一样本集对应的第一损失和三个第二损失是否与当前样本集对应的第一损失和三个第二损失是否一致,如果第一损失和三个第二损失都一致,则确定损失收敛得到语义表达模型,如果任一损失不一致,则确定损失未收敛,将下一样本集作为当前样本集,并获取下一样本集进行迭代训练,直至损失收敛得到语义表达模型。

在本申请的另一实施例中,还提供了完整的疾病预测方法。示例性的,参考图11,该方法包括以下步骤:

1101,获取多个样本疾病的历史描述信息。

其中,样本疾病的历史描述信息包括样本疾病的历史病历、疾病名称、疾病概述和疾病症状等,每个样本疾病的历史病历可以为多个。

1102,基于多个样本疾病的历史描述信息构造样本单元。

其中,每个样本单元包括多个样本疾病以及每个样本疾病的多个历史描述信息。

示例性的,每个样本单元可以包括4个样本疾病,每个样本疾病对应包括疾病名称、疾病概述、疾病症状和2个历史病历,组成多维样本单元。

1103,将样本单元输入至初始模型,对初始模型进行迭代训练,得到语义表达模型。

需要说明的是,样本单元按照预设的训练阶段,基于不同的历史描述信息(不同维度的历史描述信息)对初始模型进行分阶段训练,使得初始模型的损失收敛,得到语义表达模型,在损失收敛时,基于语义表达模型得到的相同样本疾病的不同描述信息的表达特征之间具有相似的关联关系,不同样本疾病的不同描述信息的表达特征之间不具有相似的关联关系。

1104,获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对描述信息进行语义提取,得到候选疾病的表达特征。

其中,候选疾病可以是可提供疾病预测的疾病信息,候选疾病的描述信息可以是候选疾病的历史病历、疾病名称、疾病概述和疾病症状中的一种或多种,优选的,可以是候选疾病的疾病名称。

可选的,候选疾病可根据需求进行选择,例如,当出现新的疾病时,还可根据实际情况将新疾病作为候选疾病输入至语义表达模型,得到新疾病的表达特征,从而可以通过增加候选疾病实现更多疾病的预测,具有很强的可扩展性。

1105,获取待预测疾病的描述信息,基于语义表达模型对待预测疾病的描述信息进行语义提取,得到待预测疾病的表达特征。

其中,待预测疾病的描述信息可通过客户端获取,将获取到的待预测疾病的描述信息输入至语义表达模型,得到待预测疾病的表达特征。

1106,根据待预测疾病的表达特征以及多个候选疾病的表达特征之间的相似度,从多个候选疾病中确定待预测疾病。

也就是说,可以将待预测疾病的表达特征分别与多个候选疾病的表达特征进行相似度计算,将相似度满足相似度阈值的至少一种候选疾病确定为待预测疾病,也可以将相似度降序排列中的预设个数的候选疾病确定为待预测疾病。

图12示出了本申请一实施例提供的疾病预测装置的结构框图。如图12所示,疾病预测装置10,包括:

第一表达模块11,用于获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征所述候选疾病的表达特征对应的描述信息与其他描述信息之间的关联关系;

第二表达模块12,用于获取待预测疾病的描述信息,基于所述语义表达模型对所述待预测疾病的描述信息进行语义提取,获得所述待预测疾病的表达特征;

确定模块13,用于根据所述待预测疾病的表达特征以及所述多个候选疾病的表达特征之间的相似度,从所述多个候选疾病中确定所述待预测疾病。

在一些实施例中,如图13所示,疾病预测装置10还包括训练单元14,训练模块14用于获取多个样本疾病的历史描述信息,将所述历史描述信息输入初始模型进行语义提取,获得所述历史描述信息对应的表达特征;基于不同所述历史描述信息对应的表达特征对所述初始模型进行迭代训练,在不同所述历史描述信息对应的表达特征存在关联关系时获得所述语义表达模型。

在一些实施例中,训练模块14还用于:

针对每一所述样本疾病,根据不同所述历史描述信息对应的表达特征之间的损失,对初始模型进行迭代训练,在所述损失达到收敛时获得所述语义表达模型;

其中,所述损失包括同一纬度下的不同描述信息对应的表达特征之间的第一损失,以及不同纬度下的描述信息对应的表达特征之间的第二损失。

在一些实施例中,所述历史描述信息包括历史病历,训练模块14还用于:针对每一所述样本疾病,基于所述样本疾病对应的至少两个历史病历的表达特征,确定所述第一损失,所述第一损失用于表征所述至少两个病历之间的关联关系。

在一些实施例中,所述历史描述信息包括历史病历和疾病名称,训练模块14还用于:针对每一所述样本疾病,基于所述样本疾病对应的所述历史病历的表达特征和所述疾病名称的表达特征,确定所述第二损失,第二损失用于表征所述历史病历与所述疾病名称之间的关联关系。

在一些实施例中,所述历史描述信息包括疾病概述和疾病名称,训练模块14还用于:针对每一所述样本疾病,基于所述样本疾病对应的所述疾病概述的表达特征和疾病名称的表达特征,确定所述第二损失,所述第二损失用于表征所述疾病概述与所述疾病名称之间的关联关系。

在一些实施例中,所述历史描述信息包括疾病症状和疾病名称,训练模块14还用于:针对每一所述样本疾病,基于所述样本疾病对应的所述疾病症状的表达特征和所述疾病名称的表达特征,确定所述第二损失,所述第二损失用于表征所述疾病症状与所述疾病名称之间的关联关系。

在一些实施例中,训练模块14还用于:将所述历史描述信息中的任意历史病历分别输入所述初始模型的两个Dropout层进行语义提取,得到所述历史病历对应的两个表达特征。

在一些实施例中,任一所述样本疾病对应的所述第一损失或所述第二损失与以下关系式相关:

其中,h

由此,本申请实施例提出的疾病预测装置,训练语义表达模型,该模型可以对疾病的某个维度的描述信息进行特征提取。在该模型应用于疾病预测时,首先根据候选疾病的描述信息确定候选疾病的表达特征以及根据待预测疾病的描述信息确定待预测疾病的表达特征,然后根据候选疾病的表达特征与待预测疾病的表达特征之间的相似度,对待预测疾病进行预测。本申请应用疾病特征之间的相似度进行疾病预测,在实现疾病预测的同时,通过增加候选疾病即可实现更多疾病的预测,具有很强的可扩展性。例如,可以增加候选疾病并通过语义表达模型获得新增候选疾病的表达特征,将新增候选疾病的表达特征也作为待预测疾病的匹配对象,则可以实现更多类型的疾病预测。有效避免了使用分类模型进行疾病预测时需要根据新增的疾病预测需求重新训练模型,模型扩展性较差等问题,在疾病预测场景中能够有效支持疾病类型的扩展,从而可以有效提升线上医疗系统的功能扩展。

另外,将疾病某一维度的描述信息输入语义表达模型进行特征提取时,语义表达模型提取到的表达特征与疾病其他维度的描述信息具有关联,这样的表达特征在表达语义的同时具有丰富的表达能力。本申请依赖表达特征之间的相似度进行疾病预测,不仅仅关注到疾病描述信息本身的语义,还可关注到不同描述信息之间的关联关系,基于这两方面的特性可以有效匹配到与待预测疾病的表达特征更为相似的特征,根据匹配到的特征进行准确的疾病预测。

应当理解,疾病预测装置10中记载的诸单元或模块与参考图3描述的方法中的各个步骤相对应。由此,上文针对方法描述的操作和特征同样适用于疾病预测装置10及其中包含的单元,在此不再赘述。疾病预测装置10可以预先实现在电子设备的浏览器或其他安全应用中,也可以通过下载等方式而加载到电子设备的浏览器或其安全应用中。疾病预测装置10中的相应单元可以与电子设备中的单元相互配合以实现本申请实施例的方案。

在上文详细描述中提及的若干模块或者单元,这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。

下面参考图14,图14示出了适于用来实现本申请实施例的电子设备或服务器的计算机系统的结构示意图,

如图14所示,计算机系统包括中央处理单元(CPU)1301,其可以根据存储在只读存储器(ROM)1302中的程序或者从存储部分1308加载到随机访问存储器(RAM)1303中的程序而执行各种适当的动作和处理。在RAM1303中,还存储有系统的操作指令所需的各种程序和数据。CPU1301、ROM1302以及RAM1303通过总线1304彼此相连。输入/输出(I/O)接口1305也连接至总线1304。

以下部件连接至I/O接口1305;包括键盘、鼠标等的输入部分1306;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1307;包括硬盘等的存储部分1308;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1309。通信部分1309经由诸如因特网的网络执行通信处理。驱动器1310也根据需要连接至I/O接口1305。可拆卸介质1311,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1310上,以便于从其上读出的计算机程序根据需要被安装入存储部分1308。

特别地,根据本申请的实施例,上文参考流程图图2描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1309从网络上被下载和安装,和/或从可拆卸介质1311被安装。在该计算机程序被中央处理单元(CPU)1301执行时,执行本申请的系统中限定的上述功能。

需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以为的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作指令。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,前述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以不同于附图中所标注的顺序发生。例如,两个连接表示的方框实际上可以基本并行地执行,他们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作指令的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

描述于本申请实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括第一表达模块、第二表达模块和确定模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,第一表达模块,还可以被描述为“获取多个候选疾病中每一候选疾病的描述信息,基于语义表达模型对所述描述信息进行语义提取,获得所述候选疾病的表达特征;所述候选疾病的表达特征用于表征不同描述信息之间的关联关系”。

作为另一方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的电子设备中所包含的,也可以是单独存在,而未装配入该电子设备中的。上述计算机可读存储介质存储有一个或多个程序,当上述程序被一个或者一个以上的处理器用来执行描述于本申请的疾病预测方法。

以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离前述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其他技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

技术分类

06120115929473