掌桥专利:专业的专利平台
掌桥专利
首页

一种医疗感应数据流分类模型的构建方法

文献发布时间:2023-06-19 09:26:02


一种医疗感应数据流分类模型的构建方法

技术领域

本发明涉及一种医疗感应数据流分类模型的构建方法,属于医疗感应数据处理的技术领域。

背景技术

基于医疗感应数据的异常检测面临的一个主要问题是缺少有标签的数据。数据的标记需要专业的医疗知识,且标记过程复杂、耗时。大规模高精度的深度学习模型可以保证较高的异常诊断准确率,在实际部署和使用时却需占用大量内存和计算资源。针对于不同的应用场景,需要提出不同推理精确度、不同规模(即不同空间和时间复杂度)的医疗感应数据流分类模型。

发明内容

本发明所要解决的技术问题在于克服现有技术的不足,提供一种医疗感应数据流分类模型的构建方法,基于自监督学习理论,设计了高效的、准确的医疗感应数据流分类模型;基于深度可分离卷积方法,设计了轻量级医疗感应数据流分类模型,可有效快速将模型部署在云服务库或各类资源受限的设备上。

本发明具体采用以下技术方案解决上述技术问题:

一种医疗感应数据流分类模型的构建方法,包括以下步骤:

采用自监督学习方法训练并获得基于CNN和LSTM结合的医疗感应数据流分类模型,包括:将未标注的数据输入医疗感应数据流分类模型的稀疏自编码器进行训练,使得模型的输入与输出一致;将带有标签的数据输入训练好的稀疏自编码器,输出得对应的分类结果;

基于深度可分离卷积方法训练医疗感应数据流分类模型,获得轻量级医疗感应数据流分类模型,具体为:

采用滑动窗口技术分割由感应器收集的一个时间段内的人体感应数据流,人体感应数据流被分割为n段多维时间序列数据:x

将分割的n段多维时间序列数据被输入至医疗感应数据流分类模型进行分类:提取每个滑动窗口内的多维时间序列数据的特征,并根据单位时间的输出和下一单位时间的时间序列数据,预测可变时间长度内的时间序列数据;对预测的时间序列数据的异常与否进行分类,获得和输出分类结果,并得到轻量级医疗感应数据流分类模型;

将获得的轻量级医疗感应数据流分类模型存储在云服务库中或部署在边缘设备上。

进一步地,作为本发明的一种优选技术方案,所述方法中医疗感应数据流分类模型由两层LSTM层、一层全连接层和一层softmax输出层组成,并且连接两层之间的边具有权重。

进一步地,作为本发明的一种优选技术方案,所述LSTM层内两个元胞之间的数据转换即到底部隐藏层的输入

进一步地,作为本发明的一种优选技术方案,所述LSTM层的每个元胞内部设置包含多个卷积层的深度可分离卷积网络;所述卷积层包括两类:3×3 Depth-wise卷积层和1×1卷积层,且该两类卷积层间隔排列,每个卷积层后跟一个批量标准化BN层和一个ReLU激活层。

进一步地,作为本发明的一种优选技术方案,所述方法中对预测的时间序列数据的异常与否进行分类,具体为:

由于n个预测的时间序列数据{x

令n个时间序列数据的真实值为

定义多变量高斯第i个预测的时间序列数据x

其中

如果p(e

进一步地,作为本发明的一种优选技术方案,所述方法还包括采用移除常规片段法对采集的人体感应数据流进行片段移除。

本发明采用上述技术方案,能产生如下技术效果:

本发明的方法,基于自监督学习方法训练得到基于CNN和LSTM的高精度医疗感应数据流分类模型,使用未标注的和带有标签数据进行医疗感应数据流分类模型的训练,其中集成的模型为CNN与LSTM的结合,CNN可以学习到局部的特征并且能够权值共享,而LSTM可以学习到数据的前后依赖关系,二者相辅相成,从而提高预测的准确率。并且,采用基于深度可分离卷积技术训练得到轻量级医疗感应数据流分类模型,采取轻量化全精度模型的思想,保证在边缘部署的系统具备两个特点:轻量、高推理准确率。通过本发明的大规模高精度的医疗感应数据流分类模型可以保证较高的异常诊断准确率,实现高精度疾病分类。轻量级医疗感应数据流分类模型在满足了高推理准确率的同时,符合了轻量化的要求,得以部署在云服务库或边缘移动设备等资源受限的设备上。

附图说明

图1为本发明采用的自监督学习方法训练模型的流程示意图。

图2为本发明采用的基于深度可分离卷积方法训练模型的示意图。

具体实施方式

下面结合说明书附图对本发明的实施方式进行描述。

本发明提出了一种医疗感应数据流分类模型的构建方法,该方法具体包括以下步骤:

步骤一、采用自监督学习方法训练并获得基于CNN和LSTM结合的医疗感应数据流分类模型,具体如下:

针对一个疾病领域,比如心血管疾病,可以训练一个大规模、全精度的深度模型,该模型部署于云端。考虑到初期实际能收集到已标注医疗数据非常有限,本发明采用了自监督学习方法训练基于CNN和LSTM结合的医疗感应数据流分类模型,如图1所示,包括:

首先,将未标注的数据输入医疗感应数据流分类模型的稀疏自编码器进行训练,使得模型的输入与输出一致。这样就可以学习到样本中的重要特征,并获得比原始输入数据更好的特征描述。稀疏自编码器训练后得到隐层的输出是对原始输入数据的更好的表示。

接着,将带有标签的数据输入训练好的稀疏自编码器,来获得更好的特征表示。使用上述处理过的带有标签数据进行医疗感应数据流分类模型的训练,其中集成的模型为CNN与LSTM的结合。CNN可以学习到局部的特征并且能够权值共享,而LSTM可以学习到数据的前后依赖关系,二者相辅相成,从而提高预测的准确率。因而可以得到预测结果输出,即对应样本的分类结果。

步骤二、基于深度可分离卷积方法训练医疗感应数据流分类模型,获得轻量级医疗感应数据流分类模型。在前期工作基础上,开发基于深度学习的轻量级精确卷积算法,以微服务的方式发布在云服务库中,或部署在边缘设备上。本发明采取‘轻量化全精度模型’的思想,保证在边缘部署的系统具备两个特点:轻量、高推理准确率。

所述基于深度可分离卷积方法训练医疗感应数据流分类模型,提取每个滑动窗口内的多维时间序列数据的特征,并根据单位时间的输出和下一单位时间的时间序列数据,预测可变时间长度内的时间序列数据;对预测的时间序列数据的异常与否进行分类,获得和输出分类结果,并得到轻量级医疗感应数据流分类模型;具体过程为:

首先,采用滑动窗口技术分割由感应器收集的一个时间段内的人体感应数据流,人体感应数据流被分割为n段多维时间序列数据:x

医疗感应数据流分类模型是一个针对时间序列的CNN与LSTM的集成模型,其架构如图2所示,该模型由四层功能层组成:两层LSTM层、一层全连接层和一层softmax输出层,其中连接两层之间的边具有权重。LSTM层内的一个元胞表示一个时间单元。两个元胞之间的数据转换即到底部隐藏层的输入

每个LSTM元胞内部设计深度可分离卷积网络,提取每个滑动窗口内的多维时间序列数据的特征。元胞中深度可分离卷积网络架构包含多个卷积层,比如25层。卷积层有两类:3×3 Depth-wise卷积层和1×1卷积层。这两类卷积层间隔排列。每个卷积层后跟一个批量标准化BN层和一个ReLU激活层。

在完成对该模型的训练后,本发明可以对预测的时间序列数据的异常与否进行分类。为此,本发明假设预测时间序列数据的误差来自于真正的时间序列适合多变量高斯分布。由于n个预测的时间序列数据{x

步骤三、最后,将获得的轻量级医疗感应数据流分类模型存储在云服务库中,以微服务的方式发布在云服务库中,或部署在边缘设备上,可以部署并存储在云服务器,或边缘移动设备等资源受限的设备上。

另外,本发明方法还可以采用移除常规片段法,采用移除常规片段法对采集的人体感应数据流进行片段移除,即在将数据输入到模型之前,把一些无用的片段移除,仅保留有可能发生异常或异常前缀的片段。这里,常规片段是指维持日常状态的片段。比如,一个长时心房颤动病人的异常是指在常规片段的心房颤动,这个基础疾病之上,又突发其他疾病引起的ECG信号异常。

综上,本发明的方法通过构建高效的、准确的轻量级医疗感应数据流分类模型,可以保证较高的异常诊断准确率,实现高精度疾病分类。轻量级医疗感应数据流分类模型在满足了高推理准确率的同时,符合了轻量化的要求,得以部署在云服务库或边缘设备上。

上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。

技术分类

06120112163287