医疗数据的处理方法、装置及边缘服务器

文献发布时间：2023-06-19 13:46:35

技术领域

本发明涉及数据处理技术领域，尤其是涉及一种医疗数据的处理方法、装置及边缘服务器。

背景技术

相关技术中，通常通过前置机分别从医院内网中的影像归档和通信系统，以及信息管理系统获取医疗影像文件和对应的医疗报告，并将获取到的数据发送至云端服务器中，云端服务器对医疗影像文件和医疗报告进行数据校验，对医疗影像文件及对应的医疗影像文件进行数据关联等处理，将关联后的数据进行保存。然而该方式中，云端服务器对这些数据进行处理过程中运算量较大，计算资源耗费较多，导致系统不稳定，容易产生故障。

发明内容

有鉴于此，本发明的目的在于提供一种医疗数据的处理方法、装置及边缘服务器，以提高医疗数据的处理效率，提高系统的稳定性。

第一方面，本发明实施例提供了一种医疗数据的处理方法，该方法应用于边缘服务器，边缘服务器与指定内网系统的服务器连接，边缘服务器还与云端服务器连接；该方法包括：获取指定内网系统的服务器中的医疗数据；基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组；其中，同一组数据组中的数据具有相关的关联信息；将数据组发送至云端服务器。

结合第一方面，本发明实施例提供了第一方面的第一种可能的实施方式，其中，医疗数据包括多个子数据；数据清洗方式包括数据去重处理；基于预设的数据清洗方式，对医疗数据进行清洗处理的步骤，包括；查找医疗数据中是否包括相同的多个子数据；如果包括，对相同的多个子数据进行数据去重处理。

结合第一方面，本发明实施例提供了第一方面的第二种可能的实施方式，其中，上述医疗数据包括多个子数据；子数据包括多个条目对应的字段；数据清洗方式包括基于预设的方式对不满足第一预设条件的子数据进行处理；基于预设的数据清洗方式，对医疗数据进行清洗处理的步骤，包括；针对每个子数据，从子数据的多个条目对应的字段中，查找子数据的预设条目对应的字段；如果没有查找到，确定子数据不满足第一预设条件，基于预设的方式对子数据进行处理；如果查找到，判断子数据的预设条目对应的字段的格式是否满足预设格式；如果子数据的预设条目对应的字段的格式不满足预设格式，确定子数据不满足第一预设条件，基于预设的方式对子数据进行处理。

结合第一方面，本发明实施例提供了第一方面的第三种可能的实施方式，其中，上述医疗数据包括多个子数据；子数据包括多个条目对应的字段；关联信息包括关联条目；基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组的步骤，包括：针对清洗后的医疗数据，从子数据的多个条目对应的字段中查找关联条目对应的字符；将关联条目对应的字符相同的子数据确定为数据组。

结合第一方面，本发明实施例提供了第一方面的第四种可能的实施方式，其中，上述医疗数据包括多个医疗影像及多个医疗报告；医疗影像包括患者编号、登记编号及检查实例编号对应的字段；医疗报告包括患者编号、登记编号及检查实例编号对应的字段；关联信息包括患者编号、登记编号及检查实例编号；基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组的步骤，包括：针对清洗后的医疗数据，将患者编号、登记编号及检查实例编号对应的字段相同的医疗影像及医疗报告确定为数据组。

结合第一方面，本发明实施例提供了第一方面的第五种可能的实施方式，其中，上述方法还包括：接收云端服务器发送的配置信息；配置信息包括数据清洗方式、关联信息及补偿条目。

结合第一方面的第五种可能的实施方式，本发明实施例提供了第一方面的第六种可能的实施方式，其中，上述医疗数据包括多个子数据；子数据包括多个条目对应的字段；上述方法还包括：针对没有形成数据组的子数据，从子数据的多个条目对应的字段中查找补偿条目对应的字段；将查找到的补偿条目对应的字段发送至指定内网系统的服务器，以使指定内网系统的服务器基于补偿条目对应的字段查找与没有形成数据组的子数据的具有相关的关联信息的医疗数据。

结合第一方面，本发明实施例提供了第一方面的第七种可能的实施方式，其中，获取指定内网系统的服务器中的医疗数据的步骤，包括：通过预设的网卡向指定内网系统的服务器发送数据读取指令；接收指定内网系统的服务器针对数据读取指令反馈的医疗数据。

结合第一方面，本发明实施例提供了第一方面的第八种可能的实施方式，其中，上述方法还包括：当接收到指定内网系统的服务器发送的医疗数据时，为医疗数据添加时间信息；时间信息指示医疗数据到达当前设备的时间；在当前设备的实时时间与时间信息的时间差大于预设时间阈值时，删除时间信息对应的医疗数据。

结合第一方面，本发明实施例提供了第一方面的第九种可能的实施方式，其中，上述方法还包括：如果设定时间内没有接收到指定内网系统的服务器发送的心跳数据，产生报警信息。

第二方面，本发明实施例还提供一种医疗数据的处理装置，该装置设置于边缘服务器，边缘服务器与指定内网系统的服务器连接，边缘服务器还与云端服务器连接；该装置包括：数据获取模块，用于获取指定内网系统的服务器中的医疗数据；数据清洗模块，用于基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；数据关联模块，用于基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组；其中，同一组数据组中的数据具有相关的关联信息；数据发送模块，用于将数据组发送至云端服务器。

第三方面，本发明实施例还提供一种医疗数据处理系统，包括依次连接的指令内网系统的服务器、边缘服务器以及云端服务器，上述方法应用于边缘服务器。

第四方面，本发明实施例还提供机器可读存储介质，机器可读存储介质存储有机器可执行指令，机器可执行指令在被处理器调用和执行时，机器可执行指令促使处理器实现上述医疗数据的处理方法。

上述一种医疗数据的处理方法、装置及边缘服务器，首先获取指定内网系统的服务器中的医疗数据；然后基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；再基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组具有相关的关联信息的数据组，最后将数据组发送至云端服务器。该方式通过边缘服务器对医疗数据进行清洗及关联处理，提高了系统的数据处理效率，同时提升了系统的稳定性。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案，下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施方式，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的一种相关技术中，医疗数据采集的系统结构示意图；

图2为本发明实施例提供的一种医疗数据的处理方法的流程图；

图3为本发明实施例提供的一种医疗数据的处理系统的结构示意图；

图4为本发明实施例提供的另一种医疗数据的处理方法的流程图；

图5为本发明实施例提供的一种医疗数据的处理系统的工作原理图；

图6为本发明实施例提供的另一种医疗数据的处理方法的流程图；

图7为本发明实施例提供的一种医疗数据的处理装置的结构示意图；

图8为本发明实施例提供的一种边缘服务器的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在医院中，每天都会产生大量的医疗数据，这些医疗数据通常包括患者的基本信息、各种医疗设备应用于患者而产生的影像数据，以及医生基于影像数据作出的诊断结果等。

其中，各种影像数据通常保存在PACS系统中(Picture Archiving andCommunication Systems，意为影像归档和通信系统)它是应用在医院影像科室的系统，主要的任务就是把日常产生的各种医学影像。而患者的基本信息和医生基于影像数据作出的诊断结果可以形成医学报告，这些内容通常保存在信息管理系统中，如放射科相关的内容保存在放射科信息管理系统(Radiology Information System，简称“RIS”)中；该系统是放射科的登记、分诊、影像诊断报告以及放射科的各项信息查询、统计等工作的管理系统。为了安全起见，信息管理系统及影像归档和通信系统均设置于医院内网中。

相关技术中，通常采用基于指定内网系统的服务器(如RIS系统和PACS系统的服务器)、前置机及医疗影像云的系统对各个医院的医疗数据进行系统化管理，为了便于理解，图1示出该应用场景。其中，一个指定内网系统的服务器配备至少一个前置机，多个前置机于医疗影像云连接。

上述医疗影像云通过云端服务器实现，以医学影像信息的云存储为数据基础，以医学影像云计算应用服务为核心，以虚拟化和大数据技术为支撑，通过云传输方式，为医疗机构、医疗保险部门和被检者个人提供多种形式的、基于医学影像的在线云服务模式。上述前置机通常为用于医院现场的中间设备，用来打通不同网络间的数据交换，如医保专网和医院内网、医疗专网和医院内网、公网与医院内网等。

在该系统中，通过前置机分别从内网系统服务器中的影像归档和通信系统，以及信息管理系统获取保存在医疗内网环境中的医疗影像文件和医疗报告，并将医疗影像文件和医疗报告发送至云端服务器中。云端服务器对医疗影像文件和医疗报告进行数据校验，对医疗影像文件及对应的医疗影像文件进行数据关联等处理，将关联后的数据进行保存。

然而上述方式中，云端服务器在对这些数据进行处理时运算量较大，计算资源耗费较多，导致系统不稳定，容易产生故障。

基于此，本发明实施例提供的一种医疗数据的处理方法、装置以及边缘服务器，可以应用于医疗系统产生的各种医疗数据的处理过程中。

首先参见图2所示的一种医疗数据的处理方法的流程图，该方法应用于边缘服务器，边缘服务器与指定内网系统的服务器连接，边缘服务器还与云端服务器连接。通常情况下，属于一个医院的指定内网系统的服务器与一个边缘服务器或边缘服务器集群连接，多个边缘服务器与云端服务器连接。图3中以三个边缘服务器为例，每个边缘服务器分别与一个指定内网系统的服务器连接。

该方法包括如下步骤：

步骤S200，获取指定内网系统的服务器中的医疗数据。

上述医疗数据可以包括医疗报告、医疗影像等与患者就诊相关的数据。这些数据通常保存在与数据类型相关的处于医院内网的系统中，如上述RIS系统及PACS系统。上述指定内网系统可以包括RIS系统及PACS系统。

获取指定内网系统的服务器中的医疗数据的方式可以为指定内网系统的服务器按照预先约定的时间或频率向边缘服务器发送医疗数据；也可以为边缘服务器按照设定频率向指定内网系统的服务器发送数据读取请求，然后接收指定内网系统的服务器返回的医疗数据。具体方式可以根据边缘服务器与指定内网系统的服务器之间的协议确定。当由边缘服务器发送数据读取请求时，通常还需要在数据读取请求中携带预先通过指定内网系统验证的用户名、密码等标识等，以使得指定内网系统验证该数据读取请求的合法性。

步骤S202，基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据。

上述数据清洗过程即为剔除医疗数据中的符合预设条件的数据的过程，通常为不完整的数据或重复数据。其中，该预设条件可以为多种，如重复数据，如果接收到的医疗数据中包括相同的数据，则仅保留其中的一个，删除其它数据。预设条件还可以为数据不完整，作为需要长期保存的医疗数据，通常必须包含患者的身份证号或医保卡号，以及医生的诊断信息等；针对于影像数据，还需要包括该影像数据的编号或登记号信息，编号或登记号信息通常是影像数据与对应的医疗报告进行关联的重要信息。

在确定数据的完整性的基础上，预设条件还可以包括数据中的设定信息不符合预设标准。当数据由多个字段组成的时候，设定信息由设定字段来表示。有些信息的数据格式是具有一定的法律或法规规定的；例如，表示身份证的字段位数需要符合身份证标准，患者手机号的格式是否需要手机号标准等，确定这些信息的数据格式是否符合预设标准的过程为校验数据的合法性。针对于医疗数据，如某些疾病的名称，诊断用语等，需要校验它们的数据权威性，即是否符合其医疗属性。

边缘服务器还可能在接收到更新后的医疗数据，即曾接收过该医疗数据的相关内容，例如同一个病人在一次手术治疗中，先后上传的两个病例数据。这两个病例数据出了诊疗过程的数据外，其关于病人身份信息的数据通常应该是一样的，如患者ID、就诊登记号等。然而，当除了更新内容外，更新前后的数据不同时，也需要对该数据进行清洗。

当医疗数据中的数据符合这些预设条件时，可以直接删除这些数据，也可以把这些数据再发送给指定内网系统的服务器，使指定内网系统的服务器将这些数据补充完整后再发送给边缘服务器进行再次处理。步骤S204，基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组；其中，同一组数据组中的数据具有相关的关联信息。

上述关联信息通常为较为重要的信息，或者是这些医疗数据在保存时需要注意的信息，通常为可以确定一次医疗检查事件的信息。例如，当需要把同一个患者的就诊数据保存在一起时，即形成一组数据组，该关联信息可以为能够表明患者身份的信息，如患者唯一编号(也称为“患者唯一ID”或“患者ID”)，通常为患者的身份证号或社保卡号等。此时，可以在清洗后的医疗数据中读取一个数据中的身份证号或医保卡号，然后在清洗后的医疗数据中查找该患者的身份证号或社保卡号，将包括该患者身份证号或社保卡号的其他医疗数据作为一组数据组。

进一步地，如果想将同一个患者的某次就诊数据保存在一起，该关联信息可以为表明患者身份信息的信息和表明该患者单次就诊的信息，如患者ID、就诊登记号及检查实例ID等。此时，可以在清洗后的医疗数据中读取一个数据中的患者ID、就诊登记号及就诊日期，然后在清洗后的医疗数据中查找包含读取到的身份证号、就诊登记号及检查实例ID的其他医疗数据，将这些数据作为一组数据。

步骤S206，将数据组发送至云端服务器。

具体而言，可以通过预设的网卡与云端服务器通信，将数据组发送至云端服务器。通常情况下，医疗数据需要通过以设定的格式保存在云端服务器中，边缘服务器还可以将医疗数据进行标准化处理，然后再发送至云端服务器。此时，云端服务器主要用于存储边缘服务器发送的数据组，大大降低了云端服务器的资源占用，提高了系统的稳定性。

上述一种医疗数据的处理方法，首先获取指定内网系统的服务器中的医疗数据；然后基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；再基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组具有相关的关联信息的数据组，最后将数据组发送至云端服务器。该方法通过边缘服务器对医疗数据进行清洗及关联处理，提高了系统的数据处理效率，同时提升了系统的稳定性。

本发明实施例还提供另一种医疗数据的处理方法，该方法在上述实施例所述方法的基础上实现；该方法重点描述获取指定内网系统的服务器中的医疗数据的具体实现过程(参见步骤S400-S402)，基于预设的数据清洗方式，对医疗数据进行清洗处理的具体实现过程(参见步骤S404-S414)，以及基于预设的关联信息，对清洗后的医疗数据进行关联处理的具体实现过程(参见步骤S416--S418)；如图4所示，该方法包括如下步骤：

步骤S400，通过预设的网卡向指定内网系统的服务器发送数据读取指令。

通常来说，每块网卡都拥有独一无二的MAC(Media Access Control Address，局域网地址)地址；设置在边缘服务器中的网卡的MAC地址可以预先通过指定内网系统的验证，使得边缘服务器和指定内网系统的服务器可以实现通信。

上述数据读取指令可以包括通过指定内网系统验证的用户标识，以及待获取数据的时间范围，存储待获取数据的系统等。

步骤S402，接收指定内网系统的服务器针对数据读取指令反馈的医疗数据。其中，上述医疗数据通常包括多个子数据；子数据可以为多种类型的数据，如文档数据，影像数据等。

步骤S404，查找医疗数据中是否包括相同的多个子数据；如果包括，执行步骤S406；如果不包括，执行步骤S408。

上述医疗数据中的每个子数据可以包括多个条目对应的字段；其中，条目可以指字符表达的内容对应的数据类型，如条目可以为身份证号码，或医生诊断结果等。当两个子数据相同时，两个子数据包括的条目及条目对应的字段均相同。

步骤S406，对相同的多个子数据进行数据去重处理；执行步骤S408。该过程为一种数据清洗方式，即数据去重处理。

步骤S408，针对每个子数据，从子数据的多个条目对应的字段中，查找子数据的预设条目对应的字段；如果没有查找到，执行步骤S410；如果查找到，执行步骤S412。

上述子数据可以为进行过数据去重处理的医疗数据中的子数据。上述预设条目通常为医疗数据中不可或缺的条目，如患者的身份证号码或医保卡号码等，如果缺少了该信息，无法对该数据进行关联处理。

步骤S410，确定子数据不满足第一预设条件，基于预设的方式该子数据进行处理；执行步骤S416。其中，上述第一预设条件可以为包括预设条目对应的字段。上述预设条目可以基于需求设置为一个或多个。

上述预设的方式可以为对缺少对应字段或不符合标准的数据进行格式转换，以设定字段补充对应的字段或将当前格式转化为标准格式，进行统一格式化存储，然后对该数据进行标注，以便于后续从相关患者的历史数据中查找并补充，如根据该患者的身份证信息查找到该患者的曾就诊记录数据，然后从曾就诊记录数据中查找到该患者的手机号，补充到当前的该患者的医疗数据中，可以将补充后的信息发送至对应的指定内网的服务器，以使相关人员进行确认。上述预设的方式还可以为将缺少对应字段或不符合标准的数据发送给对应的指定内网的服务器，并删除改数据，在服务器提供完整的字段后，再进行保存。

步骤S412，判断子数据的预设条目对应的字段的格式是否满足预设格式。如果满足，执行步骤S414；如果不满足，执行步骤S410。其中，第一预设条件还可以包括预设条目对应的字段符合预设格式，如身份证号码符合身份证标准等。

步骤S414，针对清洗后的医疗数据，从子数据的多个条目对应的字段中查找关联条目对应的字符。

上述关联条目即为预先设定的关联信息。关联信息可以从云端服务器发送的配置信息中获得；此外，配置信息还可以包括数据清洗方式。关联条目可以包括一个或多个，为了保证关联的准确性，通常设定为多个，如患者ID、就诊登记号及检查实例ID等。

例如，当医疗数据包括多个医疗影像及多个医疗报告，医疗影像包括患者编号、登记编号及检查实例编号对应的字段；医疗报告包括患者编号、登记编号及检查实例编号对应的字段时，可以将关联信息设置为患者编号、登记编号及检查实例编号；在进行医疗影像及医疗报告关联时，可以针对清洗后的医疗数据，将患者编号、登记编号及检查实例编号对应的字段相同的医疗影像及医疗报告确定为数据组。

步骤S416，将关联条目对应的字符相同的子数据确定为数据组。

步骤S418，将数据组发送至云端服务器。

此外，针对没有形成数据组的子数据，可以从子数据的多个条目对应的字段中查找补偿条目对应的字段；将查找到的补偿条目对应的字段发送至指定内网系统的服务器，以使指定内网系统的服务器基于补偿条目对应的字段查找与没有形成数据组的子数据的具有相关的关联信息的医疗数据。其中，补偿条目可以从云端服务器发送的配置信息中确定。补偿条目可以包括多个，如患者编号，登记号及检查实例编号等。

由于医疗数据可能会出现上传不及时的情况，如医生的初诊记录数据会首先产生，而对应的医疗影像可能需要较长的时间才能产生，并上传至指定内网系统的服务器中，所以在一次拉取的数据中，可能会出现没有形成数据组的子数据。在上述情况下，如果指定内网系统的服务器没有查找到补偿条目对应的医疗数据，可以在设定时间后再次从指定内网系统的服务器中拉取产生的医疗数据，并在该医疗数据中查找与没有形成数据组的子数据具有相关的关联信息的医疗数据，然后形成数据组，并将数据组上传与服务器或进行存储。

在一些情况下，边缘服务器还会承担医疗数据的存储功能。然而由于医疗数据的数量较大，由于边缘服务器的存储空间有限，需要在接收医疗数据的一定时间后释放该医疗数据。当接收到指定内网系统的服务器发送的医疗数据时，可以为医疗数据添加时间信息；时间信息指示医疗数据到达当前设备的时间；该时间信息可以采用时间戳的形式实现；在当前设备的实时时间与时间信息的时间差大于预设时间阈值时，删除时间信息对应的医疗数据。该时间阈值可以为一个月，三个月或半年等根据需求设定的时间。

由于医疗数据的数量巨大，且产生时间是不固定的，边缘服务器和指定内网系统的服务器需要进行即时通信，为了保持通信网络的畅通性，指定内网系统的服务器可以约定以设定频率向边缘服务器发送设定字段，该设定字段也称为心跳数据。如果边缘服务器在设定时间内没有接收到指定内网系统的服务器发送的心跳数据，可以认为指定内网系统的服务器产生故障或通信网络产生故障，从而产生报警信息，以使相关人员尽快恢复通信。

上述一种医疗数据的处理方法，通过边缘服务器对医疗数据进行数据去重、设定字段校验及关联处理，减少了云端服务器的资源占用，提升了系统稳定性。

本发明实施例还提供另一种医疗数据的处理方法，该方法在上述实施例所述方法的基础上实现。该方法利用“云边端”协同的思路，将前置机作为边缘计算的服务器，除了汇集数据外，还可以承担本医院数据关联校验的计算量、数据清洗等，降低云端运算压力，减少带宽消耗，提升数据处理的时效性。

随着云存储技术的发展，医院对病例数据的存储备份需求强烈：根据《医疗机构管理条例》第五十三条中规定,医疗机构的门诊病历的保存期不得少于十五年，住院病历的保存期不得少于三十年。医院数据中，90％以上为影像数据，建立自己的数据中心存储海量影像数据成本极高，维护成本更高，因此各医院对影像云提供的数据备份需求十分强烈。

然而医院的网络环境较为复杂。为了对患者数据安全方面的考虑，医院内各系统均在医院内网环境进行部署和数据通讯。随着医疗信息化的发展，远程医疗需求强烈，国家卫健委建立了医疗专网，再加上医保专网等，导致医院内部存在各种网络，各网段之间数据不能互通。由于各医院各自有自己的医疗信息化系统，且部署于医院内网，造成了各医院数据跨院调阅困难。

并且，不同类型的医疗数据可能存储在不同的内网系统中；例如，医疗影像报告和医疗影像文件在不同系统中管理：影像报告在医院的RIS系统中管理，影像文件在医院的PACS系统中管理，这对患者完整的影像检查数据查询制造了困难。

其中，PACS系统全程为Picture Archiving and Communication Systems，意为影像归档和通信系统。它是应用在医院影像科室的系统，主要的任务就是把日常产生的各种医学影像(包括核磁，电子计算机断层扫描CT，超声，各种X光机，各种红外仪、显微仪等设备产生的图像)通过各种接口(如模拟接口，医学数字成像和通信DICOM接口，网络接口)以数字化的方式海量保存起来，当需要的时候在一定的授权下能够很快的调回使用，同时增加一些辅助诊断管理功能。它在各种影像设备间传输数据和组织存储数据具有重要作用。

上述DICOM(Digital Imaging and Communications in Medicine即医学数字成像和通信)格式是医学图像和相关信息的国际标准(ISO 12052)。它定义了质量能满足临床需要的可用于数据交换的医学图像格式。PACS系统中的文件包括DICOM文件及非DICOM文件；DICOM文件为按DICOM格式存储医疗影像的文件。非DICOM文件又称Non-DICOM文件。医疗影像文件中，除了DICOM文件以外的其他格式文件均为非DICOM文件，通常格式为JPG、PDF等。

RIS系统为放射科信息管理系统，是放射科的登记、分诊、影像诊断报告以及放射科的各项信息查询、统计等工作的管理系统，RIS系统与PACS系统紧密相连，构成医院数字医疗设备、影像及报告管理的解决方案。

建立区域医学影像云，可以帮助医院海量数据备份，并提升医疗机构的医疗影像报告和影像质量，同时实现数据跨院调阅的需求。但也需要解决医院内网和医疗专网跨网数据传输和跨系统数据关联的问题。

目前，采用的方案是采用前置机作为医院内网和医疗专网的网关联通中枢。前置机主要功能除了连接两个网段，还实现了将医院内各系统数据汇集的功能，如将保存于RIS系统的CT数据、MRI(核磁共振)数据、DR(Computed Radiography，计算机X线摄影)数据，DR(Digital Radiography，数字化X线摄影)、超声数据、DSA(Digital subtractionangiography，数字剪影血管造影)数据以及这些数据对应的医学报告、登记信息均采集至前置机，然后在发送给影像云(即上述“医疗影像云”)。

由于医院每天产生的影像报告和检查数据量大，采用前置机将多家医院的数据集中上传到云端，由云端服务器进行数据清洗和数据校验的方式运算量大，耗资源，容易出故障，对云端服务器造成较大压力，对服务器性能要求很高，导致系统成本高，维护难度大，维护成本高。

此外，上述方式进行数据处理的实效性差；未清洗的数据传输到云端，对带宽要求更高；该方式下的云端架构和业务逻辑都很复杂，开发难度大，运维成本高，交付难度大。

本发明实施例提供的方法基于边缘计算的基本思想，利用云边端协同(云计算和边缘计算协同)的重新定义各模块边界，将部分云端计算提前到前置机完成，可以大幅度减少云端压力。该方法将前置机替换为边缘服务器，前置机的数据汇集功能仍然保留，同时将数据清洗、数据校验等功能由边缘服务器完成，该系统的工作原理图如图5所示。如图6所示，该方法包括以下几个步骤：

1.云端服务器向边缘服务器发送的配置信息：边缘服务器通常配备双网卡(或更多网卡)，其中一个网卡连接医院内网，主要负责接收或拉取医院内各系统产生的数据，另一个网卡连接医疗专网，主要为了与云端服务进行交互，即将处理后的医疗数据传输到云端服务器，接收云端下发的有关数据采集的配置信息。其中，该配置信息可以包括院端系统通讯信息，如RIS系统的数据库视图的地址、端口号、用户名、密码等，以及PACS系统的AETitle、IP、端口号、数据获取的方式、Q/R补偿的AETitle、IP、端口号等；还可以包括关联的字段(相当于上述“关联条目”)和补偿字段(相当于上述“补偿条目”)；还可以包括数据采集的任务的相关信息：比如采集的周期，采集的数据类型，采集的数据开始时间等。

2.边缘服务器向院内系统的服务器发送建立通信的请求，以建立通信。

3.院内系统的服务器(相当于上述“指定内网系统的服务器”)向边缘服务器发送RIS报告及影像数据(DICOM文件及非DICOM文件)：各个医院的RIS数据和PACS上的DICOM和非DICOM数据通过各自的方式上采集到边缘服务器做汇集和存储。

4.边缘服务器对汇集的数据进行数据清洗：数据清洗的方式包括但不限于：数据字段完整性清洗(如果某些字段不存在即删除该数据)；数据字段的唯一性清洗(即数据去重)；数据合法性清洗(如通用字段不符合标准格式即删除该数据)；数据权威性清洗(如某些字段不符合医疗数据格式即删除该数据)；数据一致性清洗(通常指在更新前后的数据除更新内容外有其他不同的情况下则删除该数据)。

5.边缘服务器对清洗后的RIS报告数据和影像文件进行数据关联：将属于同一次医疗检查的RIS数据和影像文件关联为一个完整的检查数据。

6.边缘服务器将已经关联的数据发送至云端服务器。

7.云端服务器将关联数据存储到数据库和相应的文件存储目录中。

8.边缘服务器向院内系统的服务器发送未关联数据：对于没有关联上的数据(有RIS数据无影像文件或有影像文件无RIS数据)，认为是异常数据，需要定时对缺失的数据进行补偿拉取。如果一段合理的时间后(如2天)仍未能将缺失的数据补齐，则转为人工处理，需要人为进行缺失数据的核对。

通常情况下，待云端服务器拉取了处理后的医疗数据后，这些数据仍然会在边缘服务器中存储一段时间，方便医院方浏览、查询相关的数据。可以设置一个足够长的时间(如3个月)作为边缘服务器数据存储时间上限，当达到这个时间上限时，数据会自动清除，以便释放出足够的存储空间用于新数据的存储，也避免边缘服务器配备巨大的存储空间，增加医院采购成本。

此外，边缘服务器还负责对数据传输节点健康状态的监控，对于出现故障，及时报警。

上述方式通过边缘服务器将每个医院的数据单独进行清洗和关联，避免每个医院的数据混合遍历，边缘端压力可控，云端计算压力骤减。由于边缘服务器承担了数据清洗、数据关联等处理，也降低了云端服务器的计算量，减少资源消耗，降低服务器成本，在一定程度上提升了数据处理的实效性，减少数据传输带宽。其中，边缘服务器采用标准化配合和标准组件化服务部署，交付难度低，在一定程度上简化了云端架构，降低开发难度，降低运维成本，降低交付难度。

对应于上述医疗数据的处理方法实施例，本发明实施例还提供一种医疗数据的处理装置，该装置设置于边缘服务器，边缘服务器与指定内网系统的服务器连接，边缘服务器还与云端服务器连接；如图7所示，该装置包括：

数据获取模块600，用于获取指定内网系统的服务器中的医疗数据；

数据清洗模块602，用于基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；

数据关联模块604，用于基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组数据组；其中，同一组数据组中的数据具有相关的关联信息；

数据发送模块606，用于将数据组发送至云端服务器。

上述一种医疗数据的处理装置，首先获取指定内网系统的服务器中的医疗数据；然后基于预设的数据清洗方式，对医疗数据进行清洗处理，得到清洗后的医疗数据；再基于预设的关联信息，对清洗后的医疗数据进行关联处理，得到至少一组具有相关的关联信息的数据组，最后将数据组发送至云端服务器。该方式通过边缘服务器对医疗数据进行清洗及关联处理，提高了系统的数据处理效率，同时提升了系统的稳定性。

进一步地，上述数据获取模块还用于：通过预设的网卡向指定内网系统的服务器发送数据读取指令；接收指定内网系统的服务器针对数据读取指令反馈的医疗数据。

进一步地，医疗数据包括多个子数据；数据清洗方式包括数据去重处理；上述数据清洗模块还用于：查找医疗数据中是否包括相同的多个子数据；如果包括，对相同的多个子数据进行数据去重处理。

进一步地，上述数据清洗方式包括基于预设的方式对不满足第一预设条件的子数据进行处理；基于预设的数据清洗方式，对医疗数据进行清洗处理的步骤，包括；针对每个子数据，从子数据的多个条目对应的字段中，查找子数据的预设条目对应的字段；如果没有查找到，确定子数据不满足第一预设条件，基于预设的方式对该子数据进行处理；如果查找到，判断子数据的预设条目对应的字段的格式是否满足预设格式；如果不满足，确定子数据不满足第一预设条件，基于预设的方式对该子数据进行处理。

进一步地，上述医疗数据包括多个子数据；子数据包括多个条目对应的字段；关联信息包括关联条目；上述数据关联模块还用于：针对清洗后的医疗数据，从子数据的多个条目对应的字段中查找关联条目对应的字符；将关联条目对应的字符相同的子数据确定为数据组。

进一步地，上述医疗数据包括多个医疗影像及多个医疗报告；医疗影像包括患者编号、登记编号及检查实例编号对应的字段；医疗报告包括患者编号、登记编号及检查实例编号对应的字段；关联信息包括患者编号、登记编号及检查实例编号；上述数据关联模块还用于：针对清洗后的医疗数据，将患者编号、登记编号及检查实例编号对应的字段相同的医疗影像及医疗报告确定为数据组。

进一步地，上述装置还包括配置信息接收模块，用于：接收云端服务器发送的配置信息；配置信息包括数据清洗方式、关联信息及补偿条目。

进一步地，上述医疗数据包括多个子数据；子数据包括多个条目对应的字段；上述装置还包括：补偿字段查找模块，用于针对没有形成数据组的子数据，从子数据的多个条目对应的字段中查找补偿条目对应的字段；补偿字段发送模块，用于将查找到的补偿条目对应的字段发送至指定内网系统的服务器，以使指定内网系统的服务器基于补偿条目对应的字段查找与没有形成数据组的子数据的具有相关的关联信息的医疗数据。

进一步地，上述装置还包括：时间信息添加模块，用于当接收到指定内网系统的服务器发送的医疗数据时，为医疗数据添加时间信息；时间信息指示医疗数据到达当前设备的时间；数据删除模块，用于在当前设备的实时时间与时间信息的时间差大于预设时间阈值时，删除时间信息对应的医疗数据。

进一步地，上述装置还包括：报警模块，用于如果设定时间内没有接收到指定内网系统的服务器发送的心跳数据，产生报警信息。

本发明实施例所提供的医疗数据的处理装置，其实现原理及产生的技术效果和前述医疗数据的处理方法实施例相同，为简要描述，医疗数据的处理装置实施例部分未提及之处，可参考前述医疗数据的处理方法实施例中相应内容。

本发明实施例还提供了一种医疗数据处理系统，该系统包括依次连接的指令内网系统的服务器、边缘服务器以及云端服务器，具体可以由图3表示。其中，上述方法应用于边缘服务器。

本发明实施例还提供了一种边缘服务器，参见图8所示，该边缘服务器包括处理器130和存储器131，该存储器131存储有能够被处理器130执行的机器可执行指令，该处理器130执行机器可执行指令以实现上述医疗数据的处理方法。

进一步地，图8所示的边缘服务器还包括总线132和通信接口133，处理器130、通信接口133和存储器131通过总线132连接。

其中，存储器131可能包含高速随机存取存储器(RAM，Random Access Memory)，也可能还包括非不稳定的存储器(non-volatile memory)，例如至少一个磁盘存储器。通过至少一个通信接口133(可以是有线或者无线)实现该系统网元与至少一个其他网元之间的通信连接，可以使用互联网，广域网，本地网，城域网等。总线132可以是ISA总线、PCI总线或EISA总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示，图8中仅用一个双向箭头表示，但并不表示仅有一根总线或一种类型的总线。

处理器130可能是一种集成电路芯片，具有信号的处理能力。在实现过程中，上述方法的各步骤可以通过处理器130中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器130可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、网络处理器(Network Processor，简称NP)等；还可以是数字信号处理器(DigitalSignal Processing，简称DSP)、专用集成电路(Application Specific IntegratedCircuit，简称ASIC)、现成可编程门阵列(Field-Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本发明实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成，或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器，闪存、只读存储器，可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器131，处理器130读取存储器131中的信息，结合其硬件完成前述实施例的方法的步骤。

本发明实施例还提供了一种机器可读存储介质，该机器可读存储介质存储有机器可执行指令，该机器可执行指令在被处理器调用和执行时，该机器可执行指令促使处理器实现上述医疗数据的处理方法，具体实现可参见方法实施例，在此不再赘述。

本发明实施例所提供的医疗数据的处理方法及装置和边缘服务器的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行前面方法实施例中所述的方法，具体实现可参见方法实施例，在此不再赘述。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张弥;
专利申请人：北京金山云网络技术有限公司;

上一篇：永磁同步电机定子电阻检测方法及装置
下一篇：一种高抗冲高阻燃耐候的PBT/PC合金材料