掌桥专利:专业的专利平台
掌桥专利
首页

生物医学大数据操作系统及生物医学大数据分析方法

文献发布时间:2024-04-18 19:48:15


生物医学大数据操作系统及生物医学大数据分析方法

技术领域

本申请涉及计算机技术领域,具体涉及一种生物医学大数据操作系统以及一种生物医学大数据分析方法。

背景技术

生物医学信息分析工作具有数据量大、分析工具众多,以及多范围协作、跨平台重现的特点和需求。在当前生物医学分析的应用中,多是将应用、功能、分析等都绑定在一个特定平台上,无法实现易移植、整合资源等目标。因此,亟需一个实现生物医学信息分析的操作系统来实现以上目标。

发明内容

有鉴于此,本申请提供一种生物医学大数据操作系统以及一种生物医学大数据分析方法,基于该生物医学大数据操作系统能够整合资源,降低各应用、各功能的协作复杂度。

为解决上述问题,本申请提供的技术方案如下:

第一方面,本申请提供一种生物医学大数据操作系统,所述系统包括:核心框架、外围组件、集成开发环境、应用仓库和数据仓库;所述核心框架,用于执行生物医学分析项目,所述核心框架通过运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析;所述生物医学上层应用包括第一生物医学上层应用和第二生物医学上层应用;所述外围组件,用于提供用户与所述生物医学大数据操作系统的交互接口;所述集成开发环境,用于基于所述核心框架开发所述第一生物医学上层应用;所述应用仓库,用于提供所述第二生物医学上层应用;所述数据仓库,用于提供所述生物医学数据。

第二方面,本申请提供一种生物医学大数据分析方法,所述方法应用于生物医学大数据操作系统,所述系统包括:核心框架、外围组件、集成开发环境、应用仓库和数据仓库;

所述方法包括:

所述核心框架在执行生物医学分析项目时,运行生物医学上层应用和调用生物医学数据;

基于所述生物医学上层应用和所述生物医学数据,完成生物医学数据分析;

其中,所述生物医学上层应用包括第一生物医学上层应用和第二生物医学上层应用;所述外围组件用于提供用户与所述生物医学大数据操作系统的交互接口;所述集成开发环境用于基于所述核心框架开发所述第一生物医学上层应用;所述应用仓库用于提供所述第二生物医学上层应用;所述数据仓库用于提供所述生物医学数据。

由此可见,本申请具有如下有益效果:

本申请提供了一种生物医学大数据操作系统,该生物医学大数据操作系统包括核心框架、外围组件、集成开发环境、应用仓库以及数据仓库。核心框架用于执行生物医学分析项目,在执行生物医学分析项目时,通过运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析。其中,生物医学上层应用包括第一生物医学上层应用和第二生物医学上层应用。外围组件用于提供用户与生物医学大数据操作系统的交互接口,能够通过交互接口实现对生物医学大数据操作系统的使用。集成开发环境用于基于核心框架开发第一生物医学上层应用,应用仓库用于提供第二生物医学上层应用。数据仓库用于提供生物医学数据。生物医学上层应用和生物医学数据均运行在核心框架上。

可知,本申请的生物医学大数据操作系统提供了集成开发环境,这可以支持开发者更方便地开发适合生物医学的上层应用,并且可以在共生的生态中发布这些应用。该生物医学大数据操作系统提供了应用仓库和数据仓库的框架功能,可以建立和支持应用生态、数据生态,提供可以引用应用和数据的能力。该生物医学大数据操作系统中的核心框架能够实现生物医学大数据操作系统中各种功能的组织和统筹管理,例如,可基于核心框架执行生物医学分析项目,在执行生物医学分析项目时,运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析。

附图说明

图1为本申请一实施例提供的生物医学大数据操作系统的结构示意图;

图2为本申请又一实施例提供的生物医学大数据操作系统的结构示意图;

图3为本申请一实施例提供的外围组件的结构示意图;

图4为本申请一实施例提供的核心框架的结构示意图;

图5为本申请又一实施例提供的生物医学大数据操作系统的结构示意图;

图6为本申请实施例提供的一种生物医学大数据分析方法的流程图。

具体实施方式

为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本申请实施例作进一步详细的说明。

为了便于理解和解释本申请实施例提供的技术方案,下面将先对本申请的背景技术进行说明。

生物医学信息分析工作具有数据量大、分析工具众多,以及多范围协作、跨平台重现的特点和需求。在当前生物医学分析的应用中,多是将应用、功能、分析等都绑定在一个特定平台上,无法实现易移植、整合资源等目标。因此,亟需一个实现生物医学信息分析的操作系统来实现以上目标。

本申请提供了一种生物医学大数据操作系统,该生物医学大数据操作系统包括核心框架、外围组件、集成开发环境、应用仓库以及数据仓库。核心框架用于执行生物医学分析项目,在执行生物医学分析项目时,通过运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析。其中,生物医学上层应用包括第一生物医学上层应用和第二生物医学上层应用。外围组件用于提供用户与生物医学大数据操作系统的交互接口,能够通过交互接口实现对生物医学大数据操作系统的使用。集成开发环境用于基于核心框架开发第一生物医学上层应用,应用仓库用于提供第二生物医学上层应用。数据仓库用于提供生物医学数据。生物医学上层应用和生物医学数据均运行在核心框架上。

可知,本申请的生物医学大数据操作系统提供了集成开发环境,这可以支持开发者更方便地开发适合生物医学的上层应用,并且可以在共生的生态中发布这些应用。该生物医学大数据操作系统提供了应用仓库和数据仓库的框架功能,可以建立和支持应用生态、数据生态,提供可以引用应用和数据的能力。该生物医学大数据操作系统中的核心框架能够实现生物医学大数据操作系统中各种功能的组织和统筹管理,例如,可基于核心框架执行生物医学分析项目,在执行生物医学分析项目时,运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析。

可以理解的是,针对以上方案所存在的缺陷,均是申请人在经过实践并仔细研究后得出的结果。因此,上述问题的发现过程以及下文中本申请实施例针对上述问题所提出的解决方案,都应该是申请人在本申请过程中对本申请实施例做出的贡献。

为了便于理解本申请,下面结合附图对本申请实施例提供的生物医学大数据操作系统进行说明。

生物医学分析指的是使用计算机科学方法、算法和工具来分析和解释生物医学数据的过程。本申请实施例提供的生物医学大数据操作系统能够实现生物医学分析。

在本申请实施例中,生物医学大数据操作系统的部署较为灵活,生物医学大数据操作系统可以部署于任一符合预设条件的硬件资源上,即本申请实施例提供的生物医学大数据操作系统不以特定硬件为安装基础,从而在任一安装有该生物医学大数据操作系统的硬件资源上均能获得生物医学大数据操作系统提供的标准化的生物医学相关功能,例如构建生物医学分析项目、基于生物医学分析项目实现生物医学分析等功能,也使得该生物医学大数据操作系统易移植。其中,本申请实施例不限定预设条件的内容。例如,预设条件可为生物医学大数据操作系统安装在硬件资源上所需满足的基本安装要求(如安装环境)。

作为一种可选示例,生物医学大数据操作系统安装的硬件资源可为用户已有的硬件资源,例如云平台、计算机设备、服务器(如独立服务器、服务器集群)等硬件资源。其中,云平台包括公有云、私有云和/或混合云。

参见图1,图1为本申请一实施例提供的一种生物医学大数据操作系统的结构示意图。如图1所示,生物医学大数据操作系统包括核心框架、外围组件、集成开发环境、应用仓库和数据仓库。

核心框架为生物医学大数据操作系统的核心部分,核心框架可以理解为是为了实现生物医学领域标准或完成生物医学领域分析任务所构建的软件组件规范。核心框架为生物医学大数据操作系统执行的第一道程序。

核心框架,用于执行生物医学分析项目,核心框架通过运行生物医学上层应用和调用生物医学数据,完成生物医学数据分析。

在一些可选的实施例中,核心框架连接硬件资源中的计算机系统和生物医学上层应用。其中,计算机系统主要包括计算机物理设备(即底层硬件),计算机物理设备包括存储器、驱动器等。

作为一种可选示例,核心框架搭建了生物医学分析项目构建所需的软件组件规范,可基于核心框架构建生物医学分析项目。例如,生物医学大数据操作系统基于核心框架提供有创建生物医学分析项目的界面,可在该界面中创建生物医学分析项目。生物医学分析项目为实现生物医学分析的一个基本单位,包括用户所设计的生物医学分析的整个流程。这里不限定生物医学分析项目构建的数量和每个生物医学分析项目所实现的生物医学分析的流程。

在实际应用中,可能需要使用一些生物医学上层应用和生物医学数据来完成生物医学分析项目所实现的生物医学分析流程(如生物医学二级分析、生物医学三级分析等),则在构建生物医学分析项目的过程中,可引入生物医学上层应用和/或生物医学数据。生物医学上层应用和生物医学数据均运行在核心框架上。生物医学上层应用属于生物医学大数据操作系统的上层应用。

作为一种可选示例,本申请实施例所述的生物医学上层应用包括由一个或多个生物医学分析算子形成的生物医学分析工作流和/或由交互式编程环境开发的程序代码。

其中,生物医学分析算子,可以理解为实现特定的生物医学分析功能的算法,基于生物医学分析算子能够实现生物医学数据的处理。通常,不同的生物医学分析算子所实现的生物医学分析功能不同,例如,交叉算子、变异算子、blast算子、bwa算子等。

生物医学分析算子可独立运行,也可由一个或多个生物医学分析算子组成生物医学分析工作流。生物医学分析工作流可理解为生物医学分析流程,每个工作流可由多个流程节点构成,用于实现部分或全部的生物医学分析。生物医学分析算子即可看作是工作流中的流程节点,生物医学分析算子所实现的功能可看作是工作流所实现的生物医学分析流程中的一个子流程。例如,算子a的功能为生物医学分析功能A,算子b的功能为生物医学分析功能B。工作流将算子a和算子b连接在一起,完成从生物医学分析功能A到生物医学分析功能B的分析流程。

一个生物医学分析工作流可看作是一个生物医学上层应用。可以理解的是,当生物医学分析工作流包括一个生物医学分析算子时,该生物医学分析算子即为该生物医学上层应用。此时,该生物医学分析算子独立运行。

另外,生物医学大数据操作系统提供交互式编程环境,用户可基于交互式编程环境进行程序代码的编写和运行。由交互式编程环境开发的一组程序代码能够实现独立的功能,则该组程序代码可看作为一个生物医学上层应用。

生物医学数据包括生物医学公共数据以及应用于生物医学分析项目的生产数据。关于生物医学数据的介绍,具体请见下文的数据仓库部分。

在基于核心框架构建生物医学分析项目之后,可基于核心框架执行生物医学分析项目。在执行生物医学分析项目时,基于核心框架运行涉及到的生物医学上层应用以及调用生物医学数据,完成生物医学数据分析。生物医学数据分析简称为生物医学分析。

作为一种可选示例,生物医学上层应用包括第一生物医学上层应用和第二生物医学上层应用。

在一个或多个实施例中,生物医学大数据操作系统还包括集成开发环境,集成开发环境用于实现第一生物医学上层应用的开发。具体实施时,集成开发环境基于核心框架来开发第一生物医学上层应用,同时开发出来的第一生物医学上层应用也会运行于核心框架之上。作为一种可选示例,集成开发环境包括应用集成开发环境,主要由应用集成开发环境基于核心框架来实现第一生物医学上层应用的开发。

作为另一种可选示例,除生物医学上层应用的开发之外,还可基于集成开发环境实现数据开发。参见图2,图2为本申请又一实施例提供的生物医学大数据操作系统的结构示意图。如图2所示,除了应用集成开发环境之外,集成开发环境还包括数据集成开发环境。在数据集成开发环境中能够实现数据开发,数据开发例如为生物医学数据的扩展和集成。

另外,在集成开发环境中还能实现方法支持开发、数据引擎开发等。其中,方法支持开发例如为生物医学分析流程步骤的开发,数据引擎开发例如为数据处理引擎开发、数据分析引擎开发等。另外,集成开发环境还提供人工智能开发接口、数据标注接口、大数据开发接口以及大数据分析接口等,以用于通过这些接口实现开发过程。

在本申请实施例中,基于集成开发环境实现开发后,还能够支持调试,例如支持对开发出的生物医学上层应用进行调试等。具体实施时,集成开发环境还支持下载开发工具、远程调试工具等,以在实际应用中通过开发工具进行应用、数据等的开发,以基于远程调试工具实现开发的应用的调试过程。

通过上述内容可知,生物医学大数据操作系统的集成开发环境统一了生物医学信息开发环境,实现了开发具有统一规则的应用的目标,加强了应用的开发规范性,是开发生物医学上层应用的关键工具,方便灵活的工具可以支撑开发适合生物医学领域的应用程序,从而衍生出一系列面向生物医学领域的特定应用。另外,生物医学大数据操作系统在集成开发环境的基础上开发的新应用可以集成到生物医学大数据操作系统中,以使生物医学大数据操作系统满足生物医学分析的新需求。

应用仓库具体为生物医学应用仓库,应用仓库用于提供第二生物医学上层应用。应用仓库中的第二生物医学上层应用为已经开发完成的应用程序或者为外部调用的应用程序。

在实际应用中,生物医学大数据操作系统与生物医学上层应用在更新迭代时是各自分别迭代的,使得各自的迭代过程较为灵活和方便。在一些可选的实施例中,基于应用集成开发环境开发的生物医学上层应用也可添加到应用仓库中,可根据实际情况进行设置。

数据仓库具体为生物医学数据仓库,数据仓库用于提供生物医学数据。生物医学数据包括生物医学公共数据以及应用于生物医学分析项目的生产数据。在实际应用中,数据仓库提供的是生物医学公共数据。其中,生物医学公共数据包括生物数据、临床数据等。具体地,例如核酸数据、蛋白质数据、遗传变异数据、基因数据(如基因组序列、基因片段、参考基因组)等。生物医学公共数据可从生物医学大数据操作系统外部的开源系统中获取,并存储于生物医学大数据操作系统的数据仓库中。生物医学公共数据能够用于实现生物医学分析,可在生物医学分析过程中使用。

除生物医学公共数据之外,生物医学数据还包括应用于生物医学分析项目的生产数据。例如,当生物医学分析项目为检测个人基因组的项目时,需要先获取用户的生物样本数据(例如用户的血液数据),然后基于该生物样本数据进行生物实验检测,获取生物实验检测得到的数据。生产数据便指的是经过生物实验检测得到的数据。经过实验得到的数据(即生产数据)和公共参考基因组(即公共数据)一起做作为该生物医学分析项目的输入数据,对用户的基因组进行分析。

基于此,核心框架所调用的生物医学数据包括数据仓库提供的生物医学公共数据和/或应用于生物医学分析项目的生产数据。

可知,操作系统包括软件生态和硬件生态,建立和支持生态是操作系统的基本需求。通过上述内容可知,本申请实施例提供的生物医学大数据操作系统包括数据仓库和应用仓库的框架功能,提供了引用上层应用和数据的能力,能够实现生物医学大数据操作系统生态的建立,完成应用和数据在生物医学大数据操作系统中的高度共享。

外围组件,用于提供用户与生物医学大数据操作系统的交互接口。通过外围组件可实现对生物医学大数据操作系统的使用,实现用户对生物医学大数据操作系统的可操作性。

在本申请实施例中,用户可通过外围组件来使用整个生物医学大数据操作系统,调用起核心框架中的功能。则在构建生物医学分析项目的实际过程中,可利用外围组件(如通过操作命令和/或生物医学分析控件)来发起对生物医学上层应用、生物医学数据等的调用。例如设置调用生物医学上层应用A的操作命令,以通过该操作命令发起对生物医学上层应用A的调用。

参见图3,图3为本申请一实施例提供的外围组件的结构示意图。如图3所示,外围组件可以包括:操作系统命令入口CLI以及用户操作界面Web UI。

操作系统命令入口,用于提供生物医学大数据操作系统命令入口,该命令入口可看作是用户与生物医学大数据操作系统的交互接口。命令入口用于接收操作命令(如用户在命令入口输入的操作命令),通过操作命令能够实现该命令对应的操作,例如生物医学分析操作。生物医学分析通过执行生物医学分析项目实现,生物医学分析项目可在生物医学大数据操作系统中构建。生物医学分析操作为实现生物医学分析项目中的生物医学分析过程的操作,本申请实施例并不限定具体的生物医学分析操作。例如,调用生物医学数据为一个生物医学分析操作,运行实现生物医学分析的程序代码也为一个生物医学分析操作,图形编辑操作也可为一个生物医学分析操作。

作为一种可选示例,在生物医学大数据操作系统提供的交互式编程环境中,可提供操作系统命令入口。例如,交互式编程环境中的交互式编程页面可看作是操作系统命令入口,用户可在交互式编程页面中写入程序代码,该程序代码可看作是向生物医学大数据操作系统发出的操作命令。进而,在运行该程序代码时,表示执行操作命令,实现该命令对应的操作。

用户可在用户操作界面执行一些操作,用户操作页面也可看作是用户与生物医学大数据操作系统的交互接口。本申请不限定在用户操作界面上执行的操作的具体内容。作为一种可选示例,用户操作界面用于提供生物医学分析控件。用户可触发生物医学分析控件,生物医学分析控件用于被用户触发后实现生物医学分析操作。详细地,生物医学分析控件封装有生物医学分析操作命令,用户可对生物医学分析控件执行触发操作,响应于该触发操作,运行生物医学分析操作命令,进而执行对应的生物医学分析操作。

另外,如图3所示,外围组件还可包括:代码管理模块、任务监控模块以及运维模块。

如上所述,生物医学大数据操作系统会提供交互式编程环境,用户可进行程序代码的编写和运行。基于此,本申请实施例提供的代码管理模块用于对生物医学分析项目的源码进行编译打包。另外,代码管理模块还支持下载压缩包的功能以及管理不同版本源码的功能。

生物医学大数据操作系统在实现各种功能时,通常需要对实现的功能进行监控。基于此,本申请实施例提供的任务监控模块用于连接监控工具,以基于监控工具监控生物医学分析项目的运行。其中,监控工具可为生物医学大数据操作系统内部集成的工具,也可为生物医学大数据操作系统外部的工具,在使用时进行调用即可。可知,本申请实施例不对监控工具以及监控的内容进行限定,可根据要监控的内容选择监控工具。例如,当监控生物医学分析项目的运行时,可设置对应的监控工具,用来监控生物医学分析项目的运行过程。

运维模块,用于连接运维工具,以基于运维工具实现生物医学大数据操作系统的运维,例如对生物医学大数据操作系统中生物医学上层应用的运维。生物医学大数据操作系统的运维具体包括生物医学大数据操作系统的升级、健康检查等。可知,本申请实施例不对运维工具和运维的内容进行限定,以上运维内容仅作为示例进行说明。

通过上述内容可知,本申请实施例提供的外围组件可以实现除生物医学分析功能以外的辅助功能,用于辅助生物医学大数据操作系统其它功能的实现,使生物医学大数据操作系统的功能更加全面,适应生物医学信息应用的场景和操作。

如图2所示,本申请实施例提供的生物医学大数据操作系统还包括底层资源模块,底层资源具体为底层硬件资源(可简称为底层硬件)。从硬件的角度,底层资源包括公有云、私有云、本地服务器等资源,还包括内存、中央处理器CPU、图形处理器GPU等资源。从功能实现的角度,底层资源包括算力资源、存储资源、网络资源等。例如,可在利用生物医学上层应用进行计算时调用底层资源,具体地,可调用算力资源进行计算,调用网络资源进行通信等。

以下提供了一种核心框架的具体组成结构。

参见图4,图4为本申请一实施例提供的核心框架的结构示意图。如图4所示,核心框架包括:应用管理模块、数据管理模块、运行资源管理模块以及功能定义模块。可以理解的是,应用管理模块、数据管理模块、运行资源管理模块以及功能定义模块等模块均为用户感知的模块。如此,能够增强生物医学大数据操作系统和用户的交互体验。

功能定义模块具体为项目/数据/任务管理模块,用于实现项目管理、数据管理和任务管理。功能定义模块为生物医学大数据操作系统中组织管理项目、数据、任务的基本单元。功能定义模块提供可视化控制界面与控制台,可通过与用户的交互,构建生物医学分析项目(即生物医学分析任务)。生物医学分析项目相关的所有数据、工作流、算子、计算过程、编码过程都生成并被记录在功能定义模块中。功能定义模块还规定了所包含的各元素的资源和说明等,以及对外的接口调用规则等。

在一些可选的实施例中,核心框架,还用于提供生物医学分析工作流执行引擎和交互式编程环境,提供生物医学分析工作流和交互式编程环境的调度执行,提供生物医学上层应用的封装规范和分发标准。其中,生物医学分析工作流执行引擎用于提供生物医学分析工作流的执行环境,交互式编程环境用于提供程序代码开发的环境,交互式编程环境为集成开发环境中的一种。

在功能定义模块中构建的所有的生物医学分析项目均需要一个或多个应用管理模块提供分析的方法支持。基于此,当核心框架包括应用管理模块时,具体由核心框架中的应用管理模块提供上述的生物医学分析工作流执行引擎和交互式编程环境。应用管理模块具备扩展能力,则还能够提供生物医学分析工作流和交互式编程环境的调度执行。并由核心框架的应用管理模块来规定生物医学上层应用(如算子、工作流等)的封装规范和分发标准。

则应用管理模块用于提供调度生物医学上层应用的功能,通过应用管理模块能够调用生物医学上层应用。具体实施时,可由应用管理模块提供应用调度算法、应用调度进程等来实现生物医学上层应用的调度,即通过应用管理模块的调度功能,使得生物医学上层应用运行起来。

另外,应用管理模块能够实现应用开发、应用部署、应用运行、应用管理、应用退出的整个应用生命周期。应用管理模块还拥有高效分发和复用机制、应用状态监控功能、应用故障处理与修复功能、应用关闭退出功能。应用管理模块支持多应用的同时运行,可以实现应用的标准化、模块化复用。

功能定义模块中包含了生物医学分析项目中涉及到的所有数据,包含原始数据、参考数据、分析结果数据等,原始数据包括生物医学数据。

基于此,核心框架中的数据管理模块支持生物医学分析项目运行时的数据组织、输入、输出。例如,数据管理模块用于提供调度生物医学数据的功能,通过数据管理模块能够调用生物医学数据。具体实施时,可由数据管理模块提供数据调度算法、数据调度进程等来实现生物医学数据的调度,即通过数据管理模块的调度功能,调度生物医学数据到生物医学分析项目中。

具体地,数据管理模块针对多维度、海量级、高异构的科研、生物、临床等生物医学数据,还可提供数据存储、数据处理、数据知识库构建、数据展示、数据安全与隐私、数据搜索与分析等功能。

可选地,数据管理模块,还用于提供生物医学数据模型以及数据存储引擎。可以理解的是,在生物医学分析项目中,生物医学分析过程中往往涉及到相互关联的数据文件,因此,可用生物医学数据模型对满足关联性条件的生物医学数据进行整合。在构建生物医学分析项目时,可使用该生物医学数据模型以快速获取满足关联性条件的生物医学数据,并在整个生物医学分析项目的分析过程保持这种数据之间的关联。应理解,本申请实施例不限定关联性条件的具体内容,可根据实际情况进行确定。

另外,数据存储引擎包括对象存储、分布式文件系统等,数据管理模块,还用于提供结构化、半结构化、无结构化数据结构的数据。可选地,生物医学大数据操作系统还支持对接多种数据存储引擎。

运行资源管理模块,用于提供调度底层资源的功能。通过运行资源管理模块,能够调用底层资源。具体地,运行资源管理模块,通过资源池化、分配、调度、隔离四个步骤,将算力资源、存储资源、网络资源等底层资源动态分配给上层的各个应用、算法、工具,保证其有充足的底层运行资源。运行资源管理模块可在混合云、多云环境下实现资源的统一管理。运行资源管理模块用于支撑生物医学大数据操作系统的底层作业调度资源的能力,向下兼容异构资源和集群,向上提供批处理、调度策略配置、运行控制等能力,承载工作流、算子任务、人工智能模型推理等类型的作业运行。

基于上述内容,功能定义模块,具体可用于通过应用管理模块调用生物医学应用仓库中的生物医学上层应用,通过数据管理模块调用生物医学数据,基于生物医学上层应用和生物医学数据构建生物医学分析项目,并通过运行资源管理模块调用底层资源,以在执行生物医学分析项目时使用底层资源,最终完成生物医学数据分析。例如,在执行生物医学分析项目时,可能存在计算行为,此时需要调用底层资源以提供计算资源等。

可选地,功能定义模块还规定有生物医学分析各场景的操作规范和标准流程,并通过人机交互界面,提供统一的交互入口。功能定义模块还提供有算子复用、标准化pipeline组装、交互式和灵活的pipeline设计等功能,有效提升用户实现生物医学分析的效率。

基于上述内容,核心框架既有独立性,又与底层资源和上层应用紧密联系。核心框架能够维护生物医学大数据操作系统中各部分之间的联系和相对稳定、组织生物医学大数据操作系统中各部分之间的秩序,使得生物医学大数据操作系统的功能在不同的硬件资源中正常运行。

参见图5,图5为本申请又一实施例提供的生物医学大数据操作系统的结构示意图。图5展示了生物医学大数据操作系统的一种整体架构,即包括核心框架、外围组件、集成开发环境、应用仓库、数据仓库和底层资源。其中,外围组件包括CLI、Web UI、代码管理模块、任务监控模块以及运维模块。核心框架包括功能定义模块、应用管理模块、数据管理模块、运行资源管理模块。集成开发环境包括应用开发、方法支持、数据引擎开发、数据开发等。应用仓库具体为生物医学应用仓库、数据仓库具体为生物医学数据仓库。底层资源包括公有云、私有云、服务器(如本地服务器)等。

另外,本申请实施例提供的生物医学大数据操作系统对数据规范、开发规范、技术规范进行统一,对工具应用和数据资源进行统一,对生物医学信息开发环境进行统一、对生物医学信息技术架构进行统一,以实现在不同的硬件安装环境中,生物医学大数据操作系统的平稳运行。用户在使用过程中需要遵守相同的生物医学大数据操作系统的规则,以便于提高生物医学大数据操作系统的可移植性、降低共享和协作的复杂度。

另外,生物医学大数据操作系统还可以纳管到用户已有的硬件资源中,在权限可控的前提下,将医学操作系统资源并入一个大网络中,实现资源、数据、应用共享。例如,可将该生物医学大数据操作系统安装到硬件资源上,该硬件资源属于医院系统的硬件资源,则能够实现将该生物医学大数据操作系统并入已有的医院系统中,实现生物医学大数据操作系统和医院系统之间的资源、数据、应用共享等。另外,生物医学大数据操作系统采用模块化设计,功能模块在遵循接口规范的情况下,可以实现模块层面的热插拔和替换。生物医学大数据操作系统还支持多租户(如用户、机构等)同时使用。

另外,本申请实施例提供的生物医学大数据操作系统能够实现跨平台重现。作为一种可选示例,跨平台重现体现在生物医学分析项目的分析结果重现。具体实施时,在生物医学大数据操作系统中构建的生物医学分析项目以及生物医学分析项目中使用的各种分析工具(例如调度的生物医学上层应用、调度的生物医学数据、使用的生物医学分析控件等)均可被存储下来。在实际的存储过程中,可以生物医学分析项目为单位进行存储,该生物医学分析项目包括了使用的各种分析工具、数据、参数等。在存储生物医学分析项目后,可生成该生物医学分析项目的链接,后续可通过该链接实现生物医学分析项目的分享。用户获得该链接后,可以查看该生物医学分析项目中所使用的各种分析工具以及整个项目的分析流程,用户还可查看项目中所使用的各种参数。进而,用户便可在自己的终端设备或云上运行该生物医学分析项目,以实现其分析过程的重现。另外,在分享该链接后,还可给被分享用户该链接的使用权限,以使用户能够正常使用该链接。

可以理解的是,分享的生物医学分析项目中的数据仅能被运行,并非开源数据,如此还能提高分享者的数据和分析工具的安全性。

基于上述内容,本申请实施例提供的生物医学大数据操作系统能够驱动硬件,管理资源,承载上面各种应用的功能需求。将交互、应用、数据、存储资源等模块整合成了一个广义的开发环境,可以融合多方面的生物信息与互联网技术,提供面向生物医学技术领域的开发管理、生物信息应用管理、资源管理、多维数据管理、用户交互管理等功能。如此,无需用户另外购买特定资源或进行数据迁移,基于该生物医学大数据操作系统真正实现了操作系统易移植、整合行业内资源等目标。

基于上述实施例提供的生物医学大数据操作系统,本申请还提供了一种生物医学大数据分析方法。为了便于理解本申请,下面结合附图对本申请实施例提供的一种生物医学大数据分析方法进行说明。

参见图6所示,该图为本申请实施例提供的一种生物医学大数据分析方法的流程图。该方法可应用于上述实施例中所述的生物医学大数据操作系统。如图6所示,该方法可以包括S601-S602:

S601:核心框架在执行生物医学分析项目时,运行生物医学上层应用和调用生物医学数据。

S602:基于生物医学上层应用和生物医学数据,完成生物医学数据分析。

基于S601-S602可知,基于生物医学大数据操作系统的核心框架,能够直接获取生物医学上层应用和生物医学数据,并利用生物医学上层应用和生物医学数据构建生物医学分析项目。进而,在核心框架执行生物医学分析项目时,运行需要的生物医学上层应用和调用生物医学数据,实现生物医学分析。其中,在执行生物医学分析项目时,会使用到生物医学大数据操作系统中的底层资源。

需要说明的是,本实施例提供的生物医学大数据分析方法可以应用于生物医学大数据操作系统,该生物医学大数据操作系统可以为上述实施例中提供的生物医学大数据操作系统,针对该生物医学大数据操作系统的相关功能、原理的说明可以参见上述实施例,在此不再赘述。

需要说明的是,本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统或装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 生物医学大数据操作系统及生物医学大数据分析方法
  • 一种TB级生物医学三维图像数据的大数据格式归档方法
技术分类

06120116306606