掌桥专利:专业的专利平台
掌桥专利
首页

实验数据管理方法、采集方法和系统

文献发布时间:2023-06-19 11:39:06


实验数据管理方法、采集方法和系统

技术领域

本发明主要涉及实验数据管理,尤其涉及一种实验数据管理、采集方法方法和系统。

背景技术

在各个科研领域,对实验室中实验数据的采集和分析,是所有科研工作的基础。

生物药物的研发通常需要多个不同功能的生物实验团队互相配合,来评价药物生产的稳定性和工艺的可拓展性。研发流程中会产生海量的数据,需要对大分子药物研发中的宿主筛选、细胞表达和蛋白纯化及临床可用性等多个方面的上千个数据维度进行记录和控制。实验过程对接的实验室繁多,实验场地分散,实验设备种类和型号众多。面对如此复杂的应用场景,实验人员对每个实验项目的实验结果,以及实验设备所产生的生物制药数据,目前仍然在使用主要纸质的表单和传统人工的记录方式。这样的管理模式和工作流程已远远不能满足使用现状和管理需求。

随着计算机技术的发展,一些计算机软件支持记录及存储实验数据。例如,一些软件支持ELN等富文本输入来记录实验数据,一些软件仅仅通过word、excel来记录实验数据。然而生物制药的实验数据结构复杂,实验记录的数据格式多变,相同类型的实验数据在不同公司内的数据内容也不尽相同。目前没有计算机软件能够同时保证一定配置数据字段的灵活性,又保证数据的结构化及完整性,并且在此基础上将不同实验数据关联起来。

发明内容

本发明的一个方面提供一种实验数据管理方法和系统,能够实现数据字段的灵活性,又保持数据的结构化及完整性。

本发明的另一个方面提供一种实验数据采集方法和系统,能够将来自多个实验设备的不同实验数据关联起来。

为解决上述技术问题,本发明提供了一种一种实验数据管理系统,包括模板管理器、实验流程规划器和数据管理器。模板管理器适于提供多个模板元素,所述多个模板元素包括名称、实验类型、数据种类和数据项,所述实验类型与实验的多个实验环节关联,所述数据项具有可选择的多个属性,所述多个属性包括:是否包含在标签码中、是否可被扫码、下游是否可见以及与上游数据项的关系。实验流程规划器用于提供规划界面和基于所述多个模板元素创建的多个数据模板,且响应用户的拖拽操作,将多个数据模板拖拽进入所述规划界面中,响应用户链接操作,在所述多个数据模板之间建立链接,以形成用于目标实验的实验流程。数据管理器用于在所述目标实验的过程中,使用所述多个数据模板收集实验数据。

在本发明的一实施例中,所述多个模板元素还包括以下之一或其任意组合:版本号、标签码、自定义分组、存储路径、SOP链接、样本类型以及标签码类型。

在本发明的一实施例中,所述模板管理器还适于接收模板的创建和/或编辑。

在本发明的一实施例中,所述模板管理器还包括预置的与实验的多个实验环节关联的多个模板,所述多个模板作为数据模板。

在本发明的一实施例中,所述实验流程规划器还适于根据所述多个待使用模板的上下游关系检查所述多个数据模板之间的链接。

在本发明的一实施例中,所述实验流程规划器响应用户链接操作,在所述多个数据模板之间建立链接的步骤包括:将第一模板的第一数据项中的上游数据项的关系属性链接到所述目标实验的实验流程位于上游的第二模板中关联的第二数据项。

在本发明的一实施例中,所述实验是生物实验,所述多个实验环节包括:克隆筛选、细胞表达、蛋白纯化、中试放大和制剂工艺。

本发明的另一方面提出一种实验数据管理方法,包括以下步骤:在模板管理器中提供多个模板元素,所述多个模板元素包括名称、实验类型、数据种类和数据项,所述实验类型与实验的多个实验环节关联,所述数据项具有可选择的多个属性,所述多个属性包括:是否包含在标签码中、是否可被扫码、下游是否可见以及与上游数据项的关系;在实验流程规划器中响应用户的拖拽操作,将基于所述多个模板元素创建的多个数据模板拖拽进入规划界面中;响应用户链接操作,在所述多个数据模板之间建立链接,以形成用于目标实验的实验流程;以及在所述目标实验的过程中,使用所述多个数据模板获取实验数据。

在本发明的一实施例中,所述多个模板元素还包括以下之一或其任意组合:版本号、标签码、自定义分组、存储路径、SOP链接、样本类型以及标签码类型。

在本发明的一实施例中,上述方法还包括:在所述模板管理器中接收模板的创建;和/或在所述模板管理器中接收模板的编辑。

在本发明的一实施例中,上述方法还包括:在所述模板管理器中预置与实验的多个实验环节关联的多个模板作为数据模板。

在本发明的一实施例中,上述方法还包括:分别为所述多个数据模板分配角色,所述角色与所述多个数据模板的权限关联。

在本发明的一实施例中,所述权限包括读取、编辑和复核。

在本发明的一实施例中,上述方法还包括:根据所述多个待使用模板的上下游关系检查所述多个数据模板之间的链接。

在本发明的一实施例中,响应用户链接操作,在所述多个数据模板之间建立链接的步骤包括:将第一模板的第一数据项中的上游数据项的关系属性链接到所述目标实验的实验流程位于上游的第二模板中关联的第二数据项。

在本发明的一实施例中,所述实验是生物实验,所述多个实验环节包括:克隆筛选、细胞表达、蛋白纯化、中试放大和制剂工艺。

在本发明的一实施例中,上述方法还包括在所述目标实验的过程中采集实验数据,其包括:通过多个接口协议从多类生物设备读取多类实验数据;分别处理所述多类实验数据中的至少部分类实验数据,包括:通过预先建立的解析逻辑从所述至少部分类实验数据中提取目标数据,并将所述目标数据与设备参数建立对应关系;将所述多类实验数据存储到数据库中;以及通过统一的接口输出所述多类实验数据到所述多个数据模板中。

在本发明的一实施例中,通过多个接口协议从多类生物设备读取多类实验数据的步骤包括:通过所述多个接口协议中的至少部分接口协议从所述多类生物设备中的一类生物设备读取多类实验数据。

在本发明的一实施例中,所述解析逻辑包括第一类逻辑和第二类逻辑,所述第一类逻辑包括位置和参数,所述第二类逻辑包括动作、条件、位置和参数。

在本发明的一实施例中,上述方法还包括在所述多个数据模板中的第一数据模板中调用第一算法进行运算,包括以下步骤:响应于所述第一数据模板上的调用操作,调用经注册并与所述第一数据模板绑定的第一算法,并将与所述调用操作关联的参数传入所述第一算法;以及接收所述第一算法运算后返回的参数。

本发明还提出一种实验数据管理系统,包括:存储器,用于存储可由处理器执行的指令;以及处理器,用于执行所述指令以实现如上任一项所述的方法。

本发明还提出一种存储有计算机程序代码的计算机可读介质,所述计算机程序代码在由处理器执行时实现如上所述的方法。

本发明的另一方面提出一种实验数据采集方法,包括以下步骤:通过多个接口协议从多类生物设备读取多类实验数据;分别处理所述多类实验数据中的至少部分类实验数据,包括:通过预先建立的解析逻辑从所述至少部分类实验数据中提取目标数据,并将所述目标数据与设备参数建立对应关系;将所述多类实验数据存储到数据库中;以及通过统一的接口输出所述多类实验数据。

在本发明的一实施例中,通过多个接口协议从多类生物设备读取多类实验数据的步骤包括:通过所述多个接口协议中的至少部分接口协议从所述多类生物设备中的一类生物设备读取多类实验数据。

在本发明的一实施例中,所述解析逻辑包括第一类逻辑和第二类逻辑,所述第一类逻辑包括位置和参数,所述第二类逻辑包括动作、条件、位置和参数。

在本发明的一实施例中,在将所述多类实验数据存储到数据库中之前还包括:将所述至少部分类实验数据转换为特定格式。

在本发明的一实施例中,上述方法还包括直接提取所述多类实验数据中的另一部分类实验数据,并存储到所述数据库中。

在本发明的一实施例中,所述接口包括Restful接口,所述Restful接口的开始时间和结束时间为UNIX时间戳且精确到秒级。

本发明还提出一种实验数据采集系统,包括:存储器,用于存储可由处理器执行的指令;以及处理器,用于执行所述指令以实现如上所述的方法。

本发明还提出一种存储有计算机程序代码的计算机可读介质,所述计算机程序代码在由处理器执行时实现如上所述的方法。

本发明的另一方面提出一种在数据模板中调用算法的方法,包括以下步骤:注册一个或多个算法;将已注册的算法绑定到至少一个数据模板;响应于第一数据模板上的调用操作,调用与所述第一数据模板绑定的第一算法,并将与所述调用操作关联的参数传入所述第一算法;以及接收所述第一算法运算后返回的参数。

与现有技术相比,本发明的一个方面为实验流程中的各个环节配置数据模板,使得整个实验流程中的全部数据都有相应的数据模板可录入。其次,每个数据模板可被灵活配置,尤其是配置与实验流程密切相关的属性,满足了实验数据字段的灵活性的要求。再者,实验流程采用适于流程和模板灵活配置的操作设置界面和相应的后台数据管理,从而应对实验流程中的各种研究和生产场景的完整数据采集,满足了实验记录要求。

本发明的另一方面通过多个接口协议、建立解析逻辑以及统一接口的方式,将不同实验室、不同实验设备的数据集中管理与整合,从而实现跨部门跨项目的数据信息共享。

附图说明

包括附图是为提供对本申请进一步的理解,它们被收录并构成本申请的一部分,附图示出了本申请的实施例,并与本说明书一起起到解释本申请原理的作用。附图中:

图1是用于实现本申请实施例的方法的示例性环境。

图2是用于实现本申请实施例的示例性程序模块。

图3是本申请实施例的实验数据管理方法示意图。

图4A-4E是本申请实施例的模板创建过程的示例性界面。

图5是本申请实施例的实验规划器示例性界面。

图6是本申请实施例的数据物联模块的结构框图。

图7是本申请实施例的实验数据采集方法流程图。

图8是本申请实施例的获取实验数据的界面示意图。

图9是本申请实施例的实验对象的工艺比较界面示意图。

图10是本申请实施例的模板调用算法的方法流程图。

图11是本申请实施例的算法注册的示例性界面。

图12是本申请实施例的算法绑定的示例性界面。

图13是本申请实施例的算法调用的示例性界面。

图14是本申请实施例的算法调用的返回结果展示界面。

具体实施方式

为了更清楚地说明本申请的实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其他类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。

如本申请和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的步骤和元素,而这些步骤和元素不构成一个排它性的罗列,方法或者设备也可能包含其他的步骤或元素。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本申请的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

此外,需要说明的是,使用“第一”、“第二”等词语来限定零部件,仅仅是为了便于对相应零部件进行区别,如没有另行声明,上述词语并没有特殊含义,因此不能理解为对本申请保护范围的限制。此外,尽管本申请中所使用的术语是从公知公用的术语中选择的,但是本申请说明书中所提及的一些术语可能是申请人按他或她的判断来选择的,其详细含义在本文的描述的相关部分中说明。此外,要求不仅仅通过所使用的实际术语,而是还要通过每个术语所蕴含的意义来理解本申请。

应当理解,当一个部件被称为“连接到另一个部件”时,它可以直接在该另一个部件之上、连接于或耦合于、或接触该另一个部件,或者可以存在插入部件。

图1是用于实现本申请实施例的方法的示例性环境。参考图1所示,实现本发明各方面的示例性环境110具有计算机112。计算机112具有处理单元114、系统存储器116及系统总线118。系统总线118耦合系统组件,包括但不限于将系统存储器116耦合到处理单元114。处理单元114可以是各种可用处理器的任一种。双微处理器和其它多处理器架构也可被用作处理单元114。

系统总线118可以是若干类总线结构的任一种,包括存储器总线或存储器控制器、外围总线或外部总线、和/或使用各种可用总线结构任一种的本地总线,这些总线结构包括,但不限于,11比特总线、工业标准结构(ISA)、微信道结构(MCA)、扩展ISA(EISA)、智能驱动器设备(IDE)、VESA局部总线(VLB)、外围部件互连(PCI)、通用串行总线(USB)、高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)、和小型计算机系统接口(SCSI)。

系统存储器116具有易失性存储器120和非易失性存储器122。包含在计算机112硬件间传送如起动时信息的基本例程的基本输入/输出系统 (BIOS),存储在非易失性存储器122上。作为说明且非限制,非易失性存储器122可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程 ROM(EPROM)、电可擦除ROM(EEPROM)或闪存。易失性存储器120包括作为外部高速缓存的随机存取存储器(RAM)。作为说明且非限制,RAM 有多种形式可用,如同步RAM(SRAM)、动态RAM(DRAM)、同步 DRAM(SRAM)、双数据数率SDRAM(DDR SDRAM)、增强 DSRAM(ESDRAM)、同步链接DRAM(SLDRAM)、和直接Rambus RAM(DRRAM)。

计算机112还具有可移动/不可移动、易失性/非易失性计算机存储介质。图1示出了例如磁盘存储器124。磁盘存储器124包括,但不限于,象磁盘驱动器、软盘驱动器、磁带驱动器、Jaz驱动器、Zip驱动器、LS- 100驱动器、闪存卡、或存储棒。另外,磁盘存储器124可具有单独存储介质或结合其它存储介质包括,但不限于,诸如光盘ROM设备(CD-ROM)、可记录光盘驱动器(CD-R驱动器)、可重写光盘驱动器(CD-RW驱动器)、或数字化通用盘ROM驱动器(DVD-ROM)的光盘驱动器。为便于磁盘存储器 124与系统总线118的连接,通常可使用诸如接口126的可移动或不可移动接口。

应当理解,图1描述了作为用户和在适当操作环境110中描述的基本计算机资源间中间体的软件。这种软件包括操作系统128。可存储在磁盘存储器124中的操作系统128,其作用是控制和分配计算机系统112的资源。应用程序130得益于操作系统128通过存储在或系统存储器116或磁盘存储器124中的程序模块132和程序数据134对资源的管理。可以理解本发明可用各种操作系统或操作系统组合来实现。应用程序130例如是根据本发明实施例的实验数据管理系统(LDMS)。

用户通过输入设备136将命令或信息输入到计算机112中。输入设备 136包括,但不限于,诸如鼠标、跟踪球、铁笔、触板、键盘、麦克风、操纵杆、游戏垫、卫星接收器、扫描仪、电视调谐器卡、数字相机、数字录像照相机、网络相机等定位设备。这些和其它输入设备经系统总线118通过接口端口138与处理单元114相连。接口端口138包括例如串行端口、并行端口、游戏端口、和通用串行总线(USB)。输出设备140使用象输入设备136的某些相同类型端口。因此,例如USB端口可用来为计算机112提供输入,并将信息从计算机112输出到输出设备140。输出适配器142被提供用来说明象监视器、扬声器、和打印机的某些输出设备与其它输出设备 140之间需要特殊适配器。输出适配器142包括,作为说明且非限制,在输出设备140和系统总线118间提供了连接方法的视频卡和声卡。应该注意的是诸如远程计算机144的其它设备和/或设备系统提供输入和输出功能。

计算机112使用与一台或多台远程计算机如远程计算机144的逻辑连接在网络化环境中操作。远程计算机144可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电气设备、对等设备或其它公共网络节点等等,而且通常包括所述与计算机112相关的许多或全部元件。为简化起见,仅存储装置146与远程计算机144一起图示。远程计算机144 经网络接口148与计算机112逻辑连接,然后通过网络连接150进行物理连接。网络接口148包括诸如局域网(LAN)和广域网(WAN)的有线和/或无线通信网络。LAN技术包括光纤分布式数据接口(FDDI)、铜线分布式数据接口(CDDI)、以太网/IEEE1402.3、令牌环/IEEE1402.5等等。WAN技术包括,但不限于,点对点链接、象综合服务数字网(ISDN)及其后变种的电路交换网络、分组交换网络、和数字用户线路(DSL)。

通信连接150指向被用来将网络接口148连接到总线118的硬件/软件。尽管为了清晰地说明,通信连接150被示为位于计算机112内,但它也可在计算机112之外。与网络接口148连接所必需的硬件/软件具有,仅作为示例,诸如包括常用电话级调制解调器、电缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器、和以太网卡等内部和外部技术。

图2是用于实现本申请实施例的示例性程序模块。参考图2所示,本申请的实施例中,应用程序130的程序模块132例如包括数据模板自定义模块202、数据物联模块204和数据输入/输出模块206。数据模板自定义模块202用于获得实验过程中记录数据所需的一系列数据模板。数据模板自定义模块202可包括模板管理器222、实验流程规划器224和数据管理器 226。模板管理器222用于获得与实验过程有关的多个数据模板。实验流程规划器224用于根据需要将部分数据模板组合成实验流程。数据管理器226 用于在实验过程中,使用实验流程中的数据模板获取实验数据。

图3是本申请实施例的实验数据管理方法示意图。图3所示的方法可在例如图1所示的系统中运行。例如方法可实施为由许多计算机指令组成的应用程序130,存储在磁盘存储124中,并加载到系统存储器126中,由处理单元114调用并执行。参考图3所示,在模板管理器222中提供多个模板元素31。这些模板元素例如包括名称、实验类型、数据种类和数据项。可使用这些模板元素在图4A所示的界面中创建(Create)或编辑(Edit)模板。图4B示出示例性的模板元素,参考图4B所示,模板元素可包括以下的任意组合。

模板名称(Template name):自定义模板的名称。

部门编码(BU Code):自定义模板使用的部门的编码

模板类型(Template Type):自定义模板的实验类型

版本号(Version):自动升级的模板的版本号

布局(Layout):模板是否需要额外的定制

标签码打码(Barcode Label):模板中打码功能的标签码

自定义分组(Customize Group):模板中自定义分组

Pdisk Path:模板路径

SOP Link:SOP链接

样本类型(Sample Type):模板中处理的样本类型

标签码类型(Need Barcode Code):需要的标签码类型(例如条形码,二维码等)

简写(Abbreviation):模板的简写

备注(Comments):增加模板中的数据项

在上述元素中,实验类型与实验的多个实验环节关联。以生物实验为例,这些实验环节包括克隆筛选、细胞表达、蛋白纯化、中试放大和制剂工艺等。在一个示例中,实验类型囊括近百种的实验类型。相应地,数据种类可达到数百种。

在上述元素中,数据项具有可选择的多个属性。

图4B和4C示出示例性的属性,参考图4C所示。这些属性包括:

分类(Category):子项分类;

子项名称(ItemName):子项的名称;

排序(Sort):子项的排序编号;

单位(Unit):子项的变量单位;

子项值(Item Value):子项的默认取值;

换行(New Line):子项的是否换行(逻辑值);

小工具(Wdget):子项类型(Checkbox复选框,Checkbox Dropdown复选框下拉,Checkbox System Dropdown复选框系统下拉,Customize Table自定义表格,Date日期,Date Time日期时间,Dropdown下拉表,Dynamic table动态表,File文件,Fix Row Table固定行表格,Formula公式,Hidden 隐藏,Link链接,Linkage Dropdown多级联动下拉框,Number数字,System Dropdown系统下拉,Table表格,Text文本,Textarea文字区域)(参考图 4D所示);

下拉值(Dropdown value):下拉列表的值;

必填(Required):是否必填(逻辑值);

可编辑(Editable):是否可编辑(逻辑值);

可见(Visible):下游是否可见(逻辑值);

Parent id:父级,Wdget选Linkage dropdown时需要填写;

Child id:子级,Wdget选Linkage dropdown时需要填写;

下拉层级(Dropdown Level);

小数位数(Decimal Digit);

表格默认数据(Table Default Data);

标签码信息(Barcode Info):字段是否包含在标签码中(逻辑值);

标签码事件(Barcode Event):该字段是否可以扫码(逻辑值);

标签码域关系(Barcode Field Relation):码上信息与上游模板字段的关系;

输入Excel(Import Excel):输入excel数据(逻辑值);

复制(Next Copy):是否支持字段复制(逻辑值);

高亮(Highlight):是否高亮(逻辑值);

表格编辑(Grid Edit):(逻辑值);

IoT映射(IoT Map):和IOT数据抓取的对应关系字段;

对应父模板列(Parent template column);

动态默认值(Dynamic Default Value);

表头相关编码(Table Title Related Code);

扫描数据类型(Scan Data Type);

表格操作按钮(Table Operate Button);

简称(Abbreviation);

单元格宽度(Grid Cell Width);

质量检查样本(QC Sample);

质量检查附录(QC Appendix);

备注(Comments)。

在上述的属性中,“是否包含在标签码中”设定数据项是否以视觉可见的方式,例如数字、字母、符号等方式包含在标签码中;“是否可被扫码”设定在标签码被扫码时,能否读出此数据项。这些设定可使得数据模板中通过标签码来传递数据项更为方便。如图4E所示,在CPS Cell ID字段扫描上游部门传过来的条形码,就会带出:CPS Cell ID,Viability(存活率)。另一方面,“下游是否可见”设定该数据项是否能被下游的数据模板引用,并呈现在下游的数据模板中;“与上游数据项的关系”设定该数据项所引用的上游数据模板中的某一数据项。在此,上游和下游是对于实验流程而言的,在实验流程中更早进行的步骤及其数据模板称为上游,更早进行的步骤及其数据模板称为下游。这种在不同步骤的数据模板中对于数据项的引用,方便了在不同数据模板间数据项的传递。

在一个示例中,先把需要扫码带出信息的模板(后文称为子模板)中,要关联的所有字段进行记录。从数据来源的模板(后文称为母模板)中,找到对应的字段,按照字段的出现顺序对字段进行编号。在子模板中找到所记录字段的对应ID,进行记录。按照母模板的顺序,在子模板中需要扫码的该字段的‘标签码域关系’(参考图4C所示)中,将排好序的ID输入进去。在子模板中,在Cell ID字段扫描条形码,即可带出上述10个字段的信息。

在本申请的实施例中,基于上述的名称、实验类型、数据种类和数据项等元素创建模板。在一个实施例中,可如步骤302,预先在程序中配置多个数据模板。一些示例性的模板如下表1所示。

表1

在一个实施例中,将实验全流程中涉及的所有模板都预先配置,以方便后续使用。举例来说,药物工艺实验可被细分为166个模板,并预先配置在系统中,从而能够应对药物工艺研发中的各种研究和生产场景的数据采集。

在一个实施例中,允许用户在步骤304创建和/或编辑模板,模板管理器222可接收模板的创建和/或编辑,并保存在程序数据中。例如,在图4A 的界面中,可选择创建(create)模板,也可选择编辑(edit)选定的模板。除此之外,还可以选择预览(Preview)模板、复制(Copy)模板和删除(Delete)模板。在图4A的模板列表中有复选框,可以指定操作的模板。模板列表的表格包括编号(Number),ID,状态(Status),模板名称(Template name),模板类型 (Template Type),版本(Version),部门(BU Code),创建者(Creator),创建时间(Created Time),升级者和升级时间等信息。图4B、图4C和图4D的界面可用于创建或编辑模板中的交互。

在一个实施例中,模板管理器222允许进行模板搜索,搜索关键词包括但不限于:模板名称、部门、模板类型、状态以及版本等。

继续参考图3,在数据模板32创建完成后,可以在步骤306,通过对数据模板进行拖拽/链接操作来组织实验流程。实验流程规划器222提供规划界面和基于多个模板元素创建的多个数据模板。图5是本申请实施例的实验规划器示例性界面。参考图5所示,实验流程规划器界面左栏具有许多数据模板,用户可选择多个数据模板拖拽到右栏的规划界面。实验流程规划器224响应用户的拖拽操作,将多个数据模板501拖拽进入规划界面500中。位于规划界面中的数据模板也显示在下栏的数据模板列表(图未示) 中。用户还可在任何需要的两个数据模板之间建立链接502。链接例如以图中的箭头表示。箭头的前端代表下游,后端代表下游。响应用户链接操作,实验流程规划器224在多个数据模板之间建立链接,以形成用于目标实验的实验流程。一个数据模板可链接到一个或多个下游模板。同样地,一个数据模板也可链接到一个或多个上游模板。

在一个实施例中,实验流程规划器224建立链接的步骤包括,在目标实验的实验流程中,将第一模板的第一数据项中的上游数据项的关系属性链接到位于上游的第二模板中与第一数据项关联的第二数据项。

在一个实施例中,实验流程规划器224根据目标实验来自动地产生至少部分数据模板之间的链接。例如,根据目标实验类型预置部分数据模板之间的链接关系。

在一个实施例中,实验流程规划器224根据多个数据模板的上下游关系检查多个数据模板之间的链接。例如,当第一数据模板中的数据项链接到第二数据模板中的数据项时,如果该第一数据模板置于该第二数据模板之前,则表示二者的上下游关系存在问题。

在一个实施例中,可在步骤310分别为多个数据模板分配角色。这些角色与数据模板的权限关联。这些权限包括但不限于读取、编辑和复核。只有具备权限的角色,才能执行该权限所对应的操作。每个角色的操作记录步骤和每一步涉及的操作将作为操作记录36,保存在数据模板中。

经过前述操作,得到如图3所示的实验流程,这一实验流程中的数据模板可用于在目标实验的过程中收集实验数据,例如从实验设备数据34中采集并处理实验数据(步骤308),从而获得数据记录35。

数据物联模块204用于将不同实验室、不同实验设备的数据集中采集与整合,并传输给数据管理器226,由数据管理器226记录到数据模板中。实验设备例如是生物设备。图6是本申请实施例的数据物联模块的结构框图。参考图6所示,数据物联模块204可包括数据采集服务器242和物联平台244。数据采集服务器242作为感知层,主要感知对接生物实验室/工厂中各种生物设备21-24的稳定性,并探测新数据的生成情况。数据采集服务器242通过不同接口协议对各类生物设备进行数据读取,同时具有不同生物设备的生物数据的存储功能,且将实时数据进行加工,并发送到物联平台244。

物联平台244作为汇聚层,主要对感知层的不同数据进行汇聚,通过统一接口将数据转送到数据管理器226。

在本发明的实施例中,对不同生物设备运用不同数据采集方式,比如上游设备生物反应器(Bioreactor)23,采取OPC(OLE for Process Control) 方式进行数据采集。OPC技术是指为了给工业控制系统应用程序之间的通信建立一个接口标准,在工业控制设备与控制软件之间建立统一的数据存取规范。数据可包括:生物反应器的实验批号,本实验室负责人,培养时间,转数,Temp,pH,DO,CO

图7是本申请实施例的实验数据采集方法示意图。图7所示的方法可在例如图1所示的系统中运行。例如方法可实施为由许多计算机指令组成的应用程序130,存储在磁盘存储124中,并加载到系统存储器126中,由处理单元114调用并执行。参考图7所示,在步骤701,可通过多个接口协议从多类生物设备读取多类实验数据。例如数据采集服务器242从生物设备21-24中读取多类实验数据。在一个实施例中,一类生物设备可能有多类数据,需要多个接口协议。因此可通过多个接口协议中的部分或全部接口协议从一类生物设备读取多类实验数据。在步骤702,分别处理多类实验数据中的至少部分类实验数据。具体地说,通过预先建立的解析逻辑从至少部分类实验数据中提取目标数据,并将目标数据与设备参数建立对应关系。对于多类实验数据中不需处理的另一部分类实验数据,可直接提取另一部分类实验数据,并存储到数据库(database,DB)中。在步骤703,将多类实验数据存储到数据库中。在此,将经过处理或者直接提取的实验数据存储到数据库中。在步骤704,通过统一的接口输出多类实验数据到多个数据模板中。

在一个实施例中,在将多类实验数据存储到数据库中之前,还可将至少部分类实验数据转换为特定格式。

在步骤702中,解析逻辑包括第一类逻辑和第二类逻辑。第一类逻辑包括位置和参数,第二类逻辑包括动作、条件、位置和参数。下表2是对 AKTA设备24进行数据分析的过程中,一些关键字段的解析逻辑。

表2

举例来说,解析逻辑“DB中phase begin对应的eventtime”,包括位置“phasebegin”及参数“eventtime”;解析逻辑“DB抓取Sample flow并且是Completed,匹配样例:Sample flow 1.00{ml/min}Off(Completed) (Manual),抓取其中的1.00值”,包括动作“抓取”、条件“Completed”、“Sample flow”、参数“1.00值”。

在步骤704中,统一的接口可为RESTful接口,其示例性配置如下表 3所示。

表3

如表2所示,Restful接口的开始时间和结束时间为UNIX时间戳且精确到秒级。使用统一的Restful接口,信息集中,使资源可以得到更高效的管理。

另外,数据采集服务器242和物联平台244之间可采用MQTT协议,将不同类型设备数据进行对外的接口发布,一些示例性发布规则如下表4 所述:

表4

对上游模板中数据的实时显示,可以在模板上点击获取在线数据按钮 801获取在线数据,如同一时间生成了多条数据,实验员可以选择准确的数据,如图8所示。

本发明的实施例可将从各实验设备获取的数据进行在线数据共享。共享的数据可包括从上游到下游的各类数据。例如细胞筛选,上游培养,下游纯化,中试放大和制剂检测等阶段的数据。不同部门的同一个试验类型可以按照定制的关键属性统一进行管理和查看,并按照部门的需求进行是否分享的开关(share)。对选取的数据条目,系统按照每个属性的范围自动绘图,并按照不同的试验对象进行颜色的区别,来查看工艺的比较,如图9 所示,例如针对fed-batch的工艺数据,在横坐标表示的是天数,对fed-batch 折线901只有14天的指标,实验对象每天的参数变化可以从图中读出。

本发明的实施例将多源的实验室/生产数据有效融合上下游数据记录,与传统生物设备数据孤立情况不同,通过此数据物联模块204解决了上下游设备数据的同时性和实时性,且相关数据可用以支撑生物制药其他业务的系统化应用。

在本发明的一些实施例中,可以在数据目标中调用一些复杂算法,完成所需的运算。这些算法例如是人工智能(AI)算法,例如针对fed-batch 工艺数据做的生化反应器模型(Bioreactor Model),通过AI预测,实现了细胞培养每一天各项生化指标的最优推荐,进一步提升细胞培养的智能化水平。图10是本申请实施例的模板调用算法的方法流程图。图7所示的方法可在例如图1所示的系统中运行。例如方法可实施为由许多计算机指令组成的应用程序130,存储在磁盘存储124中,并加载到系统存储器126中,由处理单元114调用并执行。参考图10所示,在步骤1001,注册一个或多个算法。如图11所示,可以在系统中使用“Register”(注册)组件1101注册一个或多个算法。注册算法时,可以限定数据源、算法接口、参数等。算法接口1102如

在此,针对生化反应器模型,AI接口为:

http://ccpd-ai-analysis/ccpd_api/execute

并且传入参数:当天及以前培养参数指标。(格式:JSON)

[

{'On_line_data':{'Temp':‘’,'pH':[],'DO':[],'Agitation':[], 'Totalized_Base':[],'Flow_rate_of_micro_O2':[],'Flow_rate_of_O2':[],’ Flow_rate_of_CO2’:[],’Conti_Air_Sparge’:[],

‘Air_Overlay’:[],’Totalized_O2_Micro’:[],‘Totalized_O2_(L-Sparge)’:[],

‘Totalized_CO2’:[],’Spg_Air_Total’:[],’pH Setpoint’:[]},

Off_line_data':{'Temp':[],'pH':[],'pCO2':[],'pO2':[],'Na':[],'K':[], 'Gluc':[],'Lac':[],'NH4':[],'Gln':[],'Osmo':[],'VCD':[],'Viability':[],’Avg_diam’:[]},

'Feed_data':{‘Glucose_400g/L_added’,'Sampling_Vol':[],'Culture_Vol':[],'FM020a':[],'FM020b':[]},

'ID':{'Project_ID':'WB','Batch_ID':9925,'Bucket_ID': 'FU44',’Cell_ID’:},

'Culture_time':“0”

}

在步骤1004,接收第一算法运算后返回的参数。

在此,返回参数为:15天的指标以及包含以经录入与预测指标

[

{

'Temp':”,'DO':”,'Agitation':”,'Totalized_Base':”,'Flow_rate_of_micro_O2':”,l ow_rate_of_O2':‘’,low_rate_of_CO2’:[],’Conti_Air_Sparge’:”,

‘Air_Overlay’:”,’Totalized_O2_Micro’:”,‘Totalized_O2_(L-Sparge)’:”,

‘Totalized_CO2’:”,’Spg_Air_Total’:”,’pH Setpoint’:”,

'Temp':”,'pH':”,'pCO2':”,'pO2':”,'Na':”,'K':”,'Gluc':”,'Lac':”,'NH4':”, 'Gln':”,'Osmo':[],'VCD':”,'Viability':”,’Avg_diam’:”, 'Glucose_400g/L_added':”,'Base':”,Sampling_Vol':”, 'Culture_Vol':”,'FM020a':”,'FM020b':”,'FM003':”,'FM004':”,'Project_ID':”, 'WB','Batch_ID':”,'Bucket_ID':”,’Cell_ID’:”,

'Day':‘’

}

]

返回结果如图14,空心点线代表已经录入的指标,实心点线是预测的指标,如果(线断处)则是原始数据未采集或AI预测为空,可以选择不同指标参数显示图形(或下载图形为图片)。

本申请中使用了流程图用来说明根据本申请的实施例的系统所执行的操作。应当理解的是,前面或下面操作不一定按照顺序来精确地执行。相反,可以按照倒序或同时处理各种步骤。同时,或将其他操作添加到这些过程中,或从这些过程移除某一步或数步操作。

与常规的实验数据管理系统相比,本申请实施例为实验流程中的各个环节配置数据模板,使得整个实验流程中的全部数据都有相应的数据模板可录入。其次,每个数据模板可被灵活配置,尤其是配置与实验流程密切相关的属性,满足了实验数据字段的灵活性的要求。再者,实验流程采用适于流程和模板灵活配置的操作设置界面和相应的后台数据管理,从而应对实验流程中的各种研究和生产场景的完整数据采集,满足了实验记录要求。

另一方面,本申请实施例通过多个接口协议、建立解析逻辑以及统一接口的方式,将不同实验室、不同实验设备的数据集中管理与整合,从而实现跨部门跨项目的数据信息共享。

上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述发明披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。

同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。

本申请的一些方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。处理器可以是一个或多个专用集成电路(ASIC)、数字信号处理器 (DSP)、数字信号处理器件(DAPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器或者其组合。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。例如,计算机可读介质可包括,但不限于,磁性存储设备(例如,硬盘、软盘、磁带……)、光盘(例如,压缩盘CD、数字多功能盘DVD……)、智能卡以及闪存设备(例如,卡、棒、键驱动器……)。

计算机可读介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等等、或合适的组合形式。计算机可读介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机可读介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、射频信号、或类似介质、或任何上述介质的组合。

同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。

虽然本申请已参照当前的具体实施例来描述,但是本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本申请,在没有脱离本申请精神的情况下还可作出各种等效的变化或替换,因此,只要在本申请的实质精神范围内对上述实施例的变化、变型都将落在本申请的权利要求书的范围内。

相关技术
  • 实验数据管理方法、采集方法和系统
  • 一种Proteus虚拟仿真实验数据采集方法、系统及装置
技术分类

06120113008130