掌桥专利:专业的专利平台
掌桥专利
首页

数据存储方法、装置、系统及计算机可读存储介质

文献发布时间:2023-06-19 16:11:11



技术领域

本申请涉及数据存储和数据采集的技术领域,尤其涉及数据存储方法、装置、系统及计算机可读存储介质。

背景技术

随着科技发展和社会进步,大众健康将从医疗转向预防为主,不断提高民众的自我健康管理意识,与之相应的是,各种人体生理监测设备应运而生,能够提供实时监测生理指标的服务,有的人体生理监测设备还能够提供长时间监测生理指标的功能。

例如24小时心电监测所使用的心电记录仪,包括电极片、导线和记录盒,在受检者胸前部粘贴多个电极片,各个电极片经导线连接到记录盒,记录盒采用普通盒式磁带,能够连续记录24小时的心电数据。盒子上有背带,连接好后斜肩挎上,受检者可以直接回家,不需要留在医院接受监测,还能够正常进行各种活动,使用起来较为方便。但由于该仪器涉及磁带记录技术,工艺要求高,价格昂贵。并且,磁带存储不是在线存储,所存储的数据无法通过联网访问,一旦丢失就无法找回。

除了心电记录仪之外,还有一些生理监测设备能够长时间监测人体生理指标,例如脑电采集设备。在采集脑电数据时,如需要观察测试者一整天的电波变化,就需要设置很长的采集时间,如24小时,这样采集的文件就会很大,无论是打开还是修改,都会占用设备很大的内存空间及等待时间。

专利CN112394876A公开了一种大文件存储方法,包括下述步骤:根据预设的存储单位大小分割大文件为文件因子;根据各文件因子大小,分别确定连续的存储空间存储各文件因子;关联每个文件因子的存储时间和存储地址,以使得每个文件因子通过对应的存储时间和关联的存储地址唯一确定。该方法根据预设的存储单位大小对大文件进行分割。

基于此,本申请提供了数据存储方法、装置、系统及计算机可读存储介质,以解决上述现有技术中存在的问题。

发明内容

本申请的目的在于提供数据存储方法、装置、系统及计算机可读存储介质,能够根据预设的分片采集时长对实时采集的数据进行分段存储,解决了大文件存储困难,需占用大量内存空间及处理时长的问题。

本申请的目的采用以下技术方案实现:

第一方面,本申请提供了一种数据存储方法,用于对实时采集的生物电数据进行存储,所述方法包括:

S1:获取采集开始时刻,并在所述采集开始时刻执行S2;

S2:利用数据采集设备实时采集生物体的生物电数据;

S3:当接收到所述数据采集设备发送的生物电数据时,创建一个分片文件,将采集得到的生物电数据写入本次创建的分片文件,并将本次创建的分片文件的标识信息写入目录文件;

S4:当本次创建的分片文件的数据写入时长不小于预设的分片采集时长时,将本次创建的分片文件保存并关闭;

S5:检测是否满足预设的采集结束条件;若是,则停止采集和存储数据;若否,则继续执行S2;

其中,所述预设的采集结束条件包括以下至少一种:

当前时刻到达采集结束时刻;

接收到采集结束操作。

该技术方案的有益效果在于:能够根据预设的分片采集时长对实时采集的数据进行分段存储,解决了大文件存储困难,需占用大量内存空间及处理时长的问题。首先,确定采集开始时刻,在采集开始时刻实时采集生物电数据,当接收到生物电数据时创建分片文件,将采集得到的生物电数据写入该分片文件,并将该分片文件的标识信息(例如可以是文件名称、文件编号等)写入目录文件;当该分片文件的数据写入时长不小于预设的分片采集时长时,停止写入数据,并将该分片文件保存并关闭;每次保存并关闭一个分片文件后,要执行结束检测步骤,即检测是否满足预设的采集结束条件,如果满足,则停止采集、存储数据(完成数据采集存储任务),否则重复执行数据采集存储步骤,即重新执行数据采集、创建分片文件、数据写入分片文件、文件信息写入目录文件、分片文件保存并关闭以及结束检测步骤,以此类推,重复多次,从而针对实时采集、且采集时长较长的生物电数据进行采集、存储。采用上述方式,针对长时间的实时数据采集、存储过程,将原本可能生成的大文件化整为零(即不会产生大文件),具体而言,按照采集时间的先后区别,先后创建多个分片文件,每个分片文件用于存储一定时长(即预设的分片采集时长)内采集得到的生物电数据,各个分片文件被先后创建并先后保存,并且在整个数据采集存储过程中,同一时间只有一个分片文件占用内存空间,由于单个分片文件的文件大小相对较小,因此存储简单,不会占用太多内存空间,处理时长也较短。

在一些可选的实施方式中,所述采集开始时刻和所述采集结束时刻的获取过程包括:

利用交互设备接收采集开始操作,响应于所述采集开始操作,将接收到所述采集开始操作的时刻作为所述采集开始时刻;

基于所述采集开始时刻和所述生物体对应的采集时长,确定所述采集结束时刻。

该技术方案的有益效果在于:数据采集人员可以利用交互设备控制数据采集存储过程,具体而言,数据采集人员可以在交互设备上进行采集开始操作(例如是点击“开始采集”按钮的操作或者是按压“开始采集”按键的操作等),从而将此时对应的当前时刻确定作为采集开始时刻。这种设定方式符合用户的使用习惯,操作简单,容易实现,适用于数据采集过程这种可能没有固定开始时刻的场合。在确定采集开始时刻后,基于该生物体对应的采集时长,能够确定与采集开始时刻相应的采集结束时刻。这样做的好处是,针对不同的生物体可以设置相同或不同的采集时长,并自动确定对应的采集结束时刻,免去了人工设定采集结束时刻的步骤,减少了数据采集人员的工作量。

在一些可选的实施方式中,所述生物体对应的采集时长的获取过程包括:

获取所述生物体的分类信息,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

将所述生物体的分类信息输入采集时长模型,以得到所述生物体对应的采集时长。

该技术方案的有益效果在于:首先获取生物体的分类信息,再基于分类信息得到该生物体对应的采集时长(该采集时长大于分片采集时长)。生物体的种类、年龄、性别、身高、体重不同,所对应的生长发育情况、饮食习惯、睡眠习惯、活动强度等往往不同,所能接受的采集时长的上限不同,为了监测其生理参数所需要的采集周期也不同,针对不同的生物体设置不同的采集时长,考虑该类型人群或者每个不同个体的生物特性来选择合适的采集时长,例如可以为体重较轻、好动的儿童设定相对较短的采集时长(例如是6小时),为长期卧床的老人设定相对较长的采集时长(例如是48小时),为正常体重的女性设定中间的采集时长(例如是24小时),为肥胖的男性设定相对较长的采集时长(例如是30小时)。这样,可以针对不同的生物体获取不同采集时长的生物电数据,既能够满足生物电监测的需求,又避免使用统一的采集时长时,部分人群无法完成数据采集或者完成较为困难的情况。另外,采集时长模型可以由大量的训练数据训练得到,能够针对不同的输入数据(即生物体的分类信息)预测得到相应的输出数据(即生物体对应的采集时长),适用范围广,智能化水平高。

在一些可选的实施方式中,所述采集时长模型的训练过程包括:

获取训练集,所述训练集包括多个训练数据,每个所述训练数据包括一个样本生物体的分类信息以及所述样本生物体对应的采集时长的标注数据;

针对所述训练集中的每个训练数据,执行以下处理:

将所述训练数据中的样本生物体的分类信息输入预设的深度学习模型,以得到所述样本生物体对应的采集时长的预测数据;

基于所述样本生物体对应的采集时长的预测数据和标注数据,对所述深度学习模型的模型参数进行更新;

检测是否满足预设的训练结束条件;如果是,则将训练出的所述深度学习模型作为所述采集时长模型;如果否,则利用下一个所述训练数据继续训练所述深度学习模型。

该技术方案的有益效果在于:通过设计,建立适量的神经元计算节点和多层运算层次结构,选择合适的输入层和输出层,就可以得到预设的深度学习模型,通过该预设的深度学习模型的学习和调优,建立起从输入到输出的函数关系,虽然不能100%找到输入与输出的函数关系,但是可以尽可能地逼近现实的关联关系,由此训练得到的采集时长模型,可以基于生物体的分类信息获取生物体对应的采集时长,且计算结果准确性高、可靠性高。

在一些可选的实施方式中,所述创建一个分片文件,包括:

在预设的数据存储位置创建一个分片文件。

该技术方案的有益效果在于:多个分片文件可以存储于同一个预设的数据存储位置,在后续数据读取过程中,不需要频繁访问多个数据存储位置就能够获得整个数据采集存储过程对应的全部生物电数据。

在一些可选的实施方式中,所述S3,还包括:

将本次创建的分片文件在所述目录文件中的编号写入目录文件。

该技术方案的有益效果在于:虽然分片文件的创建及保存存在先后顺序关系,但是需要将目录文件对应的多个分片文件按照创建时间排序等方式才能明确,而采用编号来指示分片文件的创建及保存的先后顺序,简单便捷,可操作性强。另外,目录文件中包含分片文件的标识信息和编号,指向性更强、可读性更强,便于人员理解和操作。

在一些可选的实施方式中,所述数据写入时长的获取过程包括:

利用计时器对生物电数据写入本次创建的分片文件的过程进行计时,以得到所述数据写入时长。

该技术方案的有益效果在于:使用计时器来对生物电数据写入本次创建的分片文件的过程(即本次数据写入过程)进行计时,方便快捷。另外,计时器还可以具备定时触发功能,每次计时到达分片采集时长时触发保存和关闭分片文件的操作,并进行复位,用于对下一次的数据写入过程进行计时。

第二方面,本申请提供了一种数据存储装置,用于对实时采集的生物电数据进行存储,所述装置包括处理器,所述处理器被配置成执行以下步骤:

S1:获取采集开始时刻,并在所述采集开始时刻执行S2;

S2:利用数据采集设备实时采集生物体的生物电数据;

S3:当接收到所述数据采集设备发送的生物电数据时,创建一个分片文件,将采集得到的生物电数据写入本次创建的分片文件,并将本次创建的分片文件的标识信息写入目录文件;

S4:当本次创建的分片文件的数据写入时长不小于预设的分片采集时长时,将本次创建的分片文件保存并关闭;

S5:检测是否满足预设的采集结束条件;若是,则停止采集和存储数据;若否,则继续执行S2;

其中,所述预设的采集结束条件包括以下至少一种:

当前时刻到达采集结束时刻;

接收到采集结束操作。

在一些可选的实施方式中,所述处理器被进一步配置成采用以下方式获取所述采集开始时刻和所述采集结束时刻:

利用交互设备接收采集开始操作,响应于所述采集开始操作,将接收到所述采集开始操作的时刻作为所述采集开始时刻;

基于所述采集开始时刻和所述生物体对应的采集时长,确定所述采集结束时刻。

在一些可选的实施方式中,所述处理器还被配置成采用以下方式获取所述生物体对应的采集时长:

获取所述生物体的分类信息,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

将所述生物体的分类信息输入采集时长模型,以得到所述生物体对应的采集时长。

在一些可选的实施方式中,所述采集时长模型的训练过程包括:

获取训练集,所述训练集包括多个训练数据,每个所述训练数据包括一个样本生物体的分类信息以及所述样本生物体对应的采集时长的标注数据;

针对所述训练集中的每个训练数据,执行以下处理:

将所述训练数据中的样本生物体的分类信息输入预设的深度学习模型,以得到所述样本生物体对应的采集时长的预测数据;

基于所述样本生物体对应的采集时长的预测数据和标注数据,对所述深度学习模型的模型参数进行更新;

检测是否满足预设的训练结束条件;如果是,则将训练出的所述深度学习模型作为所述采集时长模型;如果否,则利用下一个所述训练数据继续训练所述深度学习模型。

在一些可选的实施方式中,所述处理器被进一步配置成采用以下方式创建一个分片文件:

在预设的数据存储位置创建一个分片文件。

在一些可选的实施方式中,在执行S3时,所述处理器还被配置成:

将本次创建的分片文件在所述目录文件中的编号写入目录文件。

在一些可选的实施方式中,所述处理器被进一步配置成采用以下方式获取所述数据写入时长:

利用计时器对生物电数据写入本次创建的分片文件的过程进行计时,以得到所述数据写入时长。

第三方面,本申请提供了一种数据存储系统,所述数据存储系统包括:

上述任一项数据存储装置;

数据采集设备,所述数据采集设备用于实时采集生物体的生物电数据;

计时器,所述计时器用于提供计时功能。

第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项方法的步骤或者实现上述任一项装置的功能。

附图说明

下面结合附图和实施方式对本申请进一步说明。

图1示出了本申请提供的一种数据存储系统的结构框图。

图2示出了本申请提供的一种数据存储方法的流程示意图。

图3示出了本申请提供的另一种数据存储方法的流程示意图。

图4示出了现有技术提供的一种数据存储示意图。

图5示出了本申请提供的一种数据存储示意图。

图6示出了本申请提供的一种数据存储装置的结构框图。

图7示出了本申请提供的一种程序产品的结构示意图。

具体实施方式

下面将结合本申请的说明书附图以及具体实施方式,对本申请中的技术方案进行描述,需要说明的是,在不相冲突的前提下,以下描述的各实施方式之间或各技术特征之间可以任意组合形成新的实施方式。

在本申请中,“至少一个”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B的情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指的这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,a和b,a和c,b和c,a和b和c,其中a、b和c可以是单个,也可以是多个。值得注意的是,“至少一项(个)”还可以解释成“一项(个)或多项(个)”。

还需说明的是,本申请中,“示例性的”或者“例如”等词用于表示作例子、例证或说明。本申请中被描述为“示例性的”或者“例如”的任何实施方式或设计方案不应被解释为比其他实施方式或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。

下面,首先对本申请的其中一个应用领域(即植入式器械)进行简单说明。

植入式神经刺激系统(一种植入式医疗系统)主要包括植入患者体内的刺激器以及设置于患者体外的程控设备。现有的神经调控技术主要是通过立体定向手术在体内特定结构(即靶点)植入电极,并由植入患者体内的刺激器经电极向靶点发放电脉冲,调控相应神经结构和网络的电活动及其功能,从而改善症状、缓解病痛。其中,刺激器可以是植入式神经电刺激装置、植入式心脏电刺激系统(又称心脏起搏器)、植入式药物输注装置(Implantable Drug Delivery System,简称I DDS)和导线转接装置中的任意一种。植入式神经电刺激装置例如是脑深部电刺激系统(Deep Brain Stimulation,简称DBS)、植入式脑皮层刺激系统(Cortical Nerve Stimulation,简称CNS)、植入式脊髓电刺激系统(SpinalCord Stimulation,简称SCS)、植入式骶神经电刺激系统(Sacral Nerve Stimulation,简称SNS)、植入式迷走神经电刺激系统(Vagus Nerve Stimulation,简称VNS)等。

刺激器可以包括IPG、延伸导线和电极导线,IPG(implantable pulse generator,植入式脉冲发生器)设置于患者体内,依靠密封电池和电路向体内组织提供可控制的电刺激能量,通过植入的延伸导线和电极导线,为体内组织的特定区域递送一路或两路可控制的特定电刺激。延伸导线配合IPG使用,作为电刺激信号的传递媒体,将IPG产生的电刺激信号,传递给电极导线。电极导线通过多个电极触点,向体内组织的特定区域递送电刺激。刺激器设置有单侧或双侧的一路或多路电极导线,电极导线上设置有多个电极触点,电极触点可以均匀排列或者非均匀排列在电极导线的周向上。作为一个示例,电极触点可以以4行3列的阵列(共计12个电极触点)排列在电极导线的周向上。电极触点可以包括刺激电极触点和/或采集电极触点。电极触点例如可以采用片状、环状、点状等形状。

在一些可能的实现方式中,受刺激的体内组织可以是患者的脑组织,受刺激的部位可以是脑组织的特定部位。当患者的疾病类型不同时,受刺激的部位一般来说是不同的,所使用的刺激触点(单源或多源)的数量、一路或多路(单通道或多通道)特定电刺激信号的运用以及刺激参数数据也是不同的。本申请对适用的疾病类型不做限定,其可以是脑深部刺激(DBS)、脊髓刺激(SCS)、骨盆刺激、胃刺激、外周神经刺激、功能性电刺激所适用的疾病类型。其中,DBS可以用于治疗或管理的疾病类型包括但不限于:痉挛疾病(例如,癫痫)、疼痛、偏头痛、精神疾病(例如,重度抑郁症(MDD))、躁郁症、焦虑症、创伤后压力心理障碍症、轻郁症、强迫症(OCD)、行为障碍、情绪障碍、记忆障碍、心理状态障碍、移动障碍(例如,特发性震颤或帕金森氏病)、亨廷顿病、阿尔茨海默症、药物成瘾症、自闭症或其他神经学或精神科疾病和损害。当DBS用于治疗药物成瘾症患者时,可以帮助吸毒人员戒毒,提升他们的幸福感和生命质量。

本申请中,程控设备和刺激器建立程控连接时,可以利用程控设备调整刺激器的刺激参数(不同的刺激参数所对应的电刺激信号不同),也可以通过刺激器感测患者脑深部的生物电活动以采集得到生物电数据,并可以通过所采集到的生物电数据来继续调节刺激器的电刺激信号的刺激参数。

程控设备可以是医生程控器(即医生使用的程控设备)或者患者程控器(即患者使用的程控设备)。程控设备例如可以是平板电脑、笔记本电脑、台式计算机、手机等智能终端设备。

本申请对医生程控器和刺激器的数据交互不进行限制,当医生远程程控时,医生程控器可以通过服务器、患者程控器与刺激器进行数据交互。当医生线下和患者面对面进行程控时,医生程控器可以通过患者程控器与刺激器进行数据交互,医生程控器还可以直接与刺激器进行数据交互。

患者程控器可以包括(与服务器通信的)主机和(与刺激器通信的)子机,主机和子机可通信的连接。其中,医生程控器可以通过3G/4G/5G网络与服务器进行数据交互,服务器可以通过3G/4G/5G网络与主机进行数据交互,主机可以通过蓝牙协议/WIFI协议/USB协议与子机进行数据交互,子机可以通过401MHz-406MHz工作频段/2.4GHz-2.48GHz工作频段与刺激器进行数据交互,医生程控器可以通过401MHz-406MHz工作频段/2.4GHz-2.48GHz工作频段与刺激器直接进行数据交互。

除了上述植入式器械的应用领域,本申请还可以应用于其他医疗器械甚至非医疗器械的技术领域,本申请不对此设限,只要涉及实时采集和存储数据且采集时间长的场合均可应用。

【系统实现方式】

参见图1,图1示出了本申请提供的一种数据存储系统的结构框图。

所述数据存储系统包括:

数据存储装置10;

数据采集设备20,所述数据采集设备20用于实时采集生物体的生物电数据;

计时器30,所述计时器用于提供计时功能。

本申请对数据采集设备20不作限定,其例如可以包括刺激器、体外采集仪、电极帽、智能手环、智能手表、智能运动背心、智能运动短裤、智能理疗仪、智能按摩椅中的一种或多种。

上述产品使用电极片或者电极触点实时采集生物体体内或体外的生物电数据,也就是说,可以通过数据采集设备20实时采集生物体的生物电数据,并进行存储,方便用户个人基于自身的性能需求和成本需求选择适合的一种或多种数据采集设备20,以完成生物电数据的采集。

在一些可选的实施方式中,所述数据采集设备是刺激器,所述刺激器植入于生物体体内。

本申请中,所述数据存储装置10可以被配置成实现数据存储方法的步骤,下文将先对数据存储方法进行说明,再对数据存储装置10进行说明。

【方法实现方式】

参见图2,图2示出了本申请提供的一种数据存储方法的流程示意图。

本申请提供了一种数据存储方法,用于对实时采集的生物电数据进行存储,所述方法包括:

S1:获取采集开始时刻,并在所述采集开始时刻执行S2;

S2:利用数据采集设备实时采集生物体的生物电数据;

S3:当接收到所述数据采集设备发送的生物电数据时,创建一个分片文件,将采集得到的生物电数据写入本次创建的分片文件,并将本次创建的分片文件的标识信息写入目录文件;

S4:当本次创建的分片文件的数据写入时长不小于预设的分片采集时长时,将本次创建的分片文件保存并关闭;

S5:检测是否满足预设的采集结束条件;若是,则停止采集和存储数据;若否,则继续执行S2;

其中,所述预设的采集结束条件包括以下至少一种:

当前时刻到达采集结束时刻;

接收到采集结束操作。

由此,能够根据预设的分片采集时长对实时采集的数据进行分段存储,解决了大文件存储困难,需占用大量内存空间及处理时长的问题。

首先,确定采集开始时刻,在采集开始时刻实时采集生物电数据,当接收到生物电数据时创建分片文件,将采集得到的生物电数据写入该分片文件,并将该分片文件的标识信息(例如可以是文件名称、文件编号等)写入目录文件;当该分片文件的数据写入时长不小于预设的分片采集时长时,停止写入数据,并将该分片文件保存并关闭;每次保存并关闭一个分片文件后,要执行结束检测步骤,即检测是否满足预设的采集结束条件,如果满足,则停止采集、存储数据(完成数据采集存储任务),否则重复执行数据采集存储步骤,即重新执行数据采集、创建分片文件、生物电数据写入分片文件、文件标识信息写入目录文件、分片文件保存并关闭以及结束检测的步骤,以此类推,重复多次,从而针对实时采集、且采集时长较长的生物电数据进行采集、存储。

采用上述方式,针对长时间的实时数据采集、存储过程,将原本可能生成的大文件化整为零(即不会在上述数据采集存储过程中产生大文件),具体而言,按照采集时间的先后区别,先后创建多个分片文件,每个分片文件用于存储一定时长(即预设的分片采集时长)内采集得到的生物电数据,各个分片文件被先后创建并先后保存,并且在整个数据采集存储过程中,同一时间只有一个分片文件占用内存空间(当前分片文件保存并关闭后才可能创建下一个分片文件,是否创建新的分片文件要看是否结束采集的检测结果),由于单个分片文件的文件大小相对较小,因此存储简单,不会占用太多内存空间,处理时长也较短。

本申请对生物体不作限定,其例如可以是人体、动物体等。本申请对生物体是否健康不作限定,其例如可以是健康生物体、亚健康生物体或者患有疾病的生物体。

本申请中,生物电数据例如可以包括脑电数据、心电数据、肌电数据和眼电数据中的一种或多种。相应的,所使用的数据采集设备例如可以包括脑电采集单元、心电采集单元、肌电采集单元和眼电采集单元中的一种或多种。这些采集单元可以设置于生物体的体内或体外,通过电极片或电极触点等形式执行数据采集任务。

作为一种示例,采集开始时刻可以是2022年6月10日上午8:00,采集结束时刻可以是2022年6月11日上午8:00,采集时长为24小时。

本申请对分片文件的标识信息不作限定,其例如可以采用中文、字母、数字、符号中的一种或多种来表示。例如可以采用“第一分片文件”、“分片文件A”“A01#”等方式标识分片文件。

本申请对目录文件的存储位置不作限定,其例如可以存储于云端(或者说云服务器),方便用户在线访问。或者,目录文件也可以存储于本地或者指定的存储位置。

在将生物电数据写入分片文件的过程中,可以采用消息队列的方式,将生物电数据写入消息队列,当消息队列中的数据达到预设长度时,批量上传至分片文件,这样可以减少对分片文件的直接访问次数,降低分片文件损坏的概率。其中,消息队列可以设置于内存(此时的消息队列例如是redis消息队列),也可以设置于单独设立的消息队列服务器或者分布式服务器(此时的消息队列例如是KafKa消息队列)。

本申请对预设的分片采集时长不作限定,其例如可以是1分钟、3分钟、5分钟、10分钟、15分钟、30分钟、1小时、2小时、3小时等。

分片文件完成保存并关闭后,可以被读取。读取文件时,可以根据目录文件依次读取各个分片文件。

至于分片文件能否被移动、复制或者编辑,则可以由人工设定。例如,可以将分片文件设置为只读格式。当然,也可以根据实际应用中的需求,将分片文件设置为可编辑格式。如有需要,多个分片文件可以被合并为一个大文件。

当人工选择结束采集时,数据采集人员可以通过交互设备进行操作,例如是点击“结束采集”按钮的操作、按压“结束采集”按键的操作等。

数据采集人员还可以采用预设长度的滑窗进行滑动,以智能化地确定采集开始时刻和采集结束时刻。

本申请对交互设备不作限定,其例如可以是手机、平板电脑、笔记本电脑、台式计算机、智能穿戴设备等智能终端设备,或者,交互设备可以是工作站或者控制台。

本申请对利用交互设备接收各种(人工)操作的方式不作限定。按照输入方式划分操作,例如可以包括文本输入操作、音频输入操作、视频输入操作、按键操作、鼠标操作、键盘操作、智能触控笔操作等。这些操作例如可以包括上述采集结束操作以及下文中的采集开始操作、数值输入操作等。

在一些可选的实施方式中,所述采集开始时刻的获取过程可以包括:

利用交互设备接收第一数值输入操作,响应于所述第一数值输入操作,将用户输入的第一时刻作为所述采集开始时刻。

在一些可选的实施方式中,所述采集结束时刻的获取过程可以包括:

利用交互设备接收第二数值输入操作,响应于所述第二数值输入操作,将用户输入的第二时刻作为所述采集结束时刻。

在另一些可选的实施方式中,所述采集开始时刻的获取过程可以包括:

利用交互设备接收采集开始操作,响应于所述采集开始操作,将接收到所述采集开始操作的时刻作为所述采集开始时刻。

在另一些可选的实施方式中,所述采集结束时刻的获取过程可以包括:

基于所述采集开始时刻和所述生物体对应的采集时长,确定所述采集结束时刻。

在一些可选的实施方式中,所述采集开始时刻和所述采集结束时刻的获取过程可以包括:

利用交互设备接收采集开始操作,响应于所述采集开始操作,将接收到所述采集开始操作的时刻作为所述采集开始时刻;

基于所述采集开始时刻和所述生物体对应的采集时长,确定所述采集结束时刻。

由此,数据采集人员可以利用交互设备控制数据采集存储过程,具体而言,数据采集人员可以在交互设备上进行采集开始操作(例如是点击“开始采集”按钮的操作或者是按压“开始采集”按键的操作等),从而将此时对应的当前时刻确定作为采集开始时刻。

这种设定方式符合用户的使用习惯,操作简单,容易实现,适用于数据采集过程这种可能没有固定开始时刻的场合。

在确定采集开始时刻后,基于该生物体对应的采集时长,能够确定与采集开始时刻相应的采集结束时刻。

这样做的好处是,针对不同的生物体可以设置相同或不同的采集时长,并自动确定对应的采集结束时刻,免去了人工设定采集结束时刻的步骤,减少了数据采集人员的工作量。

在一个具体应用场景中,采集开始时刻是2022年6月10日上午8:00,当前所采集的生物体对应的采集时长是24小时,则采集结束时刻是2022年6月11日上午8:00。

在一些可选的实施方式中,所述生物体对应的采集时长的获取过程可以包括:

获取所述生物体的分类信息,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

将所述生物体的分类信息输入预设多项式,以得到所述生物体对应的采集时长。

其中,预设多项式可以是一次或多次多项式。

在另一些可选的实施方式中,所述生物体对应的采集时长的获取过程可以包括:

建立分类信息和采集时长的对应关系,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

获取所述生物体的分类信息;

基于所述生物体的分类信息和所述对应关系,获取所述生物体对应的采集时长。

例如,可以利用《分类信息-采集时长对照表》来存储所述对应关系。

在又一些可选的实施方式中,所述生物体对应的采集时长的获取过程可以包括:

获取所述生物体的分类信息,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

将所述生物体的分类信息输入采集时长模型,以得到所述生物体对应的采集时长。

由此,首先获取生物体的分类信息,再基于分类信息得到该生物体对应的采集时长(该采集时长大于分片采集时长)。

生物体的种类、年龄、性别、身高、体重不同,所对应的生长发育情况、饮食习惯、睡眠习惯、活动强度等往往不同,所能接受的采集时长的上限不同,为了监测其生理参数所需要的采集周期也不同,针对不同的生物体设置不同的采集时长,考虑该类型人群或者每个不同个体的生物特性来选择合适的采集时长,例如可以为体重较轻、好动的儿童设定相对较短的采集时长(例如是6小时),为长期卧床的老人设定相对较长的采集时长(例如是48小时),为正常体重的女性设定中间的采集时长(例如是24小时),为肥胖的男性设定相对较长的采集时长(例如是30小时)。

这样,可以针对不同的生物体获取不同采集时长的生物电数据,既能够满足生物电监测的需求,又避免使用统一的采集时长时,部分人群(例如是多动症儿童、精神类疾病患者)无法完成足够时长的数据采集或者完成较为困难的情况。

另外,采集时长模型可以由大量的训练数据训练得到,能够针对不同的输入数据(即生物体的分类信息)预测得到相应的输出数据(即生物体对应的采集时长),适用范围广,智能化水平高。

生物体的分类信息可以包括种类,不同生物体的种类例如可以是人体、猴子、猩猩、狒狒、狗、猫、兔子、狐狸、鸭子、老虎、狮子、蛇等。

在一个具体应用场景中,生物体A的分类信息包括25岁(年龄)、女性(性别)、160cm(身高)、50kg(体重),生物体B的分类信息包括66岁、男性、178cm、80kg,生物体C的分类信息包括8岁、女性、130cm、25kg,生物体D的分类信息包括6岁、雄性、56cm、6kg。其中,生物体A、B、C的种类都是人体,生物体D的种类是猴子。

作为一个示例,生物体A、B、C、D对应的采集时长可以是18小时、48小时、6小时、2小时。

在一些可选的实施方式中,所述采集时长模型的训练过程可以包括:

获取训练集,所述训练集包括多个训练数据,每个所述训练数据包括一个样本生物体的分类信息以及所述样本生物体对应的采集时长的标注数据;

针对所述训练集中的每个训练数据,执行以下处理:

将所述训练数据中的样本生物体的分类信息输入预设的深度学习模型,以得到所述样本生物体对应的采集时长的预测数据;

基于所述样本生物体对应的采集时长的预测数据和标注数据,对所述深度学习模型的模型参数进行更新;

检测是否满足预设的训练结束条件;如果是,则将训练出的所述深度学习模型作为所述采集时长模型;如果否,则利用下一个所述训练数据继续训练所述深度学习模型。

由此,通过设计,建立适量的神经元计算节点和多层运算层次结构,选择合适的输入层和输出层,就可以得到预设的深度学习模型,通过该预设的深度学习模型的学习和调优,建立起从输入到输出的函数关系,虽然不能100%找到输入与输出的函数关系,但是可以尽可能地逼近现实的关联关系,由此训练得到的采集时长模型,可以基于生物体的分类信息获取生物体对应的采集时长,且计算结果准确性高、可靠性高。

在一些可选的实施方式中,本申请可以采用上述训练过程训练得到采集时长模型,在另一些可选的实施方式中,本申请可以采用预先训练好的采集时长模型。

在一些可选的实施方式中,例如可以对历史数据进行数据挖掘,以获取样本生物体的分类信息及其对应的采集时长。也就是说,这些样本生物体可以是真实的生物体。当然,样本生物体的分类信息也可以是利用GAN模型的生成网络自动生成的。

其中,GAN模型即生成对抗网络(Generative Adversarial Network),由一个生成网络与一个判别网络组成。生成网络从潜在空间(latent space)中随机采样作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的是使判别网络无法判断生成网络的输出结果是否真实。使用GAN模型可以生成多个样本生物体的分类信息,用于采集时长模型的训练过程,能有效降低原始数据采集的数据量,大大降低数据采集和标注的成本。

本申请对标注数据的获取方式不作限定,例如可以采用人工标注的方式,也可以采用自动标注或者半自动标注的方式。当样本生物体是真实生物体时,可以通过关键词提取的方式从历史数据中获取真实生物体对应的采集时长。

本申请对采集时长模型的训练过程不作限定,其例如可以采用上述监督学习的训练方式,或者可以采用半监督学习的训练方式,或者可以采用无监督学习的训练方式。

本申请对预设的训练结束条件不作限定,其例如可以是训练次数达到预设次数(预设次数例如是1次、3次、10次、100次、1000次、10000次等),或者可以是训练集中的训练数据都完成一次或多次训练,或者可以是本次训练得到的总损失值不大于预设损失值。

在一些可选的实施方式中,所述创建一个分片文件,可以包括:

在预设的数据存储位置创建一个分片文件。

由此,多个分片文件可以存储于同一个预设的数据存储位置,在后续数据读取过程中,不需要频繁访问多个数据存储位置就能够获得整个数据采集存储过程对应的全部生物电数据。

在另一些可选的实施方式中,所述创建一个分片文件,可以包括:

利用分布存储技术,选择一个云服务器作为数据存储位置,在所述云服务器上创建一个分片文件。

由此,多个分片文件可以存储于不同的数据存储位置(不同的云服务器),便于在线获取分片文件中的数据。

在一些可选的实施方式中,所述S3,还可以包括:

将本次创建的分片文件在所述目录文件中的编号写入目录文件。

由此,虽然分片文件的创建及保存存在先后顺序关系,但是需要将目录文件对应的多个分片文件按照创建时间排序等方式才能明确,而采用编号来指示分片文件的创建及保存的先后顺序,简单便捷,可操作性强。

另外,目录文件中包含分片文件的标识信息和编号,指向性更强、可读性更强,便于人员理解和操作。

在一些可选的实施方式中,所述数据写入时长的获取过程可以包括:

利用计时器对生物电数据写入本次创建的分片文件的过程进行计时,以得到所述数据写入时长。

由此,使用计时器来对生物电数据写入本次创建的分片文件的过程(即本次数据写入过程)进行计时,方便快捷。

另外,计时器还可以具备定时触发功能,每次计时到达分片采集时长时触发保存和关闭分片文件的操作,并对计时器进行复位,用于对下一次的数据写入过程进行计时。

在一些可选的实施方式中,所述数据写入时长的获取过程可以包括:

计算实时的当前时刻与所述采集开始时刻的差值,得到所述数据写入时长。

在一些可选的实施方式中,所述方法应用于数据存储装置,所述方法还包括:

将预设的分片采集时长作为定时器的预设时间间隔;

检测本次创建的分片文件的数据写入时长是否不小于预设的分片采集时长的过程包括:

当接收到所述数据采集设备发送的生物电数据时,控制所述定时器开始工作,以使所述定时器经过所述预设时间间隔后向所述数据存储装置发送提示信息,并使所述定时器复位,所述提示信息用于指示本次创建的分片文件的数据写入时长不小于预设的分片采集时长。

参见图3至图5,图3示出了本申请提供的另一种数据存储方法的流程示意图,图4示出了现有技术提供的一种数据存储示意图,图5示出了本申请提供的一种数据存储示意图。

在一个具体应用场景中,本申请还提供了一种数据存储方法,所述数据存储方法包括:

R1:设置一个按时长(即预设的分片采集时长)触发的定时器;

R2:创建一个目录文件,用于记录分片文件;

R3:开始接收数据采集设备发送的生物电数据时,启动定时器;

R4:新建文件(文件A),将接收到的生物电数据写入文件(文件A);

R5:将文件名称(文件A)以及文件编号(序号1)记入目录文件(文件A,序号1);

R6:设置的时长到达后,接收到定时器消息;

R7:将文件A保存并关闭;

R8:再次开始接收生物电数据时,重新启动定时器(定时时长不变);

R9:新建文件(文件B),将接收到的生物电数据写入文件(文件B);

R10:将文件名称(文件B)以及文件编号(序号2)记入目录文件(文件B,序号2);

R11:设置的时长到达后,接收到定时器消息;

R12:将文件B保存并关闭;

R13:如此重复执行,产生很多分片文件(分片文件A、B、C……)及一个目录文件;

R14:读取文件时,根据目录文件依次读取各个分片文件。

【装置实现方式】

本申请还提供了一种数据存储装置,其具体实现方式与上述方法实现方式中记载的实现方式、所达到的技术效果一致,部分内容不再赘述。

本申请还提供了一种数据存储装置,用于对实时采集的生物电数据进行存储,所述装置包括处理器,所述处理器被配置成执行以下步骤:

S1:获取采集开始时刻,并在所述采集开始时刻执行S2;

S2:利用数据采集设备实时采集生物体的生物电数据;

S3:当接收到所述数据采集设备发送的生物电数据时,创建一个分片文件,将采集得到的生物电数据写入本次创建的分片文件,并将本次创建的分片文件的标识信息写入目录文件;

S4:当本次创建的分片文件的数据写入时长不小于预设的分片采集时长时,将本次创建的分片文件保存并关闭;

S5:检测是否满足预设的采集结束条件;若是,则停止采集和存储数据;若否,则继续执行S2;

其中,所述预设的采集结束条件包括以下至少一种:

当前时刻到达采集结束时刻;

接收到采集结束操作。

在一些可选的实施方式中,所述处理器可以被进一步配置成采用以下方式获取所述采集开始时刻和所述采集结束时刻:

利用交互设备接收采集开始操作,响应于所述采集开始操作,将接收到所述采集开始操作的时刻作为所述采集开始时刻;

基于所述采集开始时刻和所述生物体对应的采集时长,确定所述采集结束时刻。

在一些可选的实施方式中,所述处理器还可以被配置成采用以下方式获取所述生物体对应的采集时长:

获取所述生物体的分类信息,所述分类信息包括种类、年龄、性别、身高和体重中的一种或多种;

将所述生物体的分类信息输入采集时长模型,以得到所述生物体对应的采集时长。

在一些可选的实施方式中,所述采集时长模型的训练过程可以包括:

获取训练集,所述训练集包括多个训练数据,每个所述训练数据包括一个样本生物体的分类信息以及所述样本生物体对应的采集时长的标注数据;

针对所述训练集中的每个训练数据,执行以下处理:

将所述训练数据中的样本生物体的分类信息输入预设的深度学习模型,以得到所述样本生物体对应的采集时长的预测数据;

基于所述样本生物体对应的采集时长的预测数据和标注数据,对所述深度学习模型的模型参数进行更新;

检测是否满足预设的训练结束条件;如果是,则将训练出的所述深度学习模型作为所述采集时长模型;如果否,则利用下一个所述训练数据继续训练所述深度学习模型。

在一些可选的实施方式中,所述处理器可以被进一步配置成采用以下方式创建一个分片文件:

在预设的数据存储位置创建一个分片文件。

在一些可选的实施方式中,在执行S3时,所述处理器还可以被配置成:

将本次创建的分片文件在所述目录文件中的编号写入目录文件。

在一些可选的实施方式中,所述处理器可以被进一步配置成采用以下方式获取所述数据写入时长:

利用计时器对生物电数据写入本次创建的分片文件的过程进行计时,以得到所述数据写入时长。

参见图6,图6示出了本申请提供的一种数据存储装置200的结构框图。

数据存储装置200例如可以包括至少一个存储器210、至少一个处理器220以及连接不同平台系统的总线230。

存储器210可以包括易失性存储器形式的可读介质,例如随机存取存储器(RAM)211和/或高速缓存存储器212,还可以进一步包括只读存储器(ROM)213。

其中,存储器210还存储有计算机程序,计算机程序可以被处理器220执行,使得处理器220实现上述任一项数据存储方法的功能,其具体实现方式与上述方法实现方式中记载的实现方式、所达到的技术效果一致,部分内容不再赘述。

存储器210还可以包括具有至少一个程序模块215的实用工具214,这样的程序模块215包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例的每一个或某种组合中可能包括网络环境的实现。

相应的,处理器220可以执行上述计算机程序,以及可以执行实用工具214。

处理器220可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,ProgrammableLogic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。

总线230可以为表示几类总线结构的一种或多种,包括存储器总线或者存储器控制器、外围总线、图形加速端口、处理器或者使用多种总线结构的任意总线结构的局域总线。

数据存储装置200也可以与一个或多个外部设备240例如键盘、指向设备、蓝牙设备等通信,还可与一个或者多个能够与该数据存储装置200交互的设备通信,和/或与使得该数据存储装置200能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等)通信。这种通信可以通过输入输出接口250进行。并且,数据存储装置200还可以通过网络适配器260与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器260可以通过总线230与数据存储装置200的其它模块通信。应当明白,尽管图中未示出,可以结合数据存储装置200使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储平台等。

【介质实现方式】

本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项装置的功能或者实现上述任一项方法的步骤,其具体实现方式与上述方法实现方式中记载的实现方式、所达到的技术效果一致,部分内容不再赘述。

参见图7,图7示出了本申请提供的一种程序产品的结构示意图。

程序产品可以采用便携式紧凑盘只读存储器(CD-ROM)并包括程序代码,并可以在终端设备,例如个人电脑上运行。然而,本发明的程序产品不限于此,在本申请中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等,或者上述的任意合适的组合。可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言诸如Java、C++等,还包括常规的过程式程序设计语言诸如C语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。

本申请从使用目的上,效能上,进步及新颖性等观点进行阐述,已符合专利法所强调的功能增进及使用要件,本申请以上的说明书及说明书附图,仅为本申请的较佳实施例而已,并非以此局限本申请,因此,凡一切与本申请构造,装置,特征等近似、雷同的,即凡依本申请专利申请范围所作的等同替换或修饰等,皆应属本申请的专利申请保护的范围之内。

相关技术
  • 将数据存储到至少一个数据存储器和从至少一个数据存储器检索数据的方法、系统、使用方法、计算机程序和计算机可读介质
  • 分布式块存储系统中数据存储方法、装置及计算机可读存储介质
技术分类

06120114731304