掌桥专利:专业的专利平台
掌桥专利
首页

一种档案数据存储方法、系统及存储介质

文献发布时间:2024-04-18 19:58:21


一种档案数据存储方法、系统及存储介质

技术领域

本申请涉及档案管理技术领域,尤其是涉及一种档案数据存储方法、系统及存储介质。

背景技术

档案信息化,是指立档单位在其职能活动中形成的、办理完毕、应作为文书档案保存的各种纸质文件材料,或者其它材质文件材料,遵循文件的形成规律,保持文件之间的有机联系,区分不同价值,形成数字化档案,便于保管和利用。

为了达成档案信息化、数字化,通常情况下采用人工对纸质档案进行数字化扫描加工,为了保障电子档案清晰度,在档案数字化扫描时采用的图片分辨率极高,导致一份完整的档案体积较大,一般都在300M大小左右。还有一种方式是通过系统在线接口获取档案数据,依据档案要求通过在线获取电子过程文件时候需要对整个多份文件进行合并存储,而且为了保证数据的安全性和可靠性,通常还需要使用多个存储设备进行数据备份,这样就导致存储和读取数据的速度较慢、存储设备容量有限,且随着数据量的增加,存储成本逐渐增加、多个存储设备之间的数据备份和同步操作复杂,容易出现数据丢失或损坏的情况,并且在数据备份和恢复过程中需要消耗大量的时间和人力资源。

因此,为了解决上述问题,提供一种能够在不影响档案数据存储的前提下减少档案体积的档案数据存储分析方法、系统及存储介质,是本领域技术人员亟待解决的问题。

发明内容

为了达到在不影响档案数据存储的前提下减少档案体积的效果,本申请提供了一种档案数据存储方法、系统及存储介质。

第一方面,本申请提供了一种档案数据存储方法,包括以下步骤:

根据待归档档案的原始类型所对应的获取方式,获取所述待归档档案的电子文件;

按照预设处理规则处理所述电子文件,并生成对应的电子目录参数;

将处理后的所述电子文件与所述电子目录参数相关联,形成电子档案;

根据所述电子档案的文件类型所对应的压缩算法压缩所述电子档案,形成存储数据包;

整合所述存储数据包及对应的所述电子目录参数,形成归档数据包;

获取与所述电子目录参数对应的预设存储参数;

根据所述预设存储参数和所述电子目录参数存储所述归档数据包,形成档案数据。

可选的,所述根据所述预设存储参数和所述电子目录存储所述归档数据包,形成档案数据,包括:

解析所述预设存储参数,获取对应的存储地址和存储要求;

判断所述存储地址是否有所述电子目录参数相应的电子目录;

若没有相应的所述电子目录,则根据所述电子目录参数创建所述电子目录作为存储目录;

若有相应的所述电子目录,则选择符合预设目录要求的所述电子目录作为所述存储目录;

根据所述存储要求处理所述归档数据包;

将处理后的所述归档数据包按照所述存储目录存储在所述存储地址,形成档案数据。

可选的,所述若有相应的所述电子目录,则选择符合预设目录要求的所述电子目录作为所述存储目录包括:

若有相应的所述电子目录,则获取各个所述电子目录的目录属性;

解析所述预设目录要求,获取评价属性和属性要求;

剔除所述目录属性不匹配所述评价属性的所述电子目录,形成待选电子目录;

从所述待选电子目录中选择所述目录属性符合所述属性要求且符合度最高的所述电子目录作为所述存储目录。

可选的,在所述根据所述预设存储参数和所述电子目录参数存储所述归档数据包,形成档案数据之后,还包括:

若接收到档案利用指令,则获取所述档案利用指令对应的所述电子目录;

获取所述电子目录对应的所述预设存储参数;

根据所述预设存储参数中的存储地址定位所述电子目录对应的所述归档数据包;

根据所述档案利用指令中的访问参数读取并展示所述归档数据包。

可选的,所述根据所述预设存储参数中的存储地址定位所述电子目录对应的所述归档数据包,包括:

获取所述预设存储参数中的存储地址;

判断所述存储地址是否有所述电子目录对应的所述归档数据包;

若没有所述归档数据包,则判断所述存储地址在地址变更日志中是否有对应的改变地址;

若有对应的所述改变地址,则根据所述改变地址更新所述存储地址;

若没有对应的所述改变地址,则获取备份存储参数中的备份地址更新所述存储地址;

根据更新后的所述存储地址返回重新判断是否有对应的所述归档数据包;

若有所述归档数据包,则定位所述电子目录对应的所述归档数据包。

可选的,所述按照预设处理规则处理所述电子文件,并生成对应的电子目录参数,包括:

根据所述待归档档案的档案类型,获取对应的预设处理规则;

解析所述预设处理规则,获取其中的分类规则、排序规则及组合规则;

根据所述分类规则对所述电子文件进行分类,形成分类电子文件;

根据所述排序规则对所述分类电子文件进行排序,形成排序电子文件;

根据所述组合规则对所述排序电子文件进行组合,形成处理后的所述电子文件;

根据所述分类规则、所述排序规则及所述组合规则生成与处理后的所述电子文件相对应的电子目录参数。

可选的,所述根据所述电子档案的文件类型所对应的压缩算法压缩所述电子档案,形成存储数据包,包括:

判断所述电子档案的文件类型是否属于已知文件类型;

若属于所述已知文件类型,则根据对应的所述已知文件类型所对应的所述压缩算法压缩所述电子档案,形成存储数据包;

若属于未知文件类型,则判断历史存储记录中是否有相应的所述文件类型;

若有相应的所述文件类型,则根据所述历史存储记录获取对应的所述压缩算法作为指定压缩算法;

若没有相应的所述文件类型,则判断所述未知文件类型与各个所述已知文件类型的类型相似度;

选择超过预设相似阈值且数值最大的所述类型相似度所对应的所述已知文件类型,作为所述电子档案的确定文件类型;

获取与所述确定文件类型对应的所述压缩算法作为所述指定压缩算法;

根据所述指定压缩算法压缩所述电子档案,形成存储数据包。

可选的,在所述根据所述指定压缩算法压缩所述电子档案,形成存储数据包之后,还包括:

获取存储数据包相较于所述电子档案的压缩程度;

若所述压缩程度大于或等于预设压缩阈值,则将所述指定压缩算法作为所述未知文件类型所对应的所述压缩算法;

若所述压缩程度小于所述预设压缩阈值,则记录所述未知文件类型并发送反馈要求;

根据与所述反馈要求对应的反馈指令处理所述电子档案。

第二方面,本申请还提供了一种档案数据存储系统,包括:

第一获取模块,用于根据待归档档案的原始类型所对应的获取方式,获取所述待归档档案的电子文件;

第一处理模块,用于按照预设处理规则处理所述电子文件,并生成对应的电子目录参数;

第一关联模块,用于将处理后的所述电子文件与所述电子目录参数相关联,形成电子档案;

第一压缩模块,用于根据所述电子档案的文件类型所对应的压缩算法压缩所述电子档案,形成存储数据包;

第一整合模块,用于整合所述存储数据包及对应的所述电子目录参数,形成归档数据包;

第二获取模块,用于获取与所述电子目录参数对应的预设存储参数;

第一存储模块,用于根据所述预设存储参数和所述电子目录参数存储所述归档数据包,形成档案数据。

第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述任意一项所述的档案数据存储方法。

综上所述,本申请提供的档案数据存储方法、系统及存储介质,通过按照预设处理规则处理电子文件并与对应的电子目录参数相关联,形成电子档案,进而根据文件类型所对应的压缩算法压缩电子档案,形成存储数据包,将其与对应的电子目录参数一起整合形成归档数据包,结合与电子目录参数对应的预设存储参数进行存储,形成档案数据。从而使得电子档案在被压缩前已经关联电子目录参数,压缩后只需根据电子目录参数和对应的预设存储参数,即可直接进行存储,达到在不影响档案数据存储的前提下减少档案体积的效果。

附图说明

图1是本申请实施例的档案数据存储方法的步骤S101至步骤S107的流程示意图;

图2是本申请实施例的档案数据存储方法的步骤S201至步骤S206的流程示意图;

图3是本申请实施例的档案数据存储方法的步骤S301至步骤S304的流程示意图;

图4是本申请实施例的档案数据存储方法的步骤S401至步骤S404的流程示意图;

图5是本申请实施例的档案数据存储方法的步骤S501至步骤S507的流程示意图;

图6是本申请实施例的档案数据存储方法的步骤S601至步骤S606的流程示意图;

图7是本申请实施例的档案数据存储方法的步骤S701至步骤S708的流程示意图;

图8是本申请实施例的档案数据存储方法的步骤S801至步骤S804的流程示意图;

图9是本申请实施例的档案数据存储系统的其中一种实施方式的模块示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。

第一方面,本申请提供的一种档案数据存储方法,如图1所示,包括以下步骤:

S101.根据待归档档案的原始类型所对应的获取方式,获取待归档档案的电子文件;

S102.按照预设处理规则处理电子文件,并生成对应的电子目录参数;

S103.将处理后的电子文件与电子目录参数相关联,形成电子档案;

S104.根据电子档案的文件类型所对应的压缩算法压缩电子档案,形成存储数据包;

S105.整合存储数据包及对应的电子目录参数,形成归档数据包;

S106.获取与电子目录参数对应的预设存储参数;

S107.根据预设存储参数和电子目录参数存储归档数据包,形成档案数据。

步骤S101中的原始类型是指待归档档案在形成电子文件之前其本身的保管类型,在本实施例中包括纸质类型和电子类型,而获取方式是指将待归档档案根据不同原始类型转换成电子文件的具体方式。如果是纸质类型,则通过现代数字化加工技术转化成为电子文件,例如扫描、图像获取等方式;如果是电子类型,则通过webservice接口或者中间库的方式实现在线接收档案电子文件。

电子文件由于是根据待归档档案所直接形成,其还需要通过处理形成具有一定顺序且根据不同分类组合形成具备电子目录的电子档案,因此需要执行步骤S102即按照预设处理规则处理电子文件,并生成对应的电子目录参数,并执行步骤S103即将处理后的电子文件与电子目录参数相关联,形成电子档案。其中,预设处理规则是预先设置且针对电子文件的处理规则,包括分类所采用的类别、排序所依据的次序及组合所基于的条件等规则,而电子目录参数则是根据类别、次序及条件形成电子目录的对应参数,主要有题名、全宗、门类、保管期限、年度、归档部门等。

电子档案由于是直接从待归档档案的原始档案获取,其体积或者占用空间大小依然没有改变,因此需要执行步骤S104即根据电子档案的文件类型所对应的压缩算法压缩电子档案,形成存储数据包。其中,压缩算法采用无损压缩算法,例如针对图像类型文件的图像压缩算法(如JPEG、PNG)、针对音频类型文件的音频压缩算法(如MP3、WAV)和针对文本类型文件的文本压缩算法(如gzip、deflate),或者针对所有文件类型的基于杰林码的无损压缩算法。

压缩后形成的存储数据包,通过压缩后体积减小从而减少了占用空间,但还需将其根据电子目录参数存储进存储空间中,因此先执行步骤S105即整合存储数据包及对应的电子目录参数,形成归档数据包,然后执行步骤S106即获取与电子目录参数对应的预设存储参数。其中,预设存储参数是指电子目录参数在存储空间中对应的存储参数,即不同的电子目录参数对应存储在存储空间中的具体位置、占用空间、目录划分等。

获取到预设存储参数后,则执行步骤S107即根据预设存储参数和电子目录参数存储归档数据包,形成档案数据,从而通过预设存储参数结合电子目录参数引导归档数据包在存储空间完成存储。

本实施例提供的档案数据存储方法,通过按照预设处理规则处理电子文件并与对应的电子目录参数相关联,形成电子档案,进而根据文件类型所对应的压缩算法压缩电子档案,形成存储数据包,将其与对应的电子目录参数一起整合形成归档数据包,结合与电子目录参数对应的预设存储参数进行存储,形成档案数据。从而使得电子档案在被压缩前已经关联电子目录参数,压缩后只需根据电子目录参数和对应的预设存储参数,即可直接进行存储,达到在不影响档案数据存储的前提下减少档案体积的效果。

在本实施例的其中一种实施方式中,如图2所示,步骤S107即根据预设存储参数和电子目录存储归档数据包,形成档案数据,包括:

S201.解析预设存储参数,获取对应的存储地址和存储要求;

S202.判断存储地址是否有电子目录参数相应的电子目录;

S203.若没有相应的电子目录,则根据电子目录参数创建电子目录作为存储目录;

S204.若有相应的电子目录,则选择符合预设目录要求的电子目录作为存储目录;

S205.根据存储要求处理归档数据包;

S206.将处理后的归档数据包按照存储目录存储在存储地址,形成档案数据。

步骤S201中的存储地址是指对应的电子目录参数在存储空间中所对应的存储地址,其确定相应的归档数据包的存储位置,存储要求是指对应的电子目录参数在存储空间中所对应的存储要求,其确定相应的归档数据包的存储空间及目录划分等要求。

归档数据包需要存储在存储空间以及其存储后被调用或读取,均需要有对应的存储地址,而电子目录参数中则包含了对应的归档数据包所形成的不含具体地址的电子目录,为了便于理解,以服务器简单路径存储为例进行解释,例如存储地址为server1DA集团公司,则电子目录参数为A集团公司市分公司2020年销售记录,而在实际运用中,需要判断在存储地址上是否已经有相应的电子目录,因此需要执行步骤S202即判断存储地址是否有电子目录参数相应的电子目录。

若没有相应的电子目录,说明此前还未有相关或类似的归档数据包导致生成相应的电子目录,则执行S203中的根据电子目录参数创建电子目录作为存储目录,即直接在存储地址直接根据电子目录参数新建对应的电子目录,作为当前归档数据包的存储目录。如前述举例,新建的电子目录为相应的电子目录参数所对应的A集团公司市分公司2020年销售记录,结合为server1DA集团公司的存储地址,形成的存储目录为server1DA集团公司市分公司2020年销售记录。

若有相应的电子目录,说明此前还未有相关或类似的归档数据包导致生成相应的电子目录,则执行步骤S204中的选择符合预设目录要求的电子目录作为存储目录,即判断已经存在的电子目录是否符合此归档数据包对应的预设目录要求,并选择符合预设目录要求的电子目录作为存储目录。其中,预设目录要求是预先设置根据电子目录参数所生产的目录要求,当然,其中也可以包括对于数量要求,在本实施例中,数量要求为只选择一个符合目录要求的电子目录。

在前述步骤获取到存储目录后,还需要执行步骤S205即根据存储要求处理归档数据包,例如根据存储空间指定归档数据包的存储起始位置,根据目录划分处理归档数据包中数据的具体划分以便归入对应目录等,从而使得后续可以直接按照存储目录将归档数据包进行存储,即执行步骤S206中的将处理后的归档数据包按照存储目录存储在存储地址,形成档案数据。

本实施方式提供的档案数据存储方法,通过判断预设存储参数对应的存储地址是否有电子目录参数相应的电子目录,根据判断结果选择根据电子目录参数创建电子目录作为存储目录,或者选择符合预设目录要求的电子目录作为存储目录,并存储要求处理归档数据包后按照存储目录存储在存储地址,形成档案数据。从而使得无论存储地址是否有电子目录以及有多个电子目录,归档数据包均可以在满足存储要求的前提下,按照存储目录存储在存储地址,提高档案数据存储方法的适用性。

在本实施例的其中一种实施方式中,如图3所示,步骤S204即若有相应的电子目录,则选择符合预设目录要求的电子目录作为存储目录包括:

S301.若有相应的电子目录,则获取各个电子目录的目录属性;

S302.解析预设目录要求,获取评价属性和属性要求;

S303.剔除目录属性不匹配评价属性的电子目录,形成待选电子目录;

S304.从待选电子目录中选择目录属性符合属性要求且符合度最高的电子目录作为存储目录。

在实际运用中,若出现多个电子目录,则会根据预设目录要求进行具体的选择,但预设目录要求是针对电子目录的目录属性所进行判定,因此先执行步骤S301即若有相应的电子目录,则获取各个电子目录的目录属性。其中,目录属性是指电子目录的目录层级、目录名称、层名称长度等属性。

获取到目录属性后,则需要执行步骤S302即解析预设目录要求,获取评价属性和属性要求,在本实施例中,评价属性为目录层级、目录名称、层名称长度,而属性要求则为评价属性的具体要求,例如目录层级大于三,目录名称具体到市一级且为中文,层名称长度小于10字节等。

在步骤S303中剔除目录属性不匹配评价属性的电子目录,形成待选电子目录,例如将没有将目录进行层次划分,或者目录不具备名称,或者层名称无法识别造成长度未知等均属于不匹配评价属性,并且上述匹配与否的判断无需解析到具体的数值或内容,例如目录层级具体多少层,或者目录名称的具体程度或具体语种,或者层名称长度的具体长度,因此首先判断评论属性而不是直接判断属性要求,能够提高匹配判断的效率。

前述所形成的待选电子目录,属于目录属性匹配评价属性的电子目录,但还需要从其中选择符合属性要求的唯一的一个电子目录,因此执行步骤S304即从待选电子目录中选择目录属性符合属性要求且符合度最高的电子目录作为存储目录,即先选择待选电子目录中符合属性要求的电子目录,然后计算这些电子目录的符合度,选择符合度最高的作为存储目录。

在本实施例中,符合度为根据各个属性要求的最基本要求为准进行计算,例如属性要求为目录层级大于三,电子目录A的目录属性中的目录层级为四,电子目录B的目录属性中的目录层级为五,则在目录属性这个属性要求上,电子目录A的符合度高于电子目录B。另外,若符合度最高的数值对应了多个电子目录,则选择这些电子目录中创建时间最近的电子目录作为存储目录。

本实施方式提供的档案数据存储方法,通过首先剔除目录属性不匹配评价属性的电子目录,然后选择目录属性符合属性要求且符合度最高的电子目录作为存储目录,从而在能够获得符合预设目录要求的唯一的一个电子目录作为存储目录的前提下,提高了匹配判断的效率,且由于确定为符合度最高的电子目录,保障了档案数据存储方法的稳定性。

在本实施例的其中一种实施方式中,如图4所示,在步骤S107即根据预设存储参数和电子目录参数存储归档数据包,形成档案数据之后,还包括:

S401.若接收到档案利用指令,则获取档案利用指令对应的电子目录;

S402.获取电子目录对应的预设存储参数;

S403.根据预设存储参数中的存储地址定位电子目录对应的归档数据包;

S404.根据档案利用指令中的访问参数读取并展示归档数据包。

步骤S401中的档案利用指令,是指操作人员通过点击某一门类下的某条电子目录下的档案利用标识,所发起的对档案进行读取并利用的指令。在实际运用中,会间隔预设周期判断是否接收到档案利用指令,若接收到则执行步骤S401中的获取档案利用指令对应的电子目录。

确认档案利用指令对应的电子目录后,则执行步骤S402即获取电子目录对应的预设存储参数,进而执行步骤S403即根据预设存储参数中的存储地址定位电子目录对应的归档数据包,从而可以直接定位到档案利用指令所需要的归档数据包。

定位归档数据包后,执行步骤S404即根据档案利用指令中的访问参数读取并展示归档数据包。其中,访问参数是指读取归档数据包对应的存储目录时所采用的读取内容以及读取范围,例如存储目录是server1DA集团公司市分公司2020年销售记录,读取内容是读取X产品的销售记录,读取范围是2020年第二季度。按照前述读取内容和读取范围筛选并读取完毕后,则将读取到的数据进行相应的展示,例如形成可视化的电子报表并展示在显示屏上。

本实施方式提供的档案数据存储方法,通过获取档案利用指令对应的电子目录,进而根据对应的预设存储参数中的存储地址定位电子目录对应的归档数据包,从而能够根据档案利用指令中的访问参数读取并展示归档数据包,实现档案数据存储后的档案利用,提高档案数据存储方法的实用性。

需要补充的是,在本实施例的其中一种实施方式中,步骤S401即若接收到档案利用指令,则获取档案利用指令对应的电子目录,包括:

若同时只接收到一个档案利用指令,则执行步骤S401至步骤S404;

若同时接收到多个档案利用指令,则判断各个档案利用指令所对应的电子目录是否相同;

若所对应的电子目录相同,则执行步骤S402至步骤S404;

若所对应的电子目录部分相同,则将相同部分的电子目录代入并执行步骤S402至步骤S404;

获取不相同的各个电子目录所对应的档案利用指令的利用优先级,在相同的电子目录所对应的归档数据包已读取并展示后,根据利用优先级由高到低依次循环执行步骤S402至步骤S404;

若所对应的电子目录全部不同,则获取不相同的各个电子目录所对应的档案利用指令的利用优先级,并根据利用优先级由高到低依次循环执行步骤S402至步骤S404。

其中,利用优先级是根据档案利用指令的各个属性或各个参数所确定的优先级,例如根据档案利用指令的用户级别、所利用的档案类型或档案级别、所利用的档案内容大小或时间范围等。

需要说明的是,在部分系统中同一时刻只能处理单线程任务,此时每次执行步骤S402至步骤S404时,需要将当前的档案利用指令所对应的执行进程进行锁定,即不让其他进程对其造成影响,提高处理稳定性。

本实施方式提供的档案数据存储方法,对于同时接收到多个档案利用指令的情况,判断各个档案利用指令所对应的电子目录是否相同,全部相同则只需执行一次定位并读取归档数据包,部分相同则先对相同部分执行定位并读取归档数据包,再对不同部分根据利用优先级依次定位并读取归档数据包,而完全不同则直接根据利用优先级依次定位并读取归档数据包,从而可以在接收到多个档案利用指令时,有序的读取并展示归档数据包,提高档案数据存储方法的稳定性。

在本实施例的其中一种实施方式中,如图5所示,步骤S403即根据预设存储参数中的存储地址定位电子目录对应的归档数据包,包括:

S501.获取预设存储参数中的存储地址;

S502.判断存储地址是否有电子目录对应的归档数据包;

S503.若没有归档数据包,则判断存储地址在地址变更日志中是否有对应的改变地址;

S504.若有对应的改变地址,则根据改变地址更新存储地址;

S505.若没有对应的改变地址,则获取备份存储参数中的备份地址更新存储地址;

S506.根据更新后的存储地址返回重新判断是否有对应的归档数据包;

S507.若有归档数据包,则定位电子目录对应的归档数据包。

在实际运用中,服务器或系统可能因为部分原因导致电子目录对应的存储地址下的归档数据包无法被定位或被读取,因此需要根据步骤S501所获取的存储地址,执行步骤S502即判断存储地址是否有电子目录对应的归档数据包。

若有归档数据包,则执行步骤S507中的定位电子目录对应的归档数据包。

若没有归档数据包,有可能因为某些原因原定的存储地址发生了所需要的改变,被重新定位到了新的地址即改变地址,则执行步骤S503中的判断存储地址在地址变更日志中是否有对应的改变地址。其中,地址变更日志是指存储地址发生地址改变的变更日志,其包括了原存储地址与对应的改变地址。

若有对应的改变地址,则执行步骤S504中的根据改变地址更新存储地址,即将变更后的存储地址重新定位为改变地址;若没有对应的改变地址,则执行步骤S505中的获取备份存储参数中的备份地址更新存储地址,其中备份地址是指系统周期对存储参数进行备份所形成的备份存储参数中的存储地址。

通过前述步骤获取到更新后的存储地址后,则执行步骤S506即根据更新后的存储地址返回重新判断是否有对应的归档数据包,即返回步骤S502。

本实施方式提供的档案数据存储方法,判断存储地址是否有电子目录对应的归档数据包,并判断没有归档数据包的存储地址是否有对应的改变地址,进而选择根据改变地址更新存储地址,或者获取备份存储参数中的备份地址更新存储地址,并根据更新后的存储地址返回重新判断是否有对应的归档数据包。从而使得不论存储地址发生何种变化或异常,均能够有效的定位电子目录对应的归档数据包,提高档案数据存储方法的稳定性。

在本实施例的其中一种实施方式中,如图6所示,步骤S102即按照预设处理规则处理电子文件,并生成对应的电子目录参数,包括:

S601.根据待归档档案的档案类型,获取对应的预设处理规则;

S602.解析预设处理规则,获取其中的分类规则、排序规则及组合规则;

S603.根据分类规则对电子文件进行分类,形成分类电子文件;

S604.根据排序规则对分类电子文件进行排序,形成排序电子文件;

S605.根据组合规则对排序电子文件进行组合,形成处理后的电子文件;

S606.根据分类规则、排序规则及组合规则生成与处理后的电子文件相对应的电子目录参数。

在实际运用中,不同的档案类型有不同的预设处理规则,因此需执行步骤S601即根据待归档档案的档案类型,获取对应的预设处理规则,而一般预设处理规则包括分类、排序及组合这三种基本规则,因此需继续执行步骤S602即解析预设处理规则,获取其中的分类规则、排序规则及组合规则。

获取到具体的分类规则、排序规则及组合规则,则按序执行步骤S603至步骤S605,从而形成处理后的电子文件。其中,分类规则是指电子文件按照具体的类型的划分规则,排序规则是指同一类型下电子文件的顺序排列规则,而组合规则是指,将依次按照分类规则和排序规则形成的分类有序的电子文件形成一个电子文件的整合规则。

需要说明的是,按照分类、排序及组合的次序进行处理,是根据实际情况所选择的处理次序,除开上述次序外,也可以采用先排序再分类最后组合的方式,具体方式在此不再详述。

形成处理后的电子文件,还需要执行步骤S606即根据分类规则、排序规则及组合规则生成与处理后的电子文件相对应的电子目录参数,将上述规则与处理后的电子文件形成的关联具化为电子目录参数。

本实施方式提供的档案数据存储方法,通过解析预设处理规则,获取其中的分类规则、排序规则及组合规则,根据前述规则依次对电子文件进行分类、排序和组合形成处理后的电子文件,并根据前述规则生成与处理后的电子文件相对应的电子目录参数,从而实现根据处理电子文件所采用的预设处理规则生成电子目录参数,使得电子目录参数能够有效的与电子文件的处理规则及处理过程相关联。

在本实施例的其中一种实施方式中,如图7所示,步骤S104即根据电子档案的文件类型所对应的压缩算法压缩电子档案,形成存储数据包,包括:

S701.判断电子档案的文件类型是否属于已知文件类型;

S702.若属于已知文件类型,则根据对应的已知文件类型所对应的压缩算法压缩电子档案,形成存储数据包;

S703.若属于未知文件类型,则判断历史存储记录中是否有相应的文件类型;

S704.若有相应的文件类型,则根据历史存储记录获取对应的压缩算法作为指定压缩算法;

S705.若没有相应的文件类型,则判断未知文件类型与各个已知文件类型的类型相似度;

S706.选择超过预设相似阈值且数值最大的类型相似度所对应的已知文件类型,作为电子档案的确定文件类型;

S707.获取与确定文件类型对应的压缩算法作为指定压缩算法;

S708.根据指定压缩算法压缩电子档案,形成存储数据包。

在实际运用中,一般会预先将各种文件类型对应好各自的压缩算法,这些已经对应好压缩算法的文件类型即为已知文件类型,因此在选择压缩算法时,需要先执行步骤S701即判断电子档案的文件类型是否属于已知文件类型。

若属于已知文件类型,则执行步骤S702中的根据对应的已知文件类型所对应的压缩算法压缩电子档案,形成存储数据包,即按部就班的选择已对应好的压缩算法并对电子档案进行压缩。

若属于未知文件类型,说明此文件类型不属于已知文件类型,则执行步骤S703中的判断历史存储记录中是否有相应的文件类型。其中,历史存储记录是指之前成功进行档案数据存储的历史记录。

若有相应的文件类型,说明同样的文件类型此前采用历史存储记录中对应的压缩算法能够成功存储,则执行步骤S704中的根据历史存储记录获取对应的压缩算法作为指定压缩算法。其中,指定压缩算法对未知文件类型指定的压缩算法。

若没有相应的文件类型,说明同样的文件类型此前在历史存储记录中没有成功存储的记录,则执行步骤S705中的判断未知文件类型与各个已知文件类型的类型相似度。其中,类型相似度是指以各个已知文件类型为基准,获取未知文件类型与基准之间的相似程度。

为了确定对应此未知文件类型的唯一压缩算法,需要执行步骤S706即选择超过预设相似阈值且数值最大的类型相似度所对应的已知文件类型,作为电子档案的确定文件类型,进而执行步骤S707即获取与确定文件类型对应的压缩算法作为指定压缩算法,从而代入步骤S708实现根据指定压缩算法压缩电子档案,形成存储数据包。

本实施方式提供的档案数据存储方法,对属于没有对应压缩算法的未知文件类型,通过判断历史存储记录中是否有相应的文件类型,选择根据历史存储记录获取对应的压缩算法,或者选择超过预设相似阈值且数值最大的类型相似度所对应的已知文件类型所对应的压缩算法,从而使得能够有效的针对未知文件类型,确定其对应的压缩算法,提高档案数据存储方法的适用性。

在本实施例的其中一种实施方式中,如图8所示,在步骤S708即根据指定压缩算法压缩电子档案,形成存储数据包之后,还包括:

S801.获取存储数据包相较于电子档案的压缩程度;

S802.若压缩程度大于或等于预设压缩阈值,则将指定压缩算法作为未知文件类型所对应的压缩算法;

S803.若压缩程度小于预设压缩阈值,则记录未知文件类型并发送反馈要求;

S804.根据与反馈要求对应的反馈指令处理电子档案。

步骤S801中的压缩程度,是指压缩形成的存储数据包相较于被压缩前的压缩程度,然后判断压缩程度是否大于或等于预设压缩阈值,根据判断结果选择后续执行步骤S802或步骤S803。

若压缩程度大于或等于预设压缩阈值,说明压缩后的存储数据包达到预期压缩效果,则执行步骤S802中的将指定压缩算法作为未知文件类型所对应的压缩算法。

若压缩程度小于预设压缩阈值,说明压缩后的存储数据包未达到预期压缩效果,则执行步骤S803中的记录未知文件类型并发送反馈要求,进而执行步骤S804即根据与反馈要求对应的反馈指令处理电子档案。其中,反馈指令是指操作人员根据反馈要求,对于未知文件类型以及压缩程度小于预设压缩阈值的后续处理。例如,对于压缩未达到预期程度的未知文件类型,根据其后续的数量或者需求程度,设置比预设压缩阈值更低的另一压缩阈值,然后重新处理电子档案;或者对于记录达到一定数量的未知文件类型,尝试解析或转化为已知文件类型,然后重新处理电子档案。

本实施方式提供的档案数据存储方法,通过判断存储数据包相较于电子档案的压缩程度是否大于或等于预设压缩阈值,选择将当前的压缩算法作为未知文件类型所对应的压缩算法,或者发送反馈要求并根据与反馈要求对应的反馈指令处理电子档案,从而能够对未知文件类型也形成相应的处理方案,扩宽档案数据存储方法的适用范围。

第二方面,本申请提供的一种档案数据存储系统,如图9所示,包括:

第一获取模块1,用于根据待归档档案的原始类型所对应的获取方式,获取所述待归档档案的电子文件;

第一处理模块2,用于按照预设处理规则处理所述电子文件,并生成对应的电子目录参数;

第一关联模块3,用于将处理后的所述电子文件与所述电子目录参数相关联,形成电子档案;

第一压缩模块4,用于根据所述电子档案的文件类型所对应的压缩算法压缩所述电子档案,形成存储数据包;

第一整合模块5,用于整合所述存储数据包及对应的所述电子目录参数,形成归档数据包;

第二获取模块6,用于获取与所述电子目录参数对应的预设存储参数;

第一存储模块7,用于根据所述预设存储参数和所述电子目录参数存储所述归档数据包,形成档案数据。

需要说明的是,上述各个功能模块之间的数据传输关系或者逻辑连接关系,可以根据其相应的档案数据存储方法中的对应步骤所确定,在此不再累述。如图9所示的各功能模块的数据传输关系或者逻辑连接关系仅为作为档案数据存储系统的理解所用,不作具体限定。

本实施例提供的档案数据存储系统,通过按照预设处理规则处理电子文件并与对应的电子目录参数相关联,形成电子档案,进而根据文件类型所对应的压缩算法压缩电子档案,形成存储数据包,将其与对应的电子目录参数一起整合形成归档数据包,结合与电子目录参数对应的预设存储参数进行存储,形成档案数据。从而使得电子档案在被压缩前已经关联电子目录参数,压缩后只需根据电子目录参数和对应的预设存储参数,即可直接进行存储,达到在不影响档案数据存储的前提下减少档案体积的效果。

进一步的,本实施例提供的档案数据存储系统,还可以根据需要设置其他功能模块,也可以将上述功能模块划分成多个功能单元,以便实现与前述的档案数据存储方法所相对应的技术效果。

第三方面,本申请提供的一种计算机可读存储介质,计算机可读存储介质中存储有计算机指令,计算机指令被处理器加载并执行时,采用了如上述的档案数据存储方法,其能实现与前述的档案数据存储方法所相对应的技术效果。

应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行,即彼此之间的执行顺序可以根据实际需要进行合理排列。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些因素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

相关技术
  • 一种数据存储方法、调度装置、系统、设备及存储介质
  • 一种数据存储方法、系统、智能可穿戴设备及存储介质
  • 一种数据存储系统和方法、存储介质
  • 一种数据存储方法及装置、一种计算设备及存储介质
  • 一种数据存储方法及装置、一种计算设备及存储介质
  • 将数据存储到至少一个数据存储器和从至少一个数据存储器检索数据的方法、系统、使用方法、计算机程序和计算机可读介质
  • 通过第一便携式数据存储介质检测第二便携式数据存储介质的存在的系统和方法
技术分类

06120116482804