一种数据文件的处理方法及处理装置
文献发布时间:2023-06-19 10:54:12
技术领域
本申请涉及信息数据处理领域,尤其涉及一种数据文件的处理方法及处理装置。
背景技术
随着电子信息的飞速发展,嵌入式设备应用越来越广泛,随之而来的对信息数据处理规模和速度的要求也越来越高,所以对数据的查询及存储效率也有了新的要求。传统的基于单一递归算法的查询方法,时间复杂度大约是(n
发明内容
(一)发明目的
本申请要解决的技术问题是提供一种数据文件的处理方法及处理装置,所述处理方法,通过为数据文件标注建立时间,并通过建立红黑树索引模型实现了待删除数据文件的快速查找。
(二)技术方案
为解决上述问题,本申请实施例的第一方面提供了一种数据文件的处理方法,包括:
根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
确定待存储数据文件的数据量;
当所述待存储数据文件的数据量大于所述存储空间中的剩余空间时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
重复上述步骤中查找和删除的过程,直到所述剩余空间大于或等于所述待存储数据文件的数据量。
一些实施例中,所述方法还包括:
基于预定的概率模型在所述剩余空间中建立所述待存储数据文件的文件夹,包括:
对所述剩余空间中的多个子存储空间建立模糊等级;
根据所述概率模型和所述模糊等级,确定所述待存储数据文件存入某一所述子存储空间的概率;
在概率最大的所述子存储空间中建立文件夹,并将所述待存储数据文件存入该文件夹中。
一些实施例中,所述模糊等级包括负大、负中、负小、负零、正零、正小、正中和正大。
本申请实施例的第二方面提供了一种数据文件的处理方法,包括:
根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
确定所述确定存储空间的当前剩余空间;
当所述当前剩余空间小于设定阈值时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
重复上述步骤中查找和删除的过程,直到当前剩余空间大于或等于所述设定阈值。
一些实施例中,所述方法还包括:
基于预定的概率模型在所述剩余空间中建立待存储数据文件的文件夹,包括:
对所述剩余空间中的多个子存储空间建立模糊等级;
根据所述概率模型和所述模糊等级,确定所述待存储数据文件存入某一所述子存储空间的概率;
在概率最大的所述子存储空间中建立文件夹,并将所述待存储数据文件存入该文件夹中。
本申请实施例的第三方面提供了一种数据文件的处理装置,包括:
第一模型建立单元,用于根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
文件数据量确定单元,用于确定待存储数据文件的数据量;
第一查找删除单元,用于当所述待存储数据文件的数据量大于所述存储空间中的剩余空间时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
第一重复执行单元,用于重复第一查找删除单元中查找和删除的过程,直到所述剩余空间大于或等于所述待存储数据文件的数据量。
本申请实施例的第四方面还提供了一种数据文件的处理装置,包括:
第二模型建立单元,用于根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
剩余空间确定单元,用于确定所述确定存储空间的当前剩余空间;
第二查找删除单元,用于当所述当前剩余空间小于设定阈值时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
第二重复执行单元,用于重复第二查找删除单元中查找和删除的过程,直到当前剩余空间大于或等于所述设定阈值。
本申请实施例的第五方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例中任一项所述的处理方法。
本申请实施例的第六方面还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一项所述的处理方法
(三)有益效果
本申请实施例通过为数据文件标注建立时间,并通过建立红黑树索引模型实现了待删除数据文件的快速查找,并且在存储空间不够时,也能快速确定可删除的文件,从而为新数据提供可用的存储空间。
附图说明
图1是本申请实施例1的方法流程图;
图2是本申请实施例2的方法流程图;
图3是基于红黑树索引模型的数据文件查找结构示意图;
图4是预定的概率模型的概率等级分布示意图;
图5是图1实施例对应的装置框图;
图6是图2实施例对应的的装置框图;
图7是本申请实施例3的方法流程图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本申请进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本申请的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本申请的概念。
显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
在本申请的描述中,需要说明的是,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,下面所描述的本申请不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
实施例1
本申请实施例第一方面提供了一种数据文件的处理方法,包括:
根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
确定待存储数据文件的数据量;
当所述待存储数据文件的数据量大于所述存储空间中的剩余空间时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
重复上述步骤中查找和删除的过程,直到所述剩余空间大于或等于所述待存储数据文件的数据量。
图1是本申请实施例1的方法流程图。
如图1所示,具体的,一种数据文件的处理方法,包括:
步骤110:根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型。
步骤120:确定待存储数据文件的数据量。
其中数据量即是指该文件的占用字节数的大小。
步骤130:当所述待存储数据文件的数据量大于所述存储空间中的剩余空间时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件。
步骤140:重复步骤130中查找和删除的过程,直到所述剩余空间大于或等于所述待存储数据文件的数据量。
图3是基于红黑树索引模型的数据文件查找结构示意图。
参见图3,步骤110中建立的红黑树索引模型,以及步骤130中基于红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件。都是基于根节点到所有叶子节点的路径上,黑色链接的个数都相同,从根节点到叶子节点的距离都相等的红黑树模型进行的。
该红黑树模型的平均高度为log
其中一个节点不能同时指向两个链接,红色链接,他用来链接两个2-nodes节点来表示一个3-nodes节点,并向左倾斜,黑色链接用来链接普通的2-3节点。
从整体来看,整个树结构是平衡的,根节点为查找原点,对应存储文件系统指针,依次指向子板卡1、子板卡2、子板卡3等,子板卡再由其对应的子子节点(小叶节点)查询相应的子板卡文件,
依照主从节点逻辑,依次从主根节点查找,若为无,则查找从根节点依次向左右子节点查找,左子节点为无,则查找右子节点。依照此种逻辑做递归方法不断查询,直到找到所需的相关文件夹。
图4是预定概率模型的概率等级分布示意图;
如图4所示,一些实施例中,所述方法还包括:
基于预定的概率模型在所述剩余空间中建立所述待存储数据文件的文件夹,包括:
对所述剩余空间中的多个子存储空间建立模糊等级。
根据所述概率模型和所述模糊等级,确定所述待存储数据文件存入某一所述子存储空间的概率;
在概率最大的所述子存储空间中建立文件夹,并将所述待存储数据文件存入该文件夹中。
其中,参见图4,所述预定的概率模型中的所述模糊等级包括负大、负中、负小、负零、正零、正小、正中和正大。
其中负大级概率为0.15~0.2;负中级概率为0.3~0.4;负小级概率为0.6~0.65;负零级概率为0.25~0.28;正零级概率为0.7~0.8;正大级概率为0.1~0.12;正中级概率为0.9~0.95;正小级概率为0.85~0.88。
本实施例中,建立子板卡数目建立相应的模糊等级,级别分为子板卡1(等级负大),子板卡2(等级负中),子板卡3(等级负小),子板卡4(等级负零),子板卡5(等级正零),子板卡6(等级正大),子板卡7(等级正中),子板卡8(等级正小),参见图3该子板卡即相当于本实施例中的子存储空间。
根据概率模型算出当前的概率数值,对应表1,找到相应的等级,建立对应的文件夹,若不在范围,则继续等待下次存储时的概率值,达到自判断的目的,形成智能化的效果。
图5是图1实施例对应的装置框图。
如图5所示,本申请实施例第二方面提供了一种数据文件的处理装置,包括:
第一模型建立单元11,用于根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
文件数据量确定单元12,用于确定待存储数据文件的数据量;
第一查找删除单元13,用于当所述待存储数据文件的数据量大于所述存储空间中的剩余空间时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
第一重复执行单元14,用于重复第一查找删除单元13中查找和删除的过程,直到所述剩余空间大于或等于所述待存储数据文件的数据量。
实施例2
本申请实施例第三方面提供了一种数据文件的处理方法,包括:
根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
确定所述确定存储空间的当前剩余空间;
当所述当前剩余空间小于设定阈值时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
重复上述步骤中查找和删除的过程,直到当前剩余空间大于或等于所述设定阈值。
图2是本申请实施例2的方法流程图。
如图2所示,具体的,一种数据文件的处理方法,包括:
步骤210:根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
步骤220:确定所述确定存储空间的当前剩余空间;
步骤230:当所述当前剩余空间小于设定阈值时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
步骤240:重复步骤230中查找和删除的过程,直到当前剩余空间大于或等于所述设定阈值。
参见图4,一些实施例中,所述方法还包括:
基于预定的概率模型在所述剩余空间中建立待存储数据文件的文件夹,包括:
对所述剩余空间中的多个子存储空间建立模糊等级;
根据所述概率模型和所述模糊等级,确定所述待存储数据文件存入某一所述子存储空间的概率;
在概率最大的所述子存储空间中建立文件夹,并将所述待存储数据文件存入该文件夹中。
其中,所述模糊等级包括负大、负中、负小、负零、正零、正小、正中和正大。
图6是图2实施例对应的装置框图;
如图6所示,本申请实施例第四方面提供了一种数据文件的处理装置,包括:
第二模型建立单元21,用于根据数据文件标注的建立时间,对确定存储空间中的所述数据文件按照时间顺序建立红黑树索引模型;
剩余空间确定单元22,用于确定所述确定存储空间的当前剩余空间;
第二查找删除单元23,用于当所述当前剩余空间小于设定阈值时,利用所述红黑树索引模型查找所述存储空间中标注有最早时间的待删除数据文件,并删除所述待删除数据文件;
第二重复执行单元24,用于重复第二查找删除单元23中查找和删除的过程,直到当前剩余空间大于或等于所述设定阈值。
实施例2与实施1的区别在于,实施例1是通过确定待存储数据文件的数据量,并进一步判断待存储数据文件的数据量与存储空间中的剩余空间之间的大小,以决定是否要查找并删除标注有最早时间的文件;而实施例2是通过确定存储空间的当前剩余空间,并进一步判断当前剩余空间小于设定阈值之间的大小,以决定是否要查找并删除标注有最早时间的文件。
实施例3
图5是本申请实施例3的方法流程图。
如图5所示,结合实施例1和实施例2,本实施例中的数据处理方法,包括:
系统的初始化,包括硬件加电与底层驱动初始化;
解压整个文件系统;
存储和查询在系统中经由两个线程实现;
其中存储过程包括:
检测整个硬盘的存储容量,若超过阈值,比如存储容量小于1G时,利用红黑树模型查询最早日期子文件,并执行删除指令。
检索子文件大小,若超过子文件存储大小的阈值,则根据概率模型,即根据算法公式
当得到相应概率时,建立好对应的目录,在新的目录下进行存储。
若子文件未超过最大阈值,则在此文件下继续存储相应的数据。
完成整个过程后,压缩整个文件系统。
其中查询过程包括:
建立红黑树索引模型,遵循如果节点的右子节点为红色,且左子节点位黑色,则进行左旋操作;如果节点的左子节点为红色,并且左子节点的左子节点也为红色,则进行右旋操作;
如果节点的左右子节点均为红色,则将此节点提升为父节点,其对子节点的连线变为红色,使整个红黑树达到结构上的平衡,以加快查询速度。
父节点指针指向整个文件系统,各子节点指针指向各子板卡,子子节点指针指向子板卡所属文件,依据根节点无,查询左节点数据,左节点数据无,查询右节点数据,依次递归查询,直到查询到相关数据。
本申请实施例的第五方面还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述实施例中任一项所述的处理方法。
本申请实施例的第六方面还提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一项所述的处理方法。
应当理解的是,本申请的上述具体实施方式仅仅用于示例性说明或解释本申请的原理,而不构成对本申请的限制。因此,在不偏离本申请的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。此外,本申请所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
- 一种数据文件的处理方法及处理装置
- 一种文档型数据文件快速处理装置及方法