掌桥专利:专业的专利平台
掌桥专利
首页

一种重复文件的检测方法、装置及电子设备

文献发布时间:2023-06-19 10:02:03


一种重复文件的检测方法、装置及电子设备

技术领域

本发明涉及文件处理技术领域,特别是涉及一种重复文件的检测方法、装置及电子设备。

背景技术

由于智能办公系统的普及,越来越多的企业开始利用智能办公系统进行有关于企业办公、企业决策、企业知识管理等方面的日常工作。智能办公系统的应用使人的部分工作由各种电子设备完成。智能办公系统能够尽可能充分地利用信息资源,最大限度地提高办公效率,从而提高企业管理和决策的科学化水平。

但是,在使用电子设备处理文件时,会产生大量的重复文件,这些重复文件不仅会浪费电子设备的存储空间,而且会影响人们人们的日常工作,因此需要去找出并清理这些重复文件。

目前的解决此问题的普遍做法是人工查找重复文件,这种方法需要对每个文件夹中的文件进行人工比对,因此极其浪费时间,处理效率非常低。

发明内容

本发明实施例的目的在于提供一种重复文件的检测方法、装置及电子设备,以提高检测重复文件的效率。具体技术方案如下:

第一方面,本发明实施例提供了一种重复文件的检测方法方法,所述方法包括:

获取多个待处理文件;

确定所述多个待处理文件的属性信息,其中,所述属性信息至少包括标识所述待处理文件的内容的信息;

确定每一个文件的属性信息与其他文件的属性信息是否匹配;

如果匹配,则确定所述属性信息匹配的文件为重复文件。

可选的,所述属性信息包括所述待处理文件的文件名称及文件大小。

可选的,在所述获取多个待处理文件步骤之前,所述方法还包括:

获取待处理文件夹,其中,所述待处理文件夹为用户提供的需要进行重复文件的检测的文件夹;

确定所述待处理文件夹中是否存在文件;

若存在文件,则确定所述待处理文件夹中的文件为所述待处理文件。

可选的,在所述确定所述多个待处理文件的属性信息的步骤之后,所述方法还包括:

保存所述属性信息;

所述确定每一个文件的属性信息与其他文件的属性信息是否匹配的步骤,包括:

读取所述属性信息;

将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。

可选的,在所述确定所述属性信息匹配的文件为重复文件的步骤之后,所述方法还包括:

输出删除提示信息,其中,所述删除提示信息包括所述重复文件的文件标识;

获取用户基于所述删除提示信息选择的目标文件标识;

从所述重复文件中,确定所述目标文件标识对应的重复文件为待删除重复文件;

删除所述待删除重复文件。

第二方面,本发明实施例提供了一种重复文件的检测装置装置,所述装置包括:

文件获取模块,用于获取多个待处理文件;

属性信息确定模块,用于确定所述多个待处理文件的属性信息,其中,所述属性信息至少包括标识所述待处理文件的内容的信息;

属性信息匹配模块,用于确定每一个文件的属性信息与其他文件的属性信息是否匹配;

重复文件确定模块,用于在属性信息匹配时,确定所述属性信息匹配的文件为重复文件。

可选的,所述属性信息包括所述待处理文件的文件名称及文件大小。

可选的,所述装置还包括:

文件夹获取模块,用于在所述文件获取模块获取多个待处理文件之前,获取待处理文件夹,其中,所述待处理文件夹为用户提供的需要进行重复文件的检测的文件夹;

文件确定模块,用于确定所述待处理文件夹中是否存在文件;

待处理文件确定模块,用于在所述待处理文件夹中存在文件时,确定所述待处理文件夹中的文件为所述待处理文件。

可选的,所述装置还包括:

存储模块,用于在所述属性信息确定模块确定所述多个待处理文件的属性信息之后,保存所述属性信息;

所述属性信息匹配模块包括:

读取子模块,用于读取所述属性信息;

匹配子模块,用于将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。

可选的,所述装置还包括:

提示信息输出模块,用于输出删除提示信息,其中,所述删除提示信息包括所述重复文件的文件标识;

文件标识确定模块,用于获取用户基于所述删除提示信息选择的目标文件标识;

重复文件确定模块,用于从所述重复文件中,确定所述目标文件标识对应的重复文件为待删除重复文件;

重复文件删除模块,用于删除所述待删除重复文件。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现上述任一所述的重复文件的检测方法的步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一所述的重复文件的检测方法的步骤。

本发明实施例提供的方案中,电子设备可以获取多个待处理文件,确定该多个待处理文件的属性信息,其中,所述属性信息至少包括标识上述待处理文件的内容的信息,确定每一个文件的属性信息与其他文件的属性信息是否匹配,如果匹配,则确定属性信息匹配的文件为重复文件。本发明实施例所提供的方案通过将多个待处理文件中各个文件的属性信息进行匹配,通过匹配的属性信息确定该多个待处理文件中的重复文件,减少了检测重复文件的时间,提高了检测重复文件的效率。当然,实施本发明的任一产品或方法并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例所提供的一种重复文件的检测方法的流程图;

图2为本发明实施例所提供的基于图1所示实施例的待处理文件的确定方式的一种流程图;

图3为本发明实施例所提供的基于图1所示实施例的文件的属性信息匹配方式的一种流程图;

图4为本发明实施例所提供的基于图1所示实施例的重复文件删除方式的一种流程图;

图5为本发明实施例所提供的一种重复文件的检测装置的结构示意图;

图6为本发明实施例所提供的一种电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为了提高检测重复文件的效率,本发明实施例所提供的一种重复文件的检测方法、装置、电子设备及计算可读存储介质。下面首先对本发明实施例所提供的一种重复文件的检测方法进行介绍。

本发明实施例所提供的一种重复文件的检测方法可以应用于任意需要检测重复文件的电子设备,例如,可以为手机、电脑、智能手表等,在此不作具体限定。为了描述方便,后续称为电子设备。

下面首先对本发明实施例所提供的一种重复文件的检测方法进行介绍。

如图1所示,一种重复文件的检测方法,包括:

S101,获取多个待处理文件;

S102,确定所述多个待处理文件的属性信息;

其中,所述属性信息至少包括标识所述待处理文件的内容的信息;

S103,确定每一个文件的属性信息与其他文件的属性信息是否匹配;如果存在匹配的属性信息,执行步骤S104;如果不存在匹配的属性信息,确定所述多个待处理文件中不存在重复文件;

S104,确定所述属性信息匹配的文件为重复文件。

可见,本发明实施例所提供的方案中,电子设备可以获取多个待处理文件,确定该多个待处理文件的属性信息,其中,该属性信息至少包括标识上述待处理文件的内容的信息,确定每一个文件的属性信息与其他文件的属性信息是否匹配,如果匹配,则确定属性信息匹配的文件为重复文件。本发明实施例提供的方案通过将多个待处理文件中各个文件的属性信息进行比对,通过匹配的属性信息确定该多个待处理文件中的重复文件,减少了检测重复文件的时间,提高了检测重复文件的效率。

若用户需要对多个文件中的重复文件进行检测,便可以提供该多个文件,该多个文件也就是上述的待处理文件。在一种实施方式中,电子设备可以预先设置指定的存储位置,例如可以为一文件夹,用户存放于该文件夹中的文件即为需要进行重复文件检测的文件。电子设备可以定时进行重复文件检测,也可以在接收用户发出的检测操作时进行重复文件检测,这都是合理的。

为了方便用户操作,电子设备可以提供用户接口,例如,可以显示一“检测”按钮,用户触发该按钮时,便可以确定用户发出的检测操作。其中,用户可以通过点击、长按等方式触发该按钮,在此不做具体限定。

在上述步骤S101中,电子设备便可以获取多个待处理文件,该多个待处理文件可以是word文件,也可以是txt文件,还可以是pdf(portable document format,便携式文档格式)文件等,在此不做具体限定。

例如,用户提供的多个word文件中,有重复的word文件,也有不重复的word文件,其中重复的word文件不仅会占用电子设备的存储空间,而且会影响用户的正常工作,因此,用户便可以将该多个word文件提供给电子设备,电子设备也便可以获取该多个word文件,作为待处理文件。

电子设备获取上述多个待处理文件后,为了能够对其中的重复文件进行检测,便可以执行步骤S102,即确定该多个待处理文件的属性信息。由于重复文件的实质是文件的内容相同,而文件的属性信息可以标识文件的内容,因此可以利用文件的属性信息进行重复文件的检测。其中,该属性信息至少可以包括标识待处理文件的内容的信息,以能够通过该属性信息标识文件的内容。

其中,上述属性信息可以是待处理文件的文件名称,也可以是待处理文件的文件大小等能够标识文件内容的属性信息,在此不作具体限定。

当电子设备获取上述多个待处理文件的属性信息后,为了实现对重复文件的检测,可以执行步骤S103,即电子设备可以确定每一个文件的属性信息与其他文件的属性信息是否匹配。

在一种实施方式中,电子设备从上述多个待处理文件的第一个文件开始,将每一个文件的属性信息与其后的文件的属性信息依次进行匹配,直到最后一个文件。这样,在匹配完成最后一个文件时,其之前的所有的文件的属性信息均已与其属性信息进行过匹配,此时便可以结束匹配过程,即可以使上述多个待处理文件中任意两个文件之间的属性信息进行匹配。

在上述步骤S103中,每一个文件的属性信息与其它的任一文件的属性信息进行匹配后,然后便可以执行步骤S104,如果存在匹配的属性信息,说明该匹配的属性信息所对应的待处理文件的内容非常相似,所以可以确定匹配的属性信息对应的待处理文件为重复文件。如果不存在匹配的属性信息,说明多个待处理文件的内容都不相似,所以可以确定上述多个待处理文件中没有重复文件。

例如,电子设备获取了四个待处理文件A1、A2、A3、A4,并确定该四个待处理文件的属性信息A11、A21、A31、A41,为了对其中的重复文件进行检测,电子设备可以从待处理文件A1开始,将待处理文件A1的属性信息与待处理文件A2、待处理文件A3及待处理文件A4的属性信息进行匹配,将待处理文件A2的属性信息与待处理文件A3及待处理文件A4的属性信息进行匹配,将待处理文件A3的属性信息与待处理文件A4的属性信息进行匹配,如果确定待处理文件A1的属性信息与待处理文件A2的属性信息相匹配。因为属性信息可以标识待处理文件的内容,故可以确定待处理文件A1与待处理文件A2为重复文件。

作为本发明实施例的一种实施方式,上述属性信息可以为上述待处理文件的文件名称及文件大小。

由于重复文件的实质是文件的内容重复,而文件名称和文件大小最能标识文件的内容,文件名称及大小相同的文件基本可以确定其文件的内容是相同的,因此可以将文件名称和文件大小作为上述待处理文件的属性信息。

例如,电子设备获取四个文件a1、a2、a3、a4,作为待处理文件,为了对其中的重复文件进行检测,由于文件名称和文件大小最能标识文件的内容,所以电子设备可以获取上述四个文件的文件名称和文件大小,作为各待处理文件的属性信息。

电子设备获取上述四个待处理文件的文件名分别为B1、B1、B1、B2,上述四个待处理文件的文件大小分别为C1、C1、C2、C1,那么电子设备可以从待处理文件a1开始,将待处理文件a1的文件名称和文件大小与待处理文件a2、待处理文件a3及待处理文件a4的文件名称和文件大小依次进行匹配,确定其是否匹配,对于待处理文件a2-a4进行同样的属性信息匹配处理。

经过上述匹配过程,如果确定待处理文件a1的文件名与待处理文件a2、待处理文件a3的文件名相同,待处理文件a1的文件大小与待处理文件a2、待处理文件a4的文件大小也相同,由于待处理文件a1与待处理文件a2的文件名称和文件大小都相同,因此可以确定待处理文件a1和待处理文件a2的内容是基本相同的,所以可以确定待处理文件a1与待处理文件a2为重复文件。

可见,本发明实施例所提供的方案中,待处理文件的属性信息可以包括文件名称及文件大小。由于文件名称和文件大小最能标识文件的内容,所以通过确定文件名称和文件大小,可以准确确定重复文件,同时降低检测重复文件复杂度,缩短检测重复文件的时间,进一步提高检测重复文件的效率。

作为本发明实施例的一种实施方式,如图2所示,在上述步骤S101之前,上述方法还可以包括:

S201,获取待处理文件夹;

其中,所述待处理文件夹为用户提供的需要进行重复文件的检测的文件夹。

在一种实施方式中,为了方便进行重复文件检测,可以预先设置一个文件作为待处理文件夹,用户可以随时将需要进行检测的文件存放于该待处理文件夹中。

在另一种实施方式中,当由于需要进行重复文件检测的多个文件可能存放在不同的文件夹中,因此为了方便进行重复文件的检测,用户可以提供一个包含上述不同文件夹的待处理文件夹,或者将多个文件夹中的文件存放于一个文件夹中,作为待处理文件夹,电子设备便也可以获取该待处理文件夹,进而便能获取到该文件夹中包含的多个文件。

例如,用户需要对文件D1、文件D2、文件D3、文件E1及文件E2进行重复文件检测,其中文件D1、文件D2和文件D3存储在文件夹D中,文件E1和文件E2存储在文件夹E中,此时用户可以将包含文件夹D和文件夹E的待处理文件夹P提供给电子设备,也可以将文件D1、文件D2、文件D3、文件E1及文件E2存放于同一文件中,作为待处理文件夹P提供给电子设备,进而,电子设备也便可以获取该待处理文件夹P。

S202,确定所述待处理文件夹中是否存在文件,若不存在文件,则结束检测操作;若存在文件,则执行步骤S203;

当电子设备获取上述待处理文件夹后,为了避免用户误操作造成的计算资源浪费,电子设备可以确定该待处理文件夹中是否包含文件。若该待处理文件夹中不存在文件,说明其为空文件夹,便不需要进行重复文件的检测,所以可以结束检测操作;若该待处理文件夹中存在文件,说明需要进行重复文件的检测,所以电子设备便可以执行步骤S203。

例如,电子设备获取到用户提供的一个文件夹Q,并确认该文件夹Q占用内存空间大小为0字节,则可以确定该文件夹Q为空文件夹,也就是说,该文件夹Q中不存在文件,反之,则可以确定该文件夹Q中存在文件。

S203,确定所述待处理文件夹中的文件为所述待处理文件。

若该待处理文件夹中存在文件,电子设备便可以确定该待处理文件夹中的文件为待处理文件。

例如,基于上述步骤S202中的例子,若文件夹Q中存在文件F1、文件F2、文件F3、文件F4、文件F5及文件F6,则可以确定文件F1、文件F2、文件F3、文件F4、文件F5及文件F6为待处理文件。

可见,本发明实施例所提供的方案中,电子设备可以获取待处理文件夹,其中,待处理文件夹为用户提供的需要进行重复文件的检测的文件夹,确定上述待处理文件夹中是否存在文件,若存在文件,则确定上述待处理文件夹中的文件为待处理文件。这样,电子设备可以通过对用户提供的待处理文件夹进行检测,判断其中是否存在文件,若不存在文件则不需要进行重复文件的检测,若存在文件便可以获取该文件并将其作为待处理文件,避免了对空文件夹进行检测,避免造成的计算资源的浪费。

作为本发明实施例的一种实施方式,在上述步骤S102之后,上述方法还可以包括:

保存所述属性信息。

当电子设备确定上述待处理文件的属性信息后,可以执行此步骤,将所确定的属性信息进行存储,以便后续的使用。

相应的,如图3所示,上述步骤S103可以包括:

S301,读取所述属性信息;

当电子设备将确定的属性信息进行存储后,可以执行此步骤,将存储的属性信息进行读取。在一种实施方式中,读取该属性信息的方式可以是按照文件排列顺序从第一个文件到最后一个文件依次进行读取,也可以是按照文件排列顺序从最后一个文件到第一个文件依次进行读取,在此不做具体限定。

其中,上述文件的排列顺序可以是预先确定的,例如,可以是按照文件名首字母的从A到Z的排列顺序,也可以是按照文件大小从大到小的排列顺序等,在此不做具体限定。

S302,将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。

当电子设备读取上述属性信息后,便可以执行该步骤,由于属性信息的比对方式已经在上述步骤S103部分进行介绍,可以参见上述步骤S103部分的说明,因此不再赘述。

可见,本发明实施例所提供的方案中,电子设备可以保存属性信息,进而可以读取所保存的属性信息,将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。本发明实施例提供的方案通过保存上述属性信息,可以更方便的对属性信息进行比对,避免重复获取待处理文件的属性信息,提高了检测重复文件的效率。

作为本发明实施例的一种实施方式,如图4所示,在上述步骤S104之后,上述方法还可以包括:

S401,输出删除提示信息;

其中,所述删除提示信息包括所述重复文件的文件标识。

当电子设备通过对上述待处理文件的属性信息进行匹配,确定属性信息匹配的文件为重复文件之后,由于重复文件占用存储空间,因此可以对重复文件进行删除。

但是重复文件中可能包含用户需要保留的文件,所以为了让用户可以自主选择想要删除的重复文件,避免误删,电子设备便可以输出删除提示信息,以提示用户对检测出的重复文件进行删除。

其中,该提示信息可以包括重复文件的文件标识,其中,文件标识为可以唯一标识该重复文件的信息,例如,可以为重复文件的文件名称,或者是其它预先设定的文件标识等,在此不做具体限定。

例如,电子设备获取到四个待处理文件G1、G2、G3、G4,预先为该四个待处理文件设置文件标识为g1、g2、g3、g4,经过检测确定待处理文件G1和待处理文件G2为重复文件,便可以输出删除提示信息,其中,删除提示信息可以包含文件标识g1、文件标识g2等提示信息,以提示用户可以删除文件标识为g1和/或文件标识为g2的重复文件。

S402,获取用户基于所述删除提示信息选择的目标文件标识;

电子设备输出删除提示信息后,用户可以根据该删除提示信息,对想要删除的重复文件进行选择。例如,用户可以点击电子设备输出的删除提示信息中的文件标识进行选择,或者,电子设备输出的删除提示信息可以包括选择按钮、选择框等供用户选择的触发接口,当用户触发该触发接口时,说明用户想要删除其对应的重复文件,因此电子设备便可以确定用户触发的触发接口对应的文件标识为目标文件标识。

例如,电子设备输出删除提示信息,其中包括重复文件G1的文件标识为g1,重复文件G2的文件标识为g2,用户基于该删除提示信息选择其中的文件标识g2,电子设备便可以获取用户选择的文件标识g2为目标文件标识。

S403,从所述重复文件中,确定所述目标文件标识对应的重复文件为待删除重复文件;

当电子设备获取用户基于上述删除提示信息选择的目标文件标识后,说明用户想要删除该目标文件标识所对应的重复文件,由于该目标文件标识能够唯一确定对应的重复文件,那么电子设备便可以确定该目标文件标识对应的重复文件为用户想要删除的重复文件,也就是待删除重复文件。

例如,基于步骤S402中的例子,电子设备确定目标文件标识为文件标识g2,那么便可以确定目标文件标识g2对应的重复文件G2为用户想要删除的文件,也就是待删除重复文件。

S404,删除所述待删除重复文件。

电子设备确定上述待删除重复文件后,便可以对待删除重复文件进行删除处理,以删除用户想要删除的重复文件,满足用户的处理需求。

可见,本发明实施例所提供的方案中,电子设备可以输出删除提示信息,其中,删除提示信息包括重复文件的文件标识,然后可以获取用户基于所述删除提示信息选择的目标文件标识,从上述重复文件中,确定该目标文件标识对应的重复文件为待删除重复文件,并删除该待删除重复文件。这样,电子设备可以通过输出删除提示信息告知用户上述多个待处理文件中的重复文件,并根据用户选择确定待删除重复文件,进而删除用户需要删除的重复文件,不仅实现了对重复文件的删除,减少了对电子设备存储空间的占用,而且可以满足用户的个性化删除文件的需求。

根据本发明上述实施例提供的重复文件的检测方法,相应的,本发明另一实施例还提供了一种重复文件的检测装置,其结构示意图如图5所示,包括:

文件获取模块501,用于获取多个待处理文件;

属性信息确定模块502,用于确定所述多个待处理文件的属性信息;

其中,所述属性信息至少包括标识所述待处理文件的内容的信息。

属性信息匹配模块503,用于确定每一个文件的属性信息与其他文件的属性信息是否匹配;

重复文件确定模块504,用于在属性信息匹配时,确定所述属性信息匹配的文件为重复文件。

可见,本发明实施例所提供的方案中,电子设备可以获取多个待处理文件,确定该多个待处理文件的属性信息,其中,所述属性信息至少包括标识上述待处理文件的内容的信息,确定每一个文件的属性信息与其他文件的属性信息是否匹配,如果匹配,则确定属性信息匹配的文件为重复文件。通过将多个待处理文件中每个文件的属性信息进行比对,通过匹配的属性信息确定该多个待处理文件中的重复文件,减少了检测重复文件的时间,提高了检测重复文件的效率。

作为本发明实施例的一种实施方式,上述属性信息可以包括上述待处理文件的文件名称及文件大小。

作为本发明实施例的一种实施方式,上述装置还可以包括:

文件夹获取模块(图5中未示出),用于在所述文件获取模块获取多个待处理文件之前,获取待处理文件夹;

其中,所述待处理文件夹为用户提供的需要进行重复文件的检测的文件夹。

文件确定模块(图5中未示出),用于确定所述待处理文件夹中是否存在文件;

待处理文件确定模块(图5中未示出),用于在所述待处理文件夹中存在文件时,确定所述待处理文件夹中的文件为所述待处理文件。

作为本发明实施例的一种实施方式,上述装置还可以包括:

存储模块(图5中未示出),用于在所述属性信息确定模块确定所述多个待处理文件的属性信息之后,保存所述属性信息。

上述属性信息匹配模块可以包括:

读取子模块(图5中未示出),用于读取所述属性信息;

匹配子模块(图5中未示出),用于将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。

作为本发明实施例的一种实施方式,上述装置还可以包括:

提示信息输出模块(图5中未示出),用于输出删除提示信息;

其中,所述删除提示信息包括所述重复文件的文件标识。

文件标识确定模块(图5中未示出),用于获取用户基于所述删除提示信息选择的目标文件标识;

重复文件确定模块(图5中未示出),用于从所述重复文件中,确定所述目标文件标识对应的重复文件为待删除重复文件;

重复文件删除模块(图5中未示出),用于删除所述待删除重复文件。

本发明实施例还提供了一种电子设备,如图6所示,包括处理器601、通信接口602、存储器603和通信总线604,其中,处理器601,通信接口602,存储器603通过通信总线604完成相互间的通信,

存储器603,用于存放计算机程序;

处理器601,用于执行存储器603上所存放的程序时,实现如下步骤:

获取多个待处理文件;

确定所述多个待处理文件的属性信息,其中,所述属性信息至少包括标识所述待处理文件的内容的信息;

确定每一个文件的属性信息与其他文件的属性信息是否匹配;

如果匹配,则确定所述属性信息匹配的文件为重复文件。

可见,本发明实施例所提供的方案中,电子设备可以获取多个待处理文件,确定该多个待处理文件的属性信息,其中,所述属性信息至少包括标识上述待处理文件的内容的信息,确定每一个文件的属性信息与其他文件的属性信息是否匹配,如果匹配,则确定属性信息匹配的文件为重复文件。通过将多个待处理文件中每个文件的属性信息进行比对,通过匹配的属性信息确定该多个待处理文件中的重复文件,减少了检测重复文件的时间,提高了检测重复文件的效率。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital SignalProcessing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

作为本发明实施例的一种实施方式,上述属性信息可以包括待处理文件的文件名称及文件大小。

作为本发明实施例的一种实施方式,在上述获取多个待处理文件步骤之前,上述方法还可以包括:

获取待处理文件夹,其中,所述待处理文件夹为用户提供的需要进行重复文件的检测的文件夹;

确定所述待处理文件夹中是否存在文件;

若存在文件,则确定所述待处理文件夹中的文件为所述待处理文件。

作为本发明实施例的一种实施方式,在上述确定所述多个待处理文件的属性信息的步骤之后,上述方法还可以包括:

保存所述属性信息;

所述确定每一个文件的属性信息与其他文件的属性信息是否匹配的步骤,还可以包括:

读取所述属性信息;

将每一个文件的属性信息与其它文件的属性信息进行比对,确定是否匹配。

作为本发明实施例的一种实施方式,在上述确定所述属性信息匹配的文件为重复文件的步骤之后,上述方法还可以包括:

输出删除提示信息,其中,所述删除提示信息包括所述重复文件的文件标识;

获取用户基于所述删除提示信息选择的目标文件标识;

从所述重复文件中,确定所述目标文件标识对应的重复文件为待删除重复文件;

删除所述待删除重复文件。

在本发明提供的又一实施例中,还提供了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现上述任一重复文件的检测方法的步骤。

可见,本发明实施例所提供的方案中,电子设备可以获取多个待处理文件,确定该多个待处理文件的属性信息,其中,该属性信息至少包括标识上述待处理文件的内容的信息,确定每一个文件的属性信息与其他文件的属性信息是否匹配,如果匹配,则确定属性信息匹配的文件为重复文件。本发明实施例提供的方案通过将多个待处理文件中每个文件的属性信息进行比对,通过匹配的属性信息确定该多个待处理文件中的重复文件,减少了检测重复文件的时间,提高了检测重复文件的效率。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备及计算机可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

相关技术
  • 一种重复文件的检测方法、装置及电子设备
  • 重复多媒体文件识别方法、装置、电子设备及存储介质
技术分类

06120112389574