掌桥专利:专业的专利平台
掌桥专利
首页

文件重命名方法、系统及计算设备

文献发布时间:2024-04-18 19:58:30


文件重命名方法、系统及计算设备

技术领域

本发明涉及计算机技术领域,尤其涉及一种文件重命名方法、文件重命名系统及计算设备。

背景技术

在计算机使用过程中,读写文件是必备的人机访问交互方式,用户每天都需要与大量的文件打交道,而文件名称是文件最重要的属性,用户可以根据文件名称来了解文件的大致内容,因此,大部分用户都习惯于将文件命名为容易识别且满足个性化需求的文件名。

目前流行的操作系统,无论Windows、MacOS,还是移动设备的Android系统,都采用了标准的文件命名机制,即文件名+后缀名的方式。这种文件命名方法,使得用户处理的大量文件通常采用一个随机的文件名称,例如采用时间戳或哈希值的文件名称,没有采用统一的文件命名规则,导致用户需要对每个文件进行手动重命名之后才具备可读性。

现有技术中,在Windows操作系统的文件管理器应用中,提供了对文件批量重命名的功能,用户可通过Ctrl+A全选文件,单击右键在弹出的菜单栏选择“重命名”选项,之后输入文件名,按下回车键,重命名操作完成。选中进行修改的文件序号为(1),后续自动重命名的文件序号从被修改文件开始依次递增。这种方法简单快捷,无需下载任何软件即可完成。采用这种方案,在Windows批量重命名功能中,用户只能输入一个固定的文件名称,之后由系统自己添加编号递增的方式,非常机械化,无法满足一些自定义命名场景。另外,将多个文件重命名为一个固定的文件名称,无法真正体现文件内容与文件名的关联性,可能存在很多文件需要再次进行重命名的情况,无法真正减少用户的实际操作。

在U0S的文件管理器中,提供了可自定义格式的批量文件重命名功能,该模式可以允许用户对多个选中的文件进行自定义格式的批量重命名,格式可以定义“前-中-后”三个部分的内容,之后用增量编号的方式依次递增命名,可以基本满足用户的自定义命名场景。但,这种批量重命名方法,用户需要指定前-中-后的固定内容,无法区分不同文件的文件内容,导致重命名后的文件在文件名上基本相同,无法真正实现文件名与文件内容的关联。

因此,需要一种文件重命名方法,以解决上述技术方案中存在的问题。

发明内容

为此,本发明提供一种文件重命名方法及文件重命名系统,以解决或至少缓解上面存在的问题。

根据本发明的一个方面,提供一种文件重命名方法,在计算设备中执行,所述计算设备与文件索引存储装置耦接,所述文件索引存储装置中包括多种文件索引;所述方法包括:响应于对一个或多个文件进行重命名的请求,从所述文件索引存储装置中获取所述文件的多种文件索引;根据所述文件的多种文件索引及每种文件索引对应的权重,拼接生成所述文件的关键信息;根据所述文件的关键信息和预定文件信息,生成所述文件的推荐名称,以便根据所述推荐名称对所述文件进行重命名。

可选地,在根据本发明的文件重命名方法中,所述多种文件索引包括:文件名称索引、文件内容索引、文件属性索引、文件标签索引。

可选地,在根据本发明的文件重命名方法中,根据所述文件的关键信息和预定文件信息,生成所述文件的推荐名称,包括:根据所述文件的关键信息和预定文件信息,按照预定格式,生成所述文件的推荐名称。

可选地,在根据本发明的文件重命名方法中,所述预定文件信息包括第一预定文件信息和第二预定文件信息,所述推荐名称包括第一名称部分、第二名称部分、第三名称部分;根据所述文件的关键信息和预定文件信息,生成所述文件的推荐名称,包括:将所述文件的第一预定文件信息和第二预定文件信息分别作为第一名称部分和第二名称部分,将所述文件的关键信息作为第三名称部分,以生成所述文件的推荐名称。

可选地,在根据本发明的文件重命名方法中,所述第一预定文件信息、第二预定文件信息分别为文件时间、用户名、工作文件中的一个。

可选地,在根据本发明的文件重命名方法中,根据所述文件的多种文件索引及每种文件索引对应的权重,拼接生成所述文件的关键信息,包括:从所述文件名称索引中选取一个或多个名称关键词,从所述文件内容索引中选取一个或多个内容关键词,从所述文件标签索引中选取一个或多个标签关键词,从所述文件属性索引中选取一个或多个属性关键词,得到多种文件索引中的多个关键词;根据每种文件索引对应的权重,从所述多种文件索引中的多个关键词中选取一部分关键词进行拼接,生成所述文件的关键信息。

可选地,在根据本发明的文件重命名方法中,还包括:响应于监测到文件创建事件,获取所述文件的多种信息,以创建所述文件的多种文件索引;将所述文件的多种文件索引存储在所述文件索引存储装置中。

可选地,在根据本发明的文件重命名方法中,获取所述文件的多种信息,以创建所述文件的多种文件索引,包括:获取所述文件的原始文件名称,利用文件名识别分词算法对所述原始文件名称进行分词形成一个或多个名称关键词,得到所述文件的文件名称索引;获取所述文件的全文内容,利用文件内容分词算法对所述全文内容进行分词形成一个或多个内容关键词,得到所述文件的文件内容索引;获取所述文件的文件属性,利用文件属性关键词提取算法提取所述文件属性中的一个或多个属性关键词,得到所述文件的文件属性索引;获取所述文件的文件标签,利用文件标签关键词提取算法提取所述文件标签中的一个或多个标签关键词,得到所述文件的文件标签索引。

可选地,在根据本发明的文件重命名方法中,获取所述文件的文件标签,包括:如果所述文件是图片文件,则利用OCR识别算法,从所述图片文件中提取文字内容作为文件标签。

根据本发明的一个方面,提供一种文件重命名系统,包括:文件索引存储装置,适于存储各文件的多种文件索引;文件监视器,适于监测文件创建事件或文件更新事件;守护进程,与所述文件监视器、文件索引存储装置耦接,适于响应于所述文件监视器监测到的文件创建事件或文件更新事件,创建文件的多种索引并存储至所述文件索引存储装置;文管客户端,适于发送对一个或多个文件进行重命名的请求;以及文管服务端,与所述文管客户端、文件索引存储装置耦接,适于响应于所述文管客户端发送的对一个或多个文件进行重命名的请求,执行如上所述的方法。

根据本发明的一个方面,提供一种计算设备,包括:至少一个处理器;存储器,存储有程序指令,其中,程序指令被配置为适于由上述至少一个处理器执行,所述程序指令包括用于执行如上所述的文件重命名方法的指令。

根据本发明的一个方面,提供一种存储有程序指令的可读存储介质,当该程序指令被计算设备读取并执行时,使得该计算设备执行如上所述的文件重命名方法。

根据本发明的技术方案,提供了一种文件重命名方法,可以响应于用户在文管客户端对一个或多个文件进行重命名的请求,从文件索引存储装置中获取文件的多种文件索引,并根据文件的多种文件索引及每种文件索引对应的权重拼接生成文件的关键信息,进而,根据文件的关键信息和预定文件信息生成文件的推荐名称,以便根据推荐名称对文件进行重命名。这样,本发明实现了自动、智能化地对单个文件或批量文件进行重命名,实现了一键自动重命名,提高了重命名效率,并且,重命名后的文件名称(推荐名称)中的关键信息与文件内容相关联,具体可以与文件的原始文件名称、文件内容、文件属性、文件标签相关联,从而,对于不同文件,用户可以根据重命名后的文件名称来区分不同文件的内容。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

附图说明

为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。

图1示出了根据本发明一个实施例的文件重命名系统100的示意图;

图2示出了根据本发明一个实施例的计算设备200的示意图;

图3示出了根据本发明一个实施例的文件重命名方法300的流程示意图;

图4示出了根据本发明一个实施例的创建文件索引的流程示意图;

图5示出了根据本发明一个实施例中利用deepin-anything文件名识别分词算法创建文件名称索引的数据结构示意图;

图6示出了根据本发明一个实施例的推荐名称的第一名称部分、第二名称部分、第三名称部分的示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

图1示出了根据本发明一个实施例的文件重命名系统100的示意图。根据本发明的文件重命名系统100,能实现自动、智能化地对文件进行重命名,且重命名后的文件名称与文件内容相关联。

如图1所示,文件重命名系统100包括文管客户端110(即,文件管理器客户端)、文管服务端120(即,文件管理器服务端)、文件索引存储装置130。文管服务端120可以与文管客户端110、文件索引存储装置130耦接。

在一个实施例中,文件索引存储装置130中可以存储各文件的多种文件索引。多种文件索引具体可以包括:文件名称索引、文件内容索引(即,全文检索索引)、文件属性索引、文件标签索引等。这里,文件内容索引例如可以包括文本文件中的内容、图片中的文字内容,文件属性索引例如可以包括歌手、专辑名、分辨率、时长等信息。

在一些实施例中,文管服务端120包括文件重命名插件库,以便基于文件重命名插件库为文管客户端110提供文件重命名服务。

在一些实施例中,本发明的文件重命名系统100可以部署在计算设备(例如下文所述的计算设备200)中,且文管客户端110与文管服务端120可以通过D-Bus接口进行通信。

在一些实施例中,文件重命名系统100还包括文件监视器140(部署在计算设备中),通过文件监视器140可以监测文件创建事件、文件更新事件,并在监测到文件创建事件时发送文件创建信号,在监测到文件更新事件时发送文件更新信号。计算设备可以响应于通过文件监视器140监测到的文件创建事件或者文件更新事件,获取文件的多种信息,以创建文件的多种文件索引,并将创建的文件的多种文件索引存储到文件索引存储装置130中,以实现对文件索引存储装置130中的文件的多种文件索引进行更新。

在一些实施例中,文件重命名系统100还包括守护进程150(索引和中文识别守护进程),该守护进程150可以与文件监视器140、文件索引存储装置130耦接。守护进程150可以部署在计算设备的操作系统中,可以响应于通过文件监视器140监测到的文件创建事件或者文件更新事件,获取文件的多种信息,以创建文件的多种文件索引,并将文件的多种文件索引存储在文件索引存储装置130中,以实现对文件索引存储装置130中的文件的多种文件索引进行更新。其中,守护进程150提供有文件索引更新服务,通过文件索引更新服务可以响应于文件监视器140在监测到文件创建事件时发送的文件创建信号、或者在监测到文件更新事件时发送的文件更新信号,创建文件的多种文件索引并存储至文件索引存储装置130中,以对文件索引存储装置130中的文件的多种文件索引进行更新。

在一些实施例中,文件重命名系统100还包括与守护进程150耦接的算法层160,算法层160例如可以是中文分词算法层,可以封装有用于识别文件的文件名称(原始文件名称)、文件内容、文件属性、文件标签并从中提取关键词的算法,例如包括文件名识别分词算法、文件内容分词算法、文件属性关键词提取算法、文件标签关键词提取算法。守护进程150可以利用上述算法来分别从文件名称(原始文件名称)、文件内容、文件属性、文件标签中提取对应的关键词,以创建对应的文件名称索引、文件内容索引、文件属性索引、文件标签索引,并将上述多种文件索引存储在文件索引存储装置130中。

在一个实施例中,文管服务端120可以经由守护进程150与算法层160进行通信,以调用算法层160的文件名识别分词算法、文件内容分词算法、文件属性关键词提取算法、文件标签关键词提取算法,分别从文件的文件名称(原始文件名称)、文件内容、文件属性、文件标签中提取对应的名称关键词、内容关键词、属性关键词、标签关键词,以创建对应的文件名称索引、文件内容索引、文件属性索引、文件标签索引,并将上述多种文件索引存储在文件索引存储装置130中。

在本发明的实施例中,用户可以在文管客户端110发送对一个或多个文件进行重命名的请求,文管服务端120可以响应于文管客户端110发送的对一个或多个文件进行重命名的请求,并适于执行本发明的文件重命名方法300来生成各文件的推荐名称,以便根据文件的推荐名称对文件进行重命名。本发明的文件重命名方法300将在下文中详述。

在本发明的一个实施例中,文管服务端120可以实现为如下所述的计算设备200,使得本发明的文件重命名方法300可以在计算设备200中执行。文管服务端120通过执行本发明的文件重命名方法300,可以基于自然语言生成指令并发送至对应的应用115,以便应用115执行所述指令。

图2示出了根据本发明一个实施例的计算设备200的示意图。如图2所示,在基本配置中,计算设备200包括至少一个处理单元202和系统存储器204。根据一个方面,取决于计算设备的配置和类型,处理单元202可以实现为处理器。系统存储器204包括但不限于易失性存储(例如,随机存取存储器)、非易失性存储(例如,只读存储器)、闪速存储器、或者这样的存储器的任何组合。根据一个方面,系统存储器204中包括操作系统205。

根据一个方面,操作系统105例如适合于控制计算设备200的操作。此外,示例结合图形库、其他操作系统、或任何其他应用程序而被实践,并且不限于任何特定的应用或系统。在图2中通过在虚线内的那些组件示出了该基本配置。根据一个方面,计算设备200具有额外的特征或功能。例如,根据一个方面,计算设备200包括额外的数据存储设备(可移动的和/或不可移动的),例如磁盘、光盘、或者磁带。这样额外的存储在图2中是由可移动存储设备209和不可移动存储设备210示出的。

如在上文中所陈述的,根据一个方面,在系统存储器204中存储有程序模块203。根据一个方面,程序模块203可以包括一个或多个应用程序,本发明不限制应用程序的类型,例如应用程序可以包括:电子邮件和联系人应用程序、文字处理应用程序、电子表格应用程序、数据库应用程序、幻灯片展示应用程序、绘画或计算机辅助应用程序、网络浏览器应用程序等。在根据本发明的实施例中,程序模块203中包括执行本发明的文件重命名方法300的多条程序指令。

根据一个方面,可以在包括分立电子元件的电路、包含逻辑门的封装或集成的电子芯片、利用微处理器的电路、或者在包含电子元件或微处理器的单个芯片上实践示例。例如,可以经由其中在图2中所示出的每个或许多组件可以集成在单个集成电路上的片上系统(SOC)来实践示例。根据一个方面,这样的SOC设备可以包括一个或多个处理单元、图形单元、通信单元、系统虚拟化单元、以及各种应用功能,其全部作为单个集成电路而被集成(或“烧”)到芯片基底上。当经由SOC进行操作时,可以经由在单个集成电路(芯片)上与计算设备200的其他组件集成的专用逻辑来对在本文中所描述的功能进行操作。还可以使用能够执行逻辑操作(例如AND、OR和NOT)的其他技术来实践本发明的实施例,所述其他技术包括但不限于机械、光学、流体、和量子技术。另外,可以在通用计算机内或在任何其他任何电路或系统中实践本发明的实施例。

根据一个方面,计算设备200还可以具有一个或多个输入设备212,例如键盘、鼠标、笔、语音输入设备、触摸输入设备等。还可以包括输出设备214,例如显示器、扬声器、打印机等。前述设备是示例并且也可以使用其他设备。计算设备200可以包括允许与其他计算设备218进行通信的一个或多个通信连接216。合适的通信连接216的示例包括但不限于:RF发射机、接收机和/或收发机电路;通用串行总线(USB)、并行和/或串行端口。

如在本文中所使用的术语计算机可读介质包括计算机存储介质。计算机存储介质可以包括以任何用于存储信息(例如,计算机可读指示、数据结构、或程序模块)的方法或技术来实现的易失性的和非易失性的、可移动的和不可移动的介质。系统存储器204、可移动存储设备209、和不可移动存储设备210都是计算机存储介质的示例(即,存储器存储)。计算机存储介质可以包括随机存取存储器(RAM)、只读存储器(ROM)、电可擦只读存储器(EEPROM)、闪速存储器或其他存储器技术、CD-ROM、数字通用盘(DVD)或其他光存储、盒式磁带、磁带、磁盘存储器或其他磁存储设备、或者可用于存储信息并且可以由计算设备200访问的任何其他制品。根据一个方面,任何这样的计算机存储介质都可以是计算设备200的一部分。计算机存储介质不包括载波或其他经传播的数据信号。

根据一个方面,通信介质是由计算机可读指令、数据结构、程序模块、或者经调制的数据信号(例如,载波或其他传输机制)中的其他数据实施的,并且包括任何信息传递介质。根据一个方面,术语“经调制的数据信号”描述了具有一个或多个特征集或者以将信息编码在信号中的方式改变的信号。作为示例而非限制,通信介质包括诸如有线网络或直接有线连接之类的有线介质,以及诸如声学、射频(RF)、红外线的、以及其他无线介质之类的无线介质。

在根据本发明的实施例中,计算设备200被配置为执行根据本发明的文件重命名方法300。计算设备200包括一个或多个处理器、以及存储有程序指令的一个或多个可读存储介质,当程序指令被配置为由一个或多个处理器执行时,使得计算设备200执行本发明实施例中的文件重命名方法300。

图3示出了根据本发明一个实施例的文件重命名方法300的流程示意图。方法300适于在文管服务端120(例如前述计算设备200)中执行。文管服务端120通过执行本发明的文件重命名方法300,能实现自动、智能化地对文件进行重命名,且重命名后的文件名称与文件内容相关联。

如前文所述,根据本发明的文件重命名系统100,包括文管客户端110、文管服务端120、文件索引存储装置130。文管服务端120(计算设备200)可以与文管客户端110、文件索引存储装置130耦接,文件索引存储装置130中包括多种文件索引,具体可以存储各文件的多种文件索引。

在一些实施例中,多种文件索引具体可以包括:文件名称索引(对应原始文件名称中的关键词)、文件内容索引、文件属性索引、文件标签索引。

如图3所示,方法300始于步骤310。

在步骤310中,响应于对一个或多个文件进行重命名的请求,从文件索引存储装置中获取各文件的多种文件索引。具体地,用户可以在文管客户端110发送对一个或多个文件进行重命名的请求,以请求文管服务端120对单个文件或批量文件进行重命名。文管服务端120(计算设备200)可以响应于文管客户端110发送的对一个或多个文件进行重命名的请求,并针对每个文件,从文件索引存储装置中获取该文件的多种文件索引。

需要说明的是,根据本发明的方法300进行重命名的文件可以包括音乐文件、视频文件、图片文件、文本文件中的一种或多种。即,文件类型可以包括音乐、视频、图片、文本中的一种或多种。文件内容索引例如可以包括文本文件中的内容、图片文件中的文字内容,文件属性索引例如可以包括歌手、专辑名、分辨率、时长等信息。

随后,在步骤320中,对于每个文件,根据文件的多种文件索引及每种文件索引对应的权重,拼接生成该文件的关键信息。具体地,可以根据每种文件索引对应的权重,对文件的多种文件索引中的关键词进行拼接,以生成该文件的关键信息。

可以理解,这里生成的文件的关键信息与文件内容相关联,具体可以与文件的原始文件名称、文件内容、文件属性、文件标签相关联。这样,对于不同文件,可以基于各文件的关键信息来区分不同文件的内容。

最后,在步骤330中,可以根据文件的关键信息和预定文件信息,生成该文件的推荐名称,并可以将推荐名称返回给文管客户端110。这样,文管客户端110可以根据推荐名称对该文件进行重命名,即,可以将该文件重命名为根据上述步骤生成的推荐名称。可以理解,这里生成的文件的推荐名称中包含文件的关键信息和预定文件信息。

在一些实施例中,可以根据文件的关键信息和预定文件信息,按照预定格式(可以是用户自定义的重命名格式),生成该文件的推荐名称。

需要说明的是,由于文件的关键信息与文件内容相关联,具体可以与文件的原始文件名称、文件内容、文件属性、文件标签相关联。因此,根据文件的关键信息和预定文件信息生成的文件的推荐名称,也与文件内容相关联,具体可以与文件的原始文件名称、文件内容、文件属性、文件标签相关联。这样,对于不同文件,用户可以基于各文件的推荐名称(即,重命名后的新的文件名称)中的关键信息来区分不同文件的内容。

在一些实施例中,在执行步骤310之前,可以预先创建各文件的多种文件索引,并将各文件的多种文件索引存储在文件索引存储装置中。具体地,可以获取各文件的多种信息(例如包括原始文件名称、全文内容、文件属性、文件标签),根据文件的多种信息来创建文件的多种文件索引。

在本发明的方法300中,可以实时监测文件创建事件、文件更新事件。具体地,可以通过文件监视器140来监测文件创建事件、文件更新事件。当文件监视器140监测到文件创建事件或者文件更新事件时,计算设备200可以响应于监测到文件创建事件或者文件更新事件,获取文件的多种信息,以创建文件的多种文件索引,并且,可以将文件的多种文件索引存储在文件索引存储装置130中,以实现对文件索引存储装置130中的文件的多种文件索引进行更新。

在一个实施例中,守护进程150与文件监视器140、文件索引存储装置130耦接。计算设备200可以通过守护进程150响应于通过文件监视器140监测到的文件创建事件或者文件更新事件,获取文件的多种信息,以创建文件的多种文件索引,并将文件的多种文件索引存储在文件索引存储装置130中,以实现对文件索引存储装置130中的文件的多种文件索引进行更新。

图4示出了根据本发明一个实施例的创建文件索引的流程示意图。

如图4所示,(守护进程150)在响应于文件监视器140监测到的文件创建事件或者文件更新事件时,可以通过以下方法来获取文件的多种信息,并通过算法层160的相应算法提取每种文件索引中的关键词,来创建文件的多种文件索引。这里,算法层160包括文件名识别分词算法、文件内容分词算法、文件属性关键词提取算法、文件标签关键词提取算法。

首先,可以获取文件的原始文件名称,利用文件名识别分词算法来对原始文件名称进行分词形成一个或多个名称关键词(具体可以是中文关键词),从而可以根据一个或多个名称关键词得到文件的文件名称索引。换言之,文件名称索引可以包括对原始文件名称进行分词形成的一个或多个名称关键词。这里,文件名识别分词算法例如可以为deepin-anything文件名识别分词算法。这里,图5示出了根据本发明一个实施例中利用deepin-anything文件名识别分词算法创建文件名称索引的数据结构示意图。

在一个实施例中,在获取文件的原始文件名称之后,可以先判断原始文件名称是否有效,如果有效,再利用文件名识别分词算法(deepin-anything文件名识别分词算法)来对原始文件名称进行分词形成一个或多个名称关键词,得到文件的文件名称索引,从而完成文件名称索引的创建/更新。如果原始文件名称无效,则判定文件无效,不再执行针对该文件创建多种文件索引的流程。

接着,可以调用文件内容分词接口,以获取文件的全文内容(文件内容),随后利用文件内容分词算法(具体可以是lucene文件内容分词算法)对文件的全文内容进行分词形成一个或多个内容关键词,从而可以根据一个或多个内容关键词得到文件的文件内容索引。换言之,文件的文件内容索引可以包括从文件的全文内容中提取的一个或多个内容关键词。在一个实施例中,文件内容分词算法具体可以是lucene文件内容分词算法,利用lucene文件内容分词算法可以对文件的全文内容进行中英文分词,还可以进一步通过文本分析引擎,采用jieba分词技术来实现对文件的全文内容进行分词。

在一个实施例中,如果文件是图片文件,则可以通过OCR识别算法从图片文件中提取文字内容,作为该图片文件的文件内容。

在一个实施例中,在获取文件内容之后,可以先判断文件内容是否有效,如果有效,再利用文件内容分词算法(lucene文件内容分词算法)对文件的全文内容进行分词形成一个或多个内容关键词,得到文件的文件内容索引,从而完成文件内容索引的创建/更新。如果文件内容无效,则不再创建该文件的文件内容索引,并可以继续执行下面的步骤来获取文件属性。

接下来,可以调用文件属性分词接口,以获取文件的文件属性,并可以利用文件属性关键词提取算法提取文件属性中的一个或多个属性关键词,得到文件的文件属性索引。可以理解,文件的文件属性索引可以包括从文件属性中提取的一个或多个属性关键词。在一个实施例中,在获取文件的文件属性时,可以先判断文件后缀名是否有效,如果有效,则可以根据文件后缀名与文件属性的对应关系来获取文件的文件属性,然后,可以利用文件属性关键词提取算法提取文件属性中的一个或多个属性关键词,得到文件的文件属性索引,从而完成文件属性索引的创建/更新。如果文件后缀名无效,则可以不再创建该文件的文件属性索引,并可以继续执行下面的步骤来获取文件标签。

需要说明的是,文件属性可以是Linux操作系统中特有的文件属性标签,与文件的mimetype类型有关,可以存储在文件的metadata中,用于特殊属性的读取和写入方式。例如,图片文件的文件属性包括分辨率,音乐文件的文件属性包括歌手、专辑名等,视频文件的文件属性包括播放时长。

最后,可以调用文件标签分词接口,以获取文件的文件标签,利用文件标签关键词提取算法提取文件标签中的一个或多个标签关键词,得到文件的文件标签索引。可以理解,文件的文件标签索引中可以包括从文件标签中提取的一个或多个标签关键词。在一个实施例中,在获取文件的文件标签时,可以先判断该文件是否是图片文件,如果文件是图片文件,则可以利用OCR识别算法,从图片文件中提取文字内容作为文件标签,进而,可以利用文件标签关键词提取算法提取文件标签(图片文件的文字内容)中的一个或多个标签关键词,得到文件的文件标签索引,从而完成文件标签索引的创建/更新。可以理解,文件标签索引中可以包含从图片文件的文字内容中提取的一个或多个标签关键词。这里,标签关键词可以是图片文件中的文字内容中的特定词汇,例如,标签关键词可以包括“身份证”、“户口簿”等可以标识用户信息的特定词汇。

另外,如果文件不是图片文件,则不再创建该文件的文件标签索引。至此,完成全部文件索引创建/更新流程。

在一些实施例中,在步骤320中,可以利用权重优先级拼接算法,来根据每种文件索引对应的权重,对文件的多种文件索引中的多个关键词进行拼接,以生成该文件的关键信息。

需要说明的是,首先可以从每种文件索引中分别选取一个或多个关键词,具体地,可以从从文件名称索引中选取一个或多个名称关键词、从文件内容索引中选取一个或多个内容关键词、从文件标签索引中选取一个或多个标签关键词、从文件属性索引中选取一个或多个属性关键词,得到多种文件索引中的多个关键词(例如20个关键词)。进而,可以利用权重优先级拼接算法,来根据每种文件索引对应的权重,从多种文件索引中的多个关键词中选取一部分关键词(与各自权重分别对应的一部分名称关键词、一部分内容关键词、一部分标签关键词、一部分属性关键词)作为目标关键词进行拼接,以生成该文件的关键信息。

其中,在对目标关键词进行拼接过程中,可以将目标关键词中的多个名称关键词合并为一个字符串,并与其他文件索引中的关键词之间用连接符连接。例如,从多种文件索引中的多个关键词中选取的一部分关键词(目标关键词)包括:多个名称关键词(浏览器、产品、需求)、两个内容关键词(作者名称、公司名称)、一个属性关键词(word),基于这些目标关键词拼接生成的文件的关键信息可以为:浏览器产品需求-作者名称-公司名称-word。

在一个实施例中,文件名称索引的权重可以为40%,文件内容索引的权重可以为45%,文件标签索引的权重可以为45%,文件属性索引的权重可以为25%。

假设从多种文件索引中共选取了N个关键词,其中包括从文件名称索引中选取的A个名称关键词、从文件内容索引中选取的B个内容关键词、从文件标签索引中选取的C个标签关键词、从文件属性索引中选取的D个属性关键词。则可以根据每种文件索引对应的权重,从N个关键词中选取40%A个名称关键词、45%B个内容关键词、45%C个标签关键词、25%D个属性关键词作为目标关键词,并对选取出来的这些目标关键词进行拼接,生成文件的关键信息。这里,40%A、45%B、45%C、25%D分别取整。

例如,最终选取的多个目标关键词例如包括1个名称关键词(具体为中文关键词)、3个内容关键词、3个标签关键词、1个属性关键词,最终可以根据1个名称关键词、3个内容关键词、3个标签关键词、1个属性关键词,来拼接生成文件的关键信息。

需要说明的是,在从文件名称索引中选取名称关键词时,可以判断文件名称索引中是否包含非数字或英文的有效信息,如果包含,则可以确定文件名称索引中存在中文关键词,并获取中文关键词作为名称关键词。在从文件内容索引中选取内容关键词时,可以根据文件内容(全文内容)中出现各名词的概率进行筛选,并且可以过滤掉文件内容中的动词和代词,以便选取的多个内容关键词尽可能贴近真实文件内容,确保最终生成的文件的关键信息与文件内容密切相关。另外,对于图片文件的文件内容,可以是从图片文件中提取的文字内容,相应地,图片文件的文件内容索引可以根据从图片文件中提取的文字内容创建得到。

此外,由于文件属性信息对于重命名相对不重要,因此可以为文件属性索引设置相对较低的权重。并且,在一个实施例中,当拼接生成的文件的关键信息的文字长度超过长度阈值时,可以将文件属性索引的相关信息从关键信息中删除。

在一个实施例中,预定文件信息例如可以包括文件时间、用户名、工作文件中的一种或多种。

在一个实施例中,预定文件信息例如包括第一预定文件信息和第二预定文件信息。根据预定格式,推荐名称可以划分为第一名称部分、第二名称部分、第三名称部分。这里,第一名称部分、第二名称部分、第三名称部分可以分别对应推荐名称的前部、中部、后部中的其中一个。例如,第一名称部分、第二名称部分、第三名称部分可以分别对应推荐名称的前部、中部、后部,或者分别对应推荐名称的前部、后部、中部,或者分别对应推荐名称的中部、后部、前部,或者分别对应推荐名称的中部、前部、后部,或者分别对应推荐名称的后部、前部、中部,或者分别对应推荐名称的后部、中部、前部。

这里,图6示出了根据本发明一个实施例的推荐名称的第一名称部分、第二名称部分、第三名称部分的示意图。其中,图6所示的第一名称部分、第二名称部分、第三名称部分分别对应前部、中部、后部。

如图6所示,在根据文件的关键信息和预定文件信息生成文件的推荐名称时,可以将文件的第一预定文件信息和第二预定文件信息分别作为第一名称部分和第二名称部分,将步骤320中生成的该文件的关键信息作为第三名称部分,从而可以根据该文件的第一预定文件信息、第二预定文件信息以及关键信息来生成该文件的推荐名称。

在一个实施例中,第一预定文件信息、第二预定文件信息分别可以为文件时间、用户名、工作文件中的其中一个。

根据本发明的文件重命名方法300,可以响应于用户在文管客户端对一个或多个文件进行重命名的请求,从文件索引存储装置中获取文件的多种文件索引,并根据文件的多种文件索引及每种文件索引对应的权重拼接生成文件的关键信息,进而,根据文件的关键信息和预定文件信息生成文件的推荐名称,以便根据推荐名称对文件进行重命名。这样,本发明实现了自动、智能化地对单个文件或批量文件进行重命名,实现了一键自动重命名,提高了重命名效率,并且,重命名后的文件名称(推荐名称)中的关键信息与文件内容相关联,具体可以与文件的原始文件名称、文件内容、文件属性、文件标签相关联,从而,对于不同文件,用户可以根据重命名后的文件名称来区分不同文件的内容。

这里描述的各种技术可结合硬件或软件,或者它们的组合一起实现。从而,本发明的方法和设备,或者本发明的方法和设备的某些方面或部分可采取嵌入有形媒介,例如可移动硬盘、U盘、软盘、CD-ROM或者其它任意机器可读的存储介质中的程序代码(即指令)的形式,其中当程序被载入诸如计算机之类的机器,并被所述机器执行时,所述机器变成实践本发明的设备。

在程序代码在可编程计算机上执行的情况下,移动终端一般包括处理器、处理器可读的存储介质(包括易失性和非易失性存储器和/或存储元件),至少一个输入装置,和至少一个输出装置。其中,存储器被配置用于存储程序代码;处理器被配置用于根据该存储器中存储的所述程序代码中的指令,执行本发明的文件重命名方法。

以示例而非限制的方式,可读介质包括可读存储介质和通信介质。可读存储介质存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息。通信介质一般以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并且包括任何信息传递介质。以上的任一种的组合也包括在可读介质的范围之内。

在此处所提供的说明书中,算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与本发明的示例一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下被实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员应当理解在本文所公开的示例中的设备的模块或单元或组件可以布置在如该实施例中所描述的设备中,或者可替换地可以定位在与该示例中的设备不同的一个或多个设备中。前述示例中的模块可以组合为一个模块或者此外可以分成多个子模块。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。

此外,所述实施例中的一些在此被描述成可以由计算机系统的处理器或者由执行所述功能的其它装置实施的方法或方法元素的组合。因此,具有用于实施所述方法或方法元素的必要指令的处理器形成用于实施该方法或方法元素的装置。此外,装置实施例的在此所述的元素是如下装置的例子:该装置用于实施由为了实施该发明的目的的元素所执行的功能。

如在此所使用的那样,除非另行规定,使用序数词“第一”、“第二”、“第三”等等来描述普通对象仅仅表示涉及类似对象的不同实例,并且并不意图暗示这样被描述的对象必须具有时间上、空间上、排序方面或者以任意其它方式的给定顺序。

尽管根据有限数量的实施例描述了本发明,但是受益于上面的描述,本技术领域内的技术人员明白,在由此描述的本发明的范围内,可以设想其它实施例。此外,应当注意,本说明书中使用的语言主要是为了可读性和教导的目的而选择的,而不是为了解释或者限定本发明的主题而选择的。因此,在不偏离所附权利要求书的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。对于本发明的范围,对本发明所做的公开是说明性的而非限制性的,本发明的范围由所附权利要求书限定。

相关技术
  • 页面文件快速编译方法、装置及存储设备、计算机设备
  • 文件导出方法、装置、计算机设备及计算机可读存储介质
  • 文件合并处理方法、装置、计算设备及计算机存储介质
  • 日志文件格式处理方法、装置、计算机设备和存储介质
  • 文件批量重命名方法、电子设备及计算机可读存储介质
  • 分布式文件系统中重命名方法、装置及分布式文件系统
技术分类

06120116498876