掌桥专利:专业的专利平台
掌桥专利
首页

一种企业通讯数据压缩系统

文献发布时间:2023-06-19 10:27:30


一种企业通讯数据压缩系统

技术领域

本发明涉及一种数据压缩系统,具体为一种企业通讯数据压缩系统,属于数据压缩技术领域。

背景技术

数据压缩是指在不丢失有用信息的前提下,缩减数据量以减少存储空间,提高其传输、存储和处理效率,或按照一定的算法对数据进行重新组织,减少数据的冗余和存储的空间的一种技术方法。数据压缩包括有损压缩和无损压缩。在计算机科学和信息论中,数据压缩或者源编码是按照特定的编码机制用比未经编码少的数据位元表示信息的过程。

现有的数据压缩大多是自主的数据压缩,没有根据对存储数据的本身进行判定压缩的与否以及压缩方式的选择。

为了解决上述技术问题,本发明提供如下技术方案。

发明内容

本发明的目的在于提供一种企业通讯数据压缩系统,用于解决现有的技术没有根据对存储数据的本身进行判定压缩的与否以及压缩方式的选择问题。本发明通过信息采集模块、信息处理模块、压缩分配模块、存储分配模块、历史记录模块、服务器、数据存储模块以及数据共享模块的配合,将通讯数据文件进行压缩方式以及存储位置的判定,避免了通讯数据文件积累存储占用空间大的问题。

本发明的目的可以通过以下技术方案实现:一种企业通讯数据压缩系统,包括信息采集模块、信息处理模块、压缩分配模块、存储分配模块、历史记录模块、服务器、数据存储模块以及数据共享模块;所述服务器为企业内部通讯服务器,所述信息采集模块与服务器直接相连,用于采集企业内通讯数据信息,所述信息处理模块用于处理信息采集模块采集的通讯数据信息,所述信息处理模块将处理后的结果输出至压缩分配模块以及存储分配模块,所述压缩分配模块用于根据数据处理的结果采取不同的数据压缩方式,所述压缩方式包括有损压缩以及无损压缩;所述存储分配模块用于根据数据处理的结果进行存储分配;所述数据存储模块分为临时存储单元与长期存储单元,所述临时储存单元的数据调用速度大于长期存储单元的数据调用速度;

所述历史记录模块用于记录通讯数据信息的压缩与存储记录,并通过数据共享模块在服务器内共享;

所述信息处理模块用于接收并处理信息采集模块采集的数据信息,并将处理后的结果输出至压缩分配模块与存储分配模块,具体的信息处理的过程包括以下步骤:

步骤一:通过信息采集模块采集通讯数据信息,采集的通讯数据信息包括数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;

步骤二:信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;

步骤三:信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

步骤四:信息处理模块设定压缩系数阈值,当压缩系数Kyi大于等于压缩系数阈值时,表示通讯数据文件i进行压缩,将压缩信号发送至压缩分配模块;若压缩系数Kyi小于压缩系数阈值时,表示通讯数据文件i不进行压缩,执行步骤五;

步骤五:信息处理模块从数据存储模块中调用用于计算存储系数Cci的计算公式,计算公式为

步骤六:设定存储系数阈值,若存储系数Cci大于等于存储系数阈值,则发送临时存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在临时存储单元中;若存储系数Cci小于存储系数阈值,则发送长期存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在长期存储单元中。

优选的,步骤一中重要度Zi的获取方式为以下过程:

获取企业通讯中出现的关键词,并将关键词存储在数据存储模块中,获取通讯数据文件i中不同关键词出现的个数,其中关键词相同的记为一次,将关键词出现的次数标记为重要度Zi。

优选的,所述压缩分配模块用于对通讯数据文件进行数据压缩,压缩分配模块包括有损压缩单元以及无损压缩单元,具体的分配方式包括以下:

当压缩分配模块接收到信息处理模块发送的压缩信号后,压缩分配模块发送数据采集信号至信息采集模块;

信息采集模块获取通讯数据文件i中出现的关键词j,与关键词j出现的次数Kj;计算求和关键词出现的总次数K,设定关键词阈值,当K大于等于关键词阈值时,压缩分配模块对通讯数据文件i采取无损压缩,将通讯数据文件i分配至无损压缩单元进行无损压缩,当K小于关键词阈值时,压缩分配模块对通讯数据文件i采取有损压缩,将通讯数据文件i分配至有损压缩单元进行有损压缩。

优选的,所述历史记录模块用于记录通讯数据文件i的压缩与否以及存储位置,并将通讯数据文件i的压缩时间、压缩后的大小、压缩后的存储位置记录在历史记录表中,企业员工登陆企业通讯数据压缩系统进行历史记录查询。

优选的,所述数据存储模块按照存储时长分为临时存储单元与长期存储单元,所述临时储存单元的数据调用速度大于长期存储单元的数据调用速度;所述数据存储模块还用于存储信息采集模块采集通讯数据信息以及信息处理模块处理后的数据,还用于存储计算存储系数Cci的计算公式以及计算压缩系数Kyi的计算公式,并在接收到信息处理模块的调用后,将计算公式

优选的,企业通讯数据压缩系统的压缩过程包括以下步骤:

步骤S1:通过信息采集模块采集数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;

步骤S2:信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

步骤S21:当压缩分配模块接收到信息处理模块发送的压缩信号后,压缩分配模块发送数据采集信号至信息采集模块;

步骤S22:信息采集模块获取通讯数据文件i中出现的关键词j,与关键词j出现的次数Kj;计算求和关键词出现的总次数K;

步骤S23:设定关键词阈值,当K大于等于关键词阈值时,压缩分配模块对通讯数据文件i采取无损压缩,将通讯数据文件i分配至无损压缩单元进行无损压缩,当K小于关键词阈值时,压缩分配模块对通讯数据文件i采取有损压缩,将通讯数据文件i分配至有损压缩单元进行有损压缩;

步骤S3:信息处理模块从数据存储模块中调用用于计算存储系数Cci的计算公式,计算公式为

步骤S4:设定存储系数阈值,若存储系数Cci大于等于存储系数阈值,则发送临时存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在临时存储单元中;若存储系数Cci小于存储系数阈值,则发送长期存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在长期存储单元中。

与现有技术相比,本发明的有益效果是:

1、本发明设置有信息处理模块,信息处理模块用于对压缩方式以及存储位置的判定,通过信息采集模块采集通讯数据信息,采集的通讯数据信息包括数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

2、重要度Zi的获取方式为以下过程:获取企业通讯中出现的关键词,并将关键词存储在数据存储模块中,获取通讯数据文件i中不同关键词出现的个数,其中关键词相同的记为一次,将关键词出现的次数标记为重要度Zi;压缩分配模块用于对通讯数据文件进行数据压缩,压缩分配模块包括有损压缩单元以及无损压缩单元,具体的分配方式包括以下:当压缩分配模块接收到信息处理模块发送的压缩信号后,压缩分配模块发送数据采集信号至信息采集模块;信息采集模块获取通讯数据文件i中出现的关键词j,与关键词j出现的次数Kj;计算求和关键词出现的总次数K,设定关键词阈值,当K大于等于关键词阈值时,压缩分配模块对通讯数据文件i采取无损压缩,将通讯数据文件i分配至无损压缩单元进行无损压缩,当K小于关键词阈值时,压缩分配模块对通讯数据文件i采取有损压缩,将通讯数据文件i分配至有损压缩单元进行有损压缩。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的原理框图。

具体实施方式

下面将结合实施例对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

请参阅图1所示,一种企业通讯数据压缩系统,包括信息采集模块、信息处理模块、压缩分配模块、存储分配模块、历史记录模块、服务器、数据存储模块以及数据共享模块;所述服务器为企业内部通讯服务器,所述信息采集模块与服务器直接相连,用于采集企业内通讯数据信息,所述信息处理模块用于处理信息采集模块采集的通讯数据信息,所述信息处理模块将处理后的结果输出至压缩分配模块以及存储分配模块,所述压缩分配模块用于根据数据处理的结果采取不同的数据压缩方式,所述压缩方式包括有损压缩以及无损压缩;所述存储分配模块用于根据数据处理的结果进行存储分配;所述数据存储模块分为临时存储单元与长期存储单元,所述临时储存单元的数据调用速度大于长期存储单元的数据调用速度;

所述历史记录模块用于记录通讯数据信息的压缩与存储记录,并通过数据共享模块在服务器内共享;

所述信息处理模块用于接收并处理信息采集模块采集的数据信息,并将处理后的结果输出至压缩分配模块与存储分配模块,具体的信息处理的过程包括以下步骤:

步骤一:通过信息采集模块采集通讯数据信息,采集的通讯数据信息包括数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;

步骤二:信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;

步骤三:信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

步骤四:信息处理模块设定压缩系数阈值,当压缩系数Kyi大于等于压缩系数阈值时,表示通讯数据文件i进行压缩,将压缩信号发送至压缩分配模块;若压缩系数Kyi小于压缩系数阈值时,表示通讯数据文件i不进行压缩,执行步骤五;

步骤五:信息处理模块从数据存储模块中调用用于计算存储系数Cci的计算公式,计算公式为

步骤六:设定存储系数阈值,若存储系数Cci大于等于存储系数阈值,则发送临时存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在临时存储单元中;若存储系数Cci小于存储系数阈值,则发送长期存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在长期存储单元中。

其中,步骤一中重要度Zi的获取方式为以下过程:

获取企业通讯中出现的关键词,并将关键词存储在数据存储模块中,获取通讯数据文件i中不同关键词出现的个数,其中关键词相同的记为一次,将关键词出现的次数标记为重要度Zi。

其中,所述压缩分配模块用于对通讯数据文件进行数据压缩,压缩分配模块包括有损压缩单元以及无损压缩单元,具体的分配方式包括以下:

当压缩分配模块接收到信息处理模块发送的压缩信号后,压缩分配模块发送数据采集信号至信息采集模块;

信息采集模块获取通讯数据文件i中出现的关键词j,与关键词j出现的次数Kj;计算求和关键词出现的总次数K,设定关键词阈值,当K大于等于关键词阈值时,压缩分配模块对通讯数据文件i采取无损压缩,将通讯数据文件i分配至无损压缩单元进行无损压缩,当K小于关键词阈值时,压缩分配模块对通讯数据文件i采取有损压缩,将通讯数据文件i分配至有损压缩单元进行有损压缩。

其中,所述历史记录模块用于记录通讯数据文件i的压缩与否以及存储位置,并将通讯数据文件i的压缩时间、压缩后的大小、压缩后的存储位置记录在历史记录表中,企业员工登陆企业通讯数据压缩系统进行历史记录查询。

其中,所述数据存储模块按照存储时长分为临时存储单元与长期存储单元,所述临时储存单元的数据调用速度大于长期存储单元的数据调用速度;所述数据存储模块还用于存储信息采集模块采集通讯数据信息以及信息处理模块处理后的数据,还用于存储计算存储系数Cci的计算公式以及计算压缩系数Kyi的计算公式,并在接收到信息处理模块的调用后,将计算公式

其中,企业通讯数据压缩系统的压缩过程包括以下步骤:

步骤S1:通过信息采集模块采集数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;

步骤S2:信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

步骤S21:当压缩分配模块接收到信息处理模块发送的压缩信号后,压缩分配模块发送数据采集信号至信息采集模块;

步骤S22:信息采集模块获取通讯数据文件i中出现的关键词j,与关键词j出现的次数Kj;计算求和关键词出现的总次数K;

步骤S23:设定关键词阈值,当K大于等于关键词阈值时,压缩分配模块对通讯数据文件i采取无损压缩,将通讯数据文件i分配至无损压缩单元进行无损压缩,当K小于关键词阈值时,压缩分配模块对通讯数据文件i采取有损压缩,将通讯数据文件i分配至有损压缩单元进行有损压缩;

步骤S3:信息处理模块从数据存储模块中调用用于计算存储系数Cci的计算公式,计算公式为

步骤S4:设定存储系数阈值,若存储系数Cci大于等于存储系数阈值,则发送临时存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在临时存储单元中;若存储系数Cci小于存储系数阈值,则发送长期存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在长期存储单元中。

上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数由本领域的技术人员根据实际情况设定。

本发明的工作原理包括以下过程:通过信息采集模块采集数据存储时间、数据存储大小、数据存储后的调用次数以及数据重要度;并将获取的通讯数据信息发送至信息处理模块;并获取当前时间T;信息处理模块接收通讯数据信息后,分别标记为Ti、Di、Ci、Zi;其中i表示通讯数据文件编号,i=1,…,n;信息处理模块从数据存储模块中调用用于计算压缩系数Kyi的计算公式,计算公式为

信息处理模块从数据存储模块中调用用于计算存储系数Cci的计算公式,计算公式为

设定存储系数阈值,若存储系数Cci大于等于存储系数阈值,则发送临时存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在临时存储单元中;若存储系数Cci小于存储系数阈值,则发送长期存储信号至数据存储模块,数据存储模块接收到信号后,将通讯数据文件i存储在长期存储单元中。

在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。

相关技术
  • 一种企业通讯数据压缩系统
  • 一种企业用即时通讯工具的数据统合系统
技术分类

06120112550145