掌桥专利:专业的专利平台
掌桥专利
首页

一种用于林业信息的数据共享方法及系统

文献发布时间:2024-04-18 19:58:26


一种用于林业信息的数据共享方法及系统

技术领域

本发明涉及数据处理技术领域,具体涉及一种用于林业信息的数据共享方法及系统。

背景技术

林业信息通常由不同的机构和部门收集和管理,这些数据可能存在孤立、分散和不一致等情况。林业信息数据中包含诸如森林植被数据、野生动植物数据等不同方面的数据,不同方面的数据中字符的出现频率大有不同,故数据中字符存在较强的局部特性。

算术编码具有较好的数据压缩率,通过算术编码对数据进行压缩可以更好的减少林业信息数据的存储空间,以便进行数据共享。对于林业数据这样的局部特征性特别明显的数据,一般采用对数据进行分段的方式使数据段中各类字符的出现频率差异较大使算术编码的平均编码长度较低。常规的分段方法直接通过全局定长分段,所确定的数据段长度过大会使大量数据段分段后仍然无法达到将数据段内部字符频率差异较大的目的,数据段长度过小会因为数据段过多导致因为分段产生的数据编码额外长度过多,造成编码长度不必要的增加。

发明内容

本发明提供一种用于林业信息的数据共享方法及系统,以解决现有的问题:传统的算术编码无法对林业信息进行良好的压缩。

本发明的一种用于林业信息的数据共享方法及系统采用如下技术方案:

本发明一个实施例提供了一种用于林业信息的数据共享方法,该方法包括以下步骤:

采集林业信息,根据林业信息获取原数据;对原数据进行分段获取原数据中每个初始数据段;

对两个相邻的初始数据段进行第一次左换位获取两个相邻的左一数据段;根据两个相邻的左一数据段获取第一次左换位对两个相邻的初始数据段的优化程度;对两个相邻的初始数据段进行第一次右换位获取两个相邻的右一数据段;根据两个相邻的右一数据段获取第一次右换位对两个相邻的初始数据段的优化程度;

将第一次左换位对两个相邻的初始数据段的优化程度,与第一次右换位对两个相邻的初始数据段的优化程度之和,作为第一次换位对两个相邻的初始数据段的优化程度;根据第一次换位对两个相邻的初始数据段的优化程度,判断是否需要对初始数据段进行调整,获取经过调整后的每个数据段;

根据原数据中经过调整后的每个数据段获取待合并数据段;根据待合并数据段获取与待合并数据段合并的数据段;根据与待合并数据段合并的数据段获取原数据中的每个最终数据段;对原数据中的每个最终数据段使用算数编码压缩,得到算数编码压缩结果,将算数编码压缩结果存储在共享平台之中。

优选的,所述采集林业信息,根据林业信息获取原数据;对原数据进行分段获取原数据中每个初始数据段,包括的具体方法为:

通过现场调查、遥感技术以及无人机采集林业信息,对照着Unicode编码表将林业信息中的所有文本数据转换成Unicode编码;再将得到的Unicode编码转换成16位的二进制编码,将16位的二进制编码拆分成前8位二进制编码与后8位二进制编码,然后对照ASCII编码表将得到的8位二进制编码转换成ASCII字符数据,将得到的ASCII字符数据,将ASCII字符数据与林业信息中的非文本数据共同作为原数据;

预设初始数据段长度

优选的,所述对两个相邻的初始数据段进行第一次左换位获取两个相邻的左一数据段,包括的具体方法为:

通过第一个初始数据段与第二个初始数据段,获得第一个最终数据段与第二个暂定数据段,通过第二个暂定数据段与三个初始数据段,获得第二个最终数据段与第三个暂定数据段,以此类推;

对于第

优选的,所述根据两个相邻的左一数据段获取第一次左换位对两个相邻的初始数据段的优化程度,包括的具体计算公式为:

式中,

优选的,所述对两个相邻的初始数据段进行第一次右换位获取两个相邻的右一数据段,包括的具体方法为:

对于第

优选的,所述根据两个相邻的右一数据段获取第一次右换位对两个相邻的初始数据段的优化程度,包括的具体计算公式为:

式中,

优选的,所述根据第一次换位对两个相邻的初始数据段的优化程度对初始数据段第一次调整,获取经过第一次调整后原数据中的每个数据段;根据经过第一次调整后原数据中的每个数据段,获取原数据中经过调整后的每个数据段,包括的具体方法为:

对于第

将经过第一次调整后的第

获取第二次右换位对经过第一次调整后的第

再将

以此类推,不断对第

优选的,所述对第

对于经过第

优选的,所述根据原数据中经过调整后的每个数据段获取待合并数据段;根据待合并数据段获取与待合并数据段合并的数据段;根据与待合并数据段合并的数据段获取原数据中的每个最终数据段,包括的具体方法为:

预设一个数据段长度阈值

若待合并数据段仅有一个相邻的数据段,则直接将待合并数据段与相邻的数据段合并;若合并数据段有两个相邻的数据段,计算待合并数据段的合并方向参数,其具体的判断公式为:

式中,

本发明的实施例提供了一种用于林业信息的数据共享系统,该系统包括数据采集模块、数据分析模块、数据处理模块以及数据压缩模块,其中:

数据采集模块,用于采集林业信息,根据林业信息获取原数据;对原数据进行分段获取原数据中每个初始数据段;

数据分析模块,用于对两个相邻的初始数据段进行第一次左换位获取两个相邻的左一数据段;根据两个相邻的左一数据段获取第一次左换位对两个相邻的初始数据段的优化程度;对两个相邻的初始数据段进行第一次右换位获取两个相邻的右一数据段;根据两个相邻的右一数据段获取第一次右换位对两个相邻的初始数据段的优化程度;

数据处理模块,用于根据第一次左换位对两个相邻的初始数据段的优化程度以及第一次右换位对两个相邻的初始数据段的优化程度,获取第一次换位对两个相邻的初始数据段的优化程度;根据第一次换位对两个相邻的初始数据段的优化程度对初始数据段第一次调整,获取经过第一次调整后原数据中的每个数据段;根据经过第一次调整后原数据中的每个数据段,获取原数据中经过调整后的每个数据段;

数据压缩模块,用于根据原数据中经过调整后的每个数据段获取待合并数据段;根据待合并数据段获取与待合并数据段合并的数据段;根据与待合并数据段合并的数据段获取原数据中的每个最终数据段;最后对原数据中的每个最终数据段使用算数编码压缩,得到算数编码压缩结果,将算数编码压缩结果存储在共享平台之中。

本发明的技术方案的有益效果是:常规的分段方法直接通过全局定长分段,所确定的数据段长度过大会使大量数据段分段后仍然无法达到将数据段内部字符频率差异较大的目的,数据段长度过小会因为数据段过多导致因为分段产生的数据编码额外长度过多,造成编码长度不必要的增加,故无法对林业信息进行良好的压缩;而本发明通过先对数据进行固定长度地初步分段,获取全部数据段的频率差异程度,根据数据段的频率差异程度对分段边界的字符进行重分配,判断重分配前后所涉及相邻两段数据中字符的频率分布情况获取该字符的最佳存在段,从而获取数据的最佳分段,再对每个数据的最佳分段进行压缩;达到更好的对林业信息进行压缩的目的。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的一种用于林业信息的数据共享方法的步骤流程图;

图2为本发明的一种用于林业信息的数据共享系统的结构框图。

具体实施方式

为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种用于林业信息的数据共享方法及系统,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。

下面结合附图具体的说明本发明所提供的一种用于林业信息的数据共享方法及系统的具体方案。

请参阅图1,其示出了本发明一个实施例提供的一种用于林业信息的数据共享方法的步骤流程图,该方法包括以下步骤:

步骤S001:采集林业信息,根据林业信息获取原数据;对原数据进行分段获取原数据中每个初始数据段。

需要说明的是,本实施例中的林业信息指的是,林地植被数据、野生动物数据以及林业经济数据等;进一步的林地植被数据包括但不限于:植被种类、植被分布、植被面积以及生长状况;野生动物数据包括但不限于,野生动物的种类、数量、分布、保护情况;及林业经济数据包括但不限于:林业产值、木材生产量、林产品贸易。同时林业信息对于林业资源管理、生态环境保护、经济发展和科学研究等诸多方面均有着重要的参考价值,而本实施例作为一种林业信息的数据共享方法,因此首先需要采集林业信息。

具体的,可通过现场调查、遥感技术以及无人机采集林业信息。

需要进一步说明的是,在林业信息中需要记录的数据种类繁杂,若直接对采集的林业信息进行存储则会占用大量的存储空间,为提高存储空间点的使用效率,所以需要对采集的林业信息进行压缩处理。为了能够更好的对林业信息进行压缩,还需要将林业信息中的文本数据转换成更易于压缩的字符。

具体的,对照着Unicode编码表将林业信息中的所有文本数据转换成Unicode编码;再将得到的Unicode编码转换成16位的二进制编码,将16位的二进制编码拆分成前8位二进制编码与后8位二进制编码,然后对照ASCII编码表将得到的8位二进制编码转换成ASCII字符数据,将得到的ASCII字符数据,将ASCII字符数据与林业信息中的非文本数据共同作为原数据。

需要说明的是,在林业信息包含许多不同的类型的数据,而同一类型数据中所包含的数据字符相似程度高,不同类型数据中所包含的数据字符相似程度低;例如,在林地植被数据中,主要包括植被种类、植被生长状况等与植物相关的字符,而在野生动物数据中,主要是动物种类、保护情况等与动物相关的字符。因此对原数据进行分段,将同类型数据放在同一数据段内进行压缩,可以有效的提升数据压缩效果。

具体的,预设初始数据段长度

至此,完成对原数据的初始分段,得到原数据中的每个初始数据段。

步骤S002:对两个相邻的初始数据段进行第一次左换位获取两个相邻的左一数据段;根据两个相邻的左一数据段获取第一次左换位对两个相邻的初始数据段的优化程度;对两个相邻的初始数据段进行第一次右换位获取两个相邻的右一数据段;根据两个相邻的右一数据段获取第一次右换位对两个相邻的初始数据段的优化程度。

需要说明的是,在算术编码中数据段内部字符间的出现频率差异越大对压缩效果越好,即数据段过长,则无法保证数据段内部字符间的出现频率的差异,导致数据压缩效果较差;而数据段过短,则会使划分的数据段数量过多,又由于每个数据段在压缩过程中都需要额外的编码长度来记录编码表,导致编码长度不必要的增加;因此仅简单地确定数据段长度无法得到良好的压效果。为进一步提升林业信息的压缩效果,根还需要根据初始数据段中字符间的出现频率差异程度对初始数据段进行自适应调整。

需要进一步说明的是,在算术编码中,一段数据内不同字符间的出现频率差异越程度大,对其进行算术编码每位字符的平均编码长度也就越小,说明压缩效果就越好。故可以通过不断调整初始数据段,根据经调整后的初始数据段中字符间的出现频率差异程度,计算调整的优化程度。

首先根据第一个初始数据段与第二个初始数据段,得到最终的第一个数据段与暂定的第二个数据段;然后根据暂定的第二个数据段与初始的第三个数据段,得到最终的第二个数据段与暂定的第三个数据段,以此类推,得到原数据最终倒数第二个数据段与暂定的倒数第一个数据段,并将暂定的倒数第一个数据段作为原数据最终倒数第一个数据段。

需要进一步说明的是,在本实施例中根据初始数据段与初始数据段,得到暂定数据段与最终数据段;和根据暂定数据段与初始数据段,得到暂定数据段与最终数据段的过程以及方法完全相同,故在本实施例中仅描述根据暂定数据段与初始数据段,得到暂定数据段与最终数据段的过程。

具体的,对于第

式中,

需要进一步说明的是,在本实施例中以数据段内每种字符出现在该数据段内概率的方差,作为数据段中字符间的出现频率差异程度;而

同理,若

因此,当

至此,得到第一次左换位对第

对于第

式中,

需要进一步说明的是,与第一次左换位对第

至此,得到第一次右换位对第

步骤S003:将第一次左换位对两个相邻的初始数据段的优化程度,与第一次右换位对两个相邻的初始数据段的优化程度之和,作为第一次换位对两个相邻的初始数据段的优化程度;根据第一次换位对两个相邻的初始数据段的优化程度,判断是否需要对初始数据段进行调整,获取经过调整后的每个数据段。

需要说明的是,为了能够更好的对原数据进行压缩,所以需要结合第一次左换位对原数据上各个相邻的初始数据段的优化程度,以及第一次右换位对原数据上各个相邻的初始数据段的优化程度,获取第一次换位对原数据上各个相邻的初始数据段的优化程度;根据第一次换位对原数据上各个相邻的初始数据段的优化程度,判断是否需要对初始数据段进行调整,以及如何对初始数据段进行调整。

具体的,获取第一次换位对两个相邻的初始数据段的优化程度的具体计算公式如下:

式中,

需要进行说明的是,当

具体的,当

进一步的,对第

至此,完成对初始数据段的第一次调整,得到经过第一次调整后的第

对于经过第一次调整后的第

与计算第一次右换位对第

再将

需要说明的是,当

具体的,对经过第一次调整后的第

至此,完成对初始数据段的第二次调整,得到经过第二次调整后原数据中的各个数据段。

以此类推,不断对原数据中的各个数据段进行调整,直至不能对第

至此,得到第

步骤S004:根据原数据中经过调整后的每个数据段获取待合并数据段;根据待合并数据段获取与待合并数据段合并的数据段;根据与待合并数据段合并的数据段获取原数据中的每个最终数据段;对原数据中的每个最终数据段使用算数编码压缩,得到算数编码压缩结果,将算数编码压缩结果存储在共享平台之中。

需要说明的是,由于对原数据中的所有数据段进行了迭代调整,最终会使得原数据中部分数据段的长度过短,又因为每个数据段在压缩过程中都需要额外的编码长度来记录编码表,会导致编码长度不必要的增加,所以为了提升林业信息的压缩效果,需要将长度过短的数据段与相邻的数据段进行合并,达到减少编码长度的目的。

具体的,预设一个数据段长度阈值

若待合并数据段仅有一个相邻的数据段,则直接将待合并数据段与相邻的数据合并;若合并数据段有两个相邻的数据段,则需要判断待合并数据段的与那个相邻的数据段进行合并,其具体的判断公式为:

式中,

需要说明的是,当待合并数据段的合并方向参数大于0时,说明待合并数据段与左侧数据段合并后的数据段中每种字符出现概率的差异程度,大于待合并数据段与右侧数据段合并后的数据段中每种字符出现概率的差异程度;当待合并数据段的合并方向参数小于0时,说明待合并数据段与左侧数据段合并后的数据段中每种字符出现概率的差异程度,小于待合并数据段与右侧数据段合并后的数据段中每种字符出现概率的差异程度。为了使整体数据段内字符出现概率的差异程度更大,所以使待合并数据段与合并后每种字符出现概率的差异程度变化更大的数据段进行合并。

具体的,若

至此,完成对待合并数据段的合并,得到原数据中的各个最终数据段。

最后对原数据中的各个最终数据段使用算数编码压缩,得到算数编码压缩结果,将算数编码压缩结果存储在共享平台之中。当需要对林业信息数据进行访问时,可在共享平台中对林业信息数据进行访问,由于林业信息数据通过分段压缩的方式进行了压缩,只需消耗较小的存储空间就能够完成存储,提高共享效率。

请参阅图2,其示出了本发明一个实施例提供的一种用于林业信息的数据共享系统的结构框图,该系统包括以下模块:

数据采集模块,用于采集林业信息,根据林业信息获取原数据;对原数据进行分段获取原数据中每个初始数据段;

数据分析模块,用于对两个相邻的初始数据段进行第一次左换位获取两个相邻的左一数据段;根据两个相邻的左一数据段获取第一次左换位对两个相邻的初始数据段的优化程度;对两个相邻的初始数据段进行第一次右换位获取两个相邻的右一数据段;根据两个相邻的右一数据段获取第一次右换位对两个相邻的初始数据段的优化程度;

数据处理模块,用于根据第一次左换位对两个相邻的初始数据段的优化程度以及第一次右换位对两个相邻的初始数据段的优化程度,获取第一次换位对两个相邻的初始数据段的优化程度;根据第一次换位对两个相邻的初始数据段的优化程度对初始数据段第一次调整,获取经过第一次调整后原数据中的每个数据段;根据经过第一次调整后原数据中的每个数据段,获取原数据中经过调整后的每个数据段;

数据压缩模块,用于根据原数据中经过调整后的每个数据段获取待合并数据段;根据待合并数据段获取与待合并数据段合并的数据段;根据与待合并数据段合并的数据段获取原数据中的每个最终数据段;最后对原数据中的每个最终数据段使用算数编码压缩,得到算数编码压缩结果,将算数编码压缩结果存储在共享平台之中。

常规的分段方法直接通过全局定长分段,所确定的数据段长度过大会使大量数据段分段后仍然无法达到将数据段内部字符频率差异较大的目的,数据段长度过小会因为数据段过多导致因为分段产生的数据编码额外长度过多,造成编码长度不必要的增加,故无法对林业信息进行良好的压缩;而本发明通过先对数据进行固定长度地初步分段,获取全部数据段的频率差异程度,根据数据段的频率差异程度对分段边界的字符进行重分配,判断重分配前后所涉及相邻两段数据中字符的频率分布情况获取该字符的最佳存在段,从而获取数据的最佳分段,再对每个数据的最佳分段进行压缩;达到更好的对林业信息进行压缩的目的。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 一种用于ETC收费系统的信息发送方法,装置及系统
  • 一种用于智能化公交的路侧信息服务系统及其使用方法
  • 一种用于医院门诊的医患信息共享系统及其方法
  • 一种用于存储系统之间的信息传输方法、装置及介质
  • 移动式园艺、林业、建筑或土壤工作设备和用于确定关于其变化的信息的方法以及系统
  • 一种基于隐私计算的公路工程信息数据共享方法和系统
技术分类

06120116494225