掌桥专利:专业的专利平台
掌桥专利
首页

一种OFD电子文件的数据处理方法及系统

文献发布时间:2023-06-19 11:49:09



技术领域

本发明涉及数据处理技术领域,并且更具体地,涉及一种OFD电子文件的数据处理方法及系统。

背景技术

在信息化时代,数据作为一种知识资产,其内容本身蕴含着高价值的信息,需要防止被人非法获取和复制传播。目前,在无网络环境下电子文件传输是通过硬件存储介质传输文件。带来的安全隐患是光盘如果丢失,内容可能会被窃取,并且不太便捷。

因此,需要一种能够对电子文件进行处理,以安全地进行数据传输的方法。

发明内容

本发明提出一种OFD电子文件的数据处理方法及系统,以解决如何对电子文件进行处理,以安全地进行数据传输的问题。

为了解决上述问题,根据本发明的一个方面,提供了一种OFD电子文件的数据处理方法,所述方法包括:

对第一用户发送的第一请求进行解析,获取源文件,并对所述源文件进行数据转化,以获取与所述源文件对应的二进制电子数据;

按照第一数据长度阈值对所述二进制电子数据进行分码处理,以获取至少一页第一字节流段码数据,并依次为每页的第一字节流段码数据设置页码标识;

按照第二数据长度阈值依次对每页的第一字节流段码数据进行分码处理,以获取多个第二字节流段码数据,并依次为每个第二字节流段码数据设置位置标识;

基于预设的数据封装规则分别将每个第二字节流段码数据封装为对应的二维码数据,并根据与每个第二字节流段码数据对应的位置标识和页码标识将每个二维码数据存储于预设的文档中,以获取中间转换文档,并将所述中间转换文档返回至所述第一用户;

对第二用户发送的第二请求进行解析,以获取所述中间转换文档,并基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个第二字节流段码数据;

根据获取的每个第二字节流段码数据对应的位置标识和页码标识按顺序进行字节流段码数据的组合,以获取所述源文件对应的二进制电子数据,根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。

优选地,其中所述方法还包括:

根据中间转换文档的空白页的存储空间计算每个空白页的最大二维码数据数量,并根据所述最大二维码数据数量和每个二维码数据对应的第二字节流段码数据的大小计算每个空白页对应的第一字节流段码数据的大小,并根据二进制电子数据大小和第一字节流段码数据的大小确定第一数据长度阈值。

优选地,其中所述方法还包括:

在获取与所述源文件对应的二进制电子数据之后,根据所述第一请求按照预设的加密策略对与所述源文件对应的二进制电子数据进行加密处理;

当所述源文件经过加密处理时,在基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析前,验证密码的准确性,若密码正确,则进行解析;反之,则提示密码错误信息;以及当所述源文件经过加密处理时,在根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原之前,按照所述预设的加密策略对经过加密的源文件对应的二进制电子数据进行解密处理,以获取所述源文件对应的二进制电子数据。

优选地,其中所述二进制电子数据,包括:源文件的内容和版式对应的二进制数据。

根据本发明的另一个方面,提供了一种OFD电子文件的数据处理系统,包括:

数据转化单元,用于对第一用户发送的第一请求进行解析,获取源文件,并对所述源文件进行数据转化,以获取与所述源文件对应的二进制电子数据;

第一拆分单元,用于按照第一数据长度阈值对所述二进制电子数据进行分码处理,以获取至少一页第一字节流段码数据,并依次为每页的第一字节流段码数据设置页码标识;

第二拆分单元,用于按照第二数据长度阈值依次对每页的第一字节流段码数据进行分码处理,以获取多个第二字节流段码数据,并依次为每个第二字节流段码数据设置位置标识;

数据封装单元,用于基于预设的数据封装规则分别将每个第二字节流段码数据封装为对应的二维码数据,并根据与每个第二字节流段码数据对应的位置标识和页码标识将每个二维码数据存储于预设的文档中,以获取中间转换文档,并将所述中间转换文档返回至所述第一用户;

数据解析单元,用于接收第二用户发送的中间转换文档,基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个第二字节流段码数据;

文件还原单元,用于根据获取的每个第二字节流段码数据对应的位置标识和页码标识按顺序进行字节流段码数据的组合,以获取所述源文件对应的二进制电子数据,根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。

优选地,其中所述系统还包括:

第一数据长度阈值确定单元,用于根据中间转换文档的空白页的存储空间计算每个空白页的最大二维码数据数量,并根据所述最大二维码数据数量和每个二维码数据对应的第二字节流段码数据的大小计算每个空白页对应的第一字节流段码数据的大小,并根据二进制电子数据大小和第一字节流段码数据的大小确定第一数据长度阈值。

优选地,其中所述系统还包括:

加密单元,用于在获取与所述源文件对应的二进制电子数据之后,根据所述第一请求按照预设的加密策略对与所述源文件对应的二进制电子数据进行加密处理;

验证单元,用于当所述源文件经过加密处理时,在基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析前,验证密码的准确性,若密码正确,则进行解析;反之,则提示密码错误信息;以及

解密单元,用于当所述源文件经过加密处理时,在根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原之前,按照所述预设的加密策略对经过加密的源文件对应的二进制电子数据进行解密处理,以获取所述源文件对应的二进制电子数据。

优选地,其中所述二进制电子数据,包括:源文件的内容和版式对应的二进制数据。

本发明提供了一种OFD电子文件的数据处理方法及系统,在无网环境下先加密源文件,以多个条码的形式进行封装保护,之后再通过纸质或电子文件形式传输带条码的中间转换文档,当用户获取所述中间转换文档后,通过解析和解密获取源文件,在传输的过程中,只有条码在一定的条件下被解密后,才能原封不动的还原电子文件内容,如果条码没有被解密,即使看到条码也窃取不到文件真实的内容;本发明的方法比传统用光盘传输电子文件更便捷和安全。

附图说明

通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:

图1为根据本发明实施方式的OFD电子文件的数据处理方法100的流程图;

图2为根据本发明实施方式的分码处理后数据的存储结构示意图;

图3为根据本发明实施方式的中间转换文档的示意图;

图4为根据本发明实施方式的生成中间转换文档时出现错误的提示图;

图5为根据本发明实施方式的保存中间转换文档的示意图;

图6为根据本发明实施方式的OFD电子文件的数据处理系统500的结构示意图。

具体实施方式

现在参考附图介绍本发明的示例性实施方式,然而,本发明可以用许多不同的形式来实施,并且不局限于此处描述的实施例,提供这些实施例是为了详尽地且完全地公开本发明,并且向所属技术领域的技术人员充分传达本发明的范围。对于表示在附图中的示例性实施方式中的术语并不是对本发明的限定。在附图中,相同的单元/元件使用相同的附图标记。

除非另有说明,此处使用的术语(包括科技术语)对所属技术领域的技术人员具有通常的理解含义。另外,可以理解的是,以通常使用的词典限定的术语,应当被理解为与其相关领域的语境具有一致的含义,而不应该被理解为理想化的或过于正式的意义。

图1为根据本发明实施方式的OFD电子文件的数据处理方法100的流程图。如图1所示,本发明提供的OFD电子文件的数据处理方法,在无网环境下先加密源文件,以多个条码的形式进行封装保护,之后再通过纸质或电子文件形式传输带条码的中间转换文档,当用户获取所述中间转换文档后,通过解析和解密获取源文件,在传输的过程中,只有条码在一定的条件下被解密后,才能原封不动的还原电子文件内容,如果条码没有被解密,即使看到条码也窃取不到文件真实的内容;本发明的方法比传统用光盘传输电子文件更便捷和安全。本发明实施方提供的OFD电子文件的数据处理方法100,从步骤101处开始,在步骤101对第一用户发送的第一请求进行解析,获取源文件,并对所述源文件进行数据转化,以获取与所述源文件对应的二进制电子数据。

优选地,其中所述二进制电子数据,包括:源文件的内容和版式对应的二进制数据。

在本发明中,第一用户发送第一请求至服务器端,服务器端对第一请求进行解析,获取请求的内容和待传输的源文件,并对所述源文件进行数据转化,以获取与所述源文件对应的二进制电子数据。还可以再根据第一用户的要求采用不同的加解密方式对原始的二进制电子数据进行加密保护。

在步骤102,按照第一数据长度阈值对所述二进制电子数据进行分码处理,以获取至少一页第一字节流段码数据,并依次为每页的第一字节流段码数据设置页码标识。

优选地,其中所述方法还包括:

根据中间转换文档的空白页的存储空间计算每个空白页的最大二维码数据数量,并根据所述最大二维码数据数量和每个二维码数据对应的第二字节流段码数据的大小计算每个空白页对应的第一字节流段码数据的大小,并根据二进制电子数据大小和第一字节流段码数据的大小确定第一数据长度阈值。

在本发明中,第一数据长度阈值为设定的中间转换文档的页数。可以根据需求设置第一数据长度阈值,也可以根据系统自动计算的页数确定第一数据长度阈值。若一空白页的存储大小为40k-100k,则当数据大于100k时,可以形成多页。在确定每个空白页的存储空间的大小后,除以每个二维码数据的大小即可得到最大二维码数据数量。然后,根据所述最大二维码数据数量和每个二维码数据对应的第二字节流段码数据的大小的乘积即可计算每个空白页对应的第一字节流段码数据的大小。然后,将源文件对应的二进制电子数据的大小除以第一字节流段码数据的大小,即可得到第一数据长度阈值,即中间转换文档的页数。如果,第一数据长度阈值不为整数,即不是一个整页,则可向上取整。例如,若相除的结果为4.2,则向上取整确定第一数据长度阈值为5,即中间转换文档的页数为5页。

在步骤103,按照第二数据长度阈值依次对每页的第一字节流段码数据进行分码处理,以获取多个第二字节流段码数据,并依次为每个第二字节流段码数据设置位置标识。

在本发明中,对每页的字节流段码数据再次进行分码处理,并依次为每个第二字节流段码数据设置位置标识。同时,将每个字节流段码数据和对应的位置标识以及页码标识进行关联。其中,页码标识和位置标识用于指示字节流段码数据之间的序列关系;二进制电子数据,包括:源文件的内容和版式对应的二进制数据。

在步骤104,基于预设的数据封装规则分别将每个第二字节流段码数据封装为对应的二维码数据,并根据与每个第二字节流段码数据对应的位置标识和页码标识将每个二维码数据存储于预设的文档中,以获取中间转换文档,并将所述中间转换文档返回至所述第一用户。

在本发明中,基于预设的数据封装规则将每个字节流段码数据封装为对应的二维码数据,然后根据与每个第二字节流段码数据对应的位置标识和页码标识将二维码数据插入到预设文档的空白页中,插入完成之后,即可得到中间转换文档,并将中间转换文档返回至第一用户。中间转换文档可以为ofd格式。完成数据封装后,第一用户可以将中间转换文档通过纸质或电子文件形式传输至第二用户。当通过纸质文件传输所述中间转换文档时,第二用户将中间转换文档扫描成图片,存放到文件夹中,第二用户通过还原客户端将文件夹中的数据发送至服务器端,服务器端即可进行二维码数据的无序还原,并根据页码标识和位置标识对得到的字节流段码数据进行排序,从而得到源文件。

本发明的分码处理后数据的存储结构如图2所示,其中,页码标识(即页码)、位置标识(即数据位置)和二维码数据一一对应。

如图3所示,为某文件对应的中间转换文档的示意图,每个小方块代表一个二维码数据。另外,若在生成中间转换文档时出现错误,则退进行错误提示“本文件内并非文码”,如图4所示。保存中间转换文档的示意图如图5所示。用户可以自定义中间转换文档的名称。

在步骤105,对第二用户发送的第二请求进行解析,以获取所述中间转换文档,并基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个第二字节流段码数据。

在步骤106,根据获取的每个第二字节流段码数据对应的位置标识和页码标识按顺序进行字节流段码数据的组合,以获取所述源文件对应的二进制电子数据,根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。

在本发明中,第二用户会根据中间转换文档发送第二请求至服务器端,服务器端会对所述第二请求进行解析,以获取第二文档和请求内容,并基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个字节流段码数据,再根据获取的每个字节流段码对应的页码标识和位置标识按顺序对每个字节流段码数据进行数据组合,即可得到源文件对应的二进制电子数据,然后根据所述二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。如图4所示,为获取源文件的示意图,其中,第一用户和第二用户可以为同一用户。

优选地,其中所述方法还包括:

在获取与所述源文件对应的二进制电子数据之前,根据所述第一请求按照预设的加密策略对所述源文件进行加密处理;

当所述源文件经过加密处理时,在基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析前,验证密码的准确性,若密码正确,则进行解析;反之,则提示密码错误信息;以及当所述源文件经过加密处理时,在根据所述二进制电子数据进行所述源文件的还原之前,按照所述预设的加密策略对经过加密的源文件对应的二进制电子数据进行解密处理,以获取所述源文件对应的二进制电子数据。

在本发明中,为了更进一步地保证数据的安全,还可以在获取与所述源文件对应的二进制电子数据之后,根据所述第一请求按照预设的加密策略对与所述源文件对应的二进制电子数据进行加密处理,然后将经过加密处理的二进制电子数据进行拆分。其中,加密策略可以自定义,可以为对称加密算法也可以为非对称加密算。例如,采用SM4分组密码算法。SM4分组密码算法是我国自主设计的分组对称密码算法,用于实现数据的加密/解密运算,以保证数据和信息的机密性。要保证一个对称密码算法的安全性的基本条件是其具备足够的密钥长度,SM4算法与AES算法具有相同的密钥长度分组长度128比特,因此在安全性上高于3DES算法。国产SM4是是将明文数据按固定长度进行分组,然后在同一密钥控制下逐组进行加密,从而将各个明文分组变换成一个等长的密文分组的密码。其中二进制明文分组的长度称为该分组密码的分组规模。

当所述源文件经过加密处理时,在基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析前,验证密码的准确性,若密码正确,则进行解析;反之,则提示密码错误信息。当密码验证通过后,基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个字节流段码数据,然后根据获取的每个字节流段码数据对应的页码标识和位置标识按顺序对字节流段码数据进行数据组合,以获取经过加密的源文件对应的二进制电子数据,然后按照所述预设的加密策略对经过加密的源文件对应的二进制电子数据进行解密处理,以获取所述源文件对应的二进制电子数据,并根据所述源文件对应的二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。

本发明的OFD电子文件的数据处理方法,通过数据转化对文件进行数据提取并转化为二进制电子数据(包括内容和版式),并根据客户要求采用不同的加解密方式对原始数据进行保护,再把文件二进制电子数据(包括内容和版式)拆分成多个字节流段码数据,确定每个字节流段码数据对应的页码标识和位置标识,并将字节流段码数据封装为二维码数据后存储到中间转换文档,实现封装;用户通过解析文档所有的二维码,解析出每一个二维码数据对应的字节流段码数据,并根据每个字节流段码数据对应的页码标识和位置标识等信息重新组合,以获取二进制数据,并根据客户要求采用不同的解密方式对重新组合后的内容进行解密,实现还原出原始的二进制电子数据(包括内容和版式),并转化,以重新展示源文件的内容。

另外,除了OFD电子文件,本发明的方法也适用于PDF、DOC等其他版式的电子文件。

本发明通过二维码的技术实现文件内容的转变,以二维码的方式展示和传输,在接收人端重新提取组装还原文件内容,能够实现文件在传输过程中内容的隐秘性和防篡改、防伪造的目的,能够安全地实现电子文件的传输。

图6为根据本发明实施方式的OFD电子文件的数据处理系统600的结构示意图。如图6所示,本发明实施方式提供的OFD电子文件的数据处理系统600,包括:数据转化单元601、第一拆分单元602、第二拆分单元603、数据封装单元604、数据解析单元605和文件还原单元606。

优选地,所述数据转化单元601,用于对第一用户发送的第一请求进行解析,获取源文件,并对所述源文件进行数据转化,以获取与所述源文件对应的二进制电子数据。

优选地,其中所述二进制电子数据,包括:源文件的内容和版式对应的二进制数据。

优选地,所述第一拆分单元602,用于按照第一数据长度阈值对所述二进制电子数据进行分码处理,以获取至少一页第一字节流段码数据,并依次为每页的第一字节流段码数据设置页码标识。

优选地,其中所述系统还包括:

第一数据长度阈值确定单元,用于根据中间转换文档的空白页的存储空间计算每个空白页的最大二维码数据数量,并根据所述最大二维码数据数量和每个二维码数据对应的第二字节流段码数据的大小计算每个空白页对应的第一字节流段码数据的大小,并根据二进制电子数据大小和第一字节流段码数据的大小确定第一数据长度阈值。

优选地,所述第二拆分单元603,用于按照第二数据长度阈值依次对每页的第一字节流段码数据进行分码处理,以获取多个第二字节流段码数据,并依次为每个第二字节流段码数据设置位置标识。

优选地,所述数据封装单元604,用于基于预设的数据封装规则分别将每个第二字节流段码数据封装为对应的二维码数据,并根据与每个第二字节流段码数据对应的位置标识和页码标识将每个二维码数据存储于预设的文档中,以获取中间转换文档,并将所述中间转换文档返回至所述第一用户。

优选地,所述数据解析单元605,用于接收第二用户发送的中间转换文档,基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析,以获取每个第二字节流段码数据。

优选地,所述文件还原单元606,用于根据获取的每个第二字节流段码数据对应的位置标识和页码标识按顺序进行字节流段码数据的组合,以获取所述源文件对应的二进制电子数据,根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原,获取所述源文件,并将所述源文件返回至所述第二用户。

优选地,其中所述系统还包括:

加密单元,用于在获取与所述源文件对应的二进制电子数据之后,根据所述第一请求按照预设的加密策略对与所述源文件对应的二进制电子数据进行加密处理;

验证单元,用于当所述源文件经过加密处理时,在基于预设的数据封装规则对所述中间转换文档中的每个二维码数据进行解析前,验证密码的准确性,若密码正确,则进行解析;反之,则提示密码错误信息;以及

解密单元,用于当所述源文件经过加密处理时,在根据获取的所述源文件对应的二进制电子数据进行所述源文件的还原之前,按照所述预设的加密策略对经过加密的源文件对应的二进制电子数据进行解密处理,以获取所述源文件对应的二进制电子数据。

本发明的实施例的OFD电子文件的数据处理系统600与本发明的另一个实施例的OFD电子文件的数据处理方法100相对应,在此不再赘述。

已经通过参考少量实施方式描述了本发明。然而,本领域技术人员所公知的,正如附带的专利权利要求所限定的,除了本发明以上公开的其他的实施例等同地落在本发明的范围内。

通常地,在权利要求中使用的所有术语都根据他们在技术领域的通常含义被解释,除非在其中被另外明确地定义。所有的参考“一个/所述/该[装置、组件等]”都被开放地解释为所述装置、组件等中的至少一个实例,除非另外明确地说明。这里公开的任何方法的步骤都没必要以公开的准确的顺序运行,除非明确地说明。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

相关技术
  • 一种OFD电子文件的数据处理方法及系统
  • 一种线上电子文件签署系统及电子文件签署方法
技术分类

06120113065915