导航：首页> 信号装置>一种WAV语音文件的加密及解密方法

一种WAV语音文件的加密及解密方法

文献发布时间：2023-06-19 10:48:02

技术领域

本发明属于计算机及语音文件存储技术领域，特别涉及一种WAV语音文件的加密及解密方法。

背景技术

随着近些年人工智能领域的高速发展，语音识别、语音合成等领域也涌现出了各种优秀的算法。为了获得更好的识别效果，必定需要大量的语音及标注数据来进行训练和测试。因此拥有较高质量的语音数据往往具有很大的价值，对这些数据的存储和保护就显得尤为关键。在进行语音标注任务时，这些语音文件数据量会格外巨大，这样在数据的传输和存储过程中就会浪费大量宝贵时间；并且同时也会接触到大量的标注人员，对语音数据的安全性产生了一定程度的影响。

发明内容

本发明的目的在于提供一种WAV语音文件的加密及解密方法，解决了语音数据在存储和传输过程中的数据量及数据安全性问题。

为实现上述目的，本发明采用以下技术方案：

本发明提供一种WAV语音文件的加密及解密方法，包括以下步骤：

步骤1：获取原始WAV语音文件；

步骤2：通过编码器处理原始WAV语音文件，所述编码器对WAV语音文件的每个采样点的语音数据进行编码得到压缩的语音数据，再将压缩的语音数据通过乱序排列进行加密得到新的语音数据，最后将原始WAV语音文件的文件头信息块进行乱序排列形成新的文件头，所述新的文件头加上新的语音数据得到新WAV语音文件；

步骤3：通过解码器处理新WAV语音文件，所述解码器先通过读取新WAV语音文件的文件头信息块获得原始的WAV语音文件的文件头信息并生成原始的WAV语音文件的文件头，再通过读取加密参数获得每个采样点数据的加密规则，根据加密规则对将加密过的每个采样点的语音数据进行解码得到原始的语音数据，将WAV语音文件的文件头加上原始的语音数据得到原始的WAV语音文件。

进一步地，所述WAV语音文件采用PCM编码。

进一步地，所述步骤2具体包括：通过编码器处理原始WAV语音文件，所述编码器通过G.711标准编码方式对WAV语音文件的每个采样点的16bit PCM编码的语音数据进行编码得到压缩的8bit语音数据，再将压缩的8bit语音数据通过乱序排列进行加密得到新的8bit语音数据，最后将原始WAV语音文件的文件头信息块进行乱序排列形成新的文件头，所述新的文件头加上新的8bit语音数据得到新WAV语音文件。

进一步地，所述步骤2具体包括：通过解码器处理新WAV语音文件，所述解码器先通过读取新WAV语音文件的文件头信息块获得原始WAV语音文件的文件头信息并生成原始的WAV语音文件的文件头，再通过读取加密参数获得每个采样点数据的加密规则，将加密过的每个采样点的8bit数据解码为G.711标准编码方式编码的8bit数据得到原始的PCM编码的语音数据，将原始的WAV语音文件的文件头加上原始的PCM编码的语音数据得到原始的WAV语音文件。

WAV是一种无损的音频文件格式，WAV符合RIFF(Resource Interchange FileFormat)规范。整个WAV语音文件可分为两部分：前一部分为文件头，后一部分为数据块。文件头分三个区块来表示音频流的编码参数。WAV可以使用多种音频编码方式来压缩其音频流，主要的编码方式为PCM和ADPCM。PCM是Pulse Code Modulation的缩写，即脉冲编码调制，所谓PCM编码就是将声音等模拟信号通过采样量化后得到一个采样值，再予以记录。PCM信号未经过任何编码和压缩处理。与模拟信号比，它不易受传送系统的杂波及失真的影响。动态范围宽，可得到音质相当好的影响效果。PCM数据是最原始的音频数据并且完全无损。通常情况下，我们使用16bit的位宽来表示一个采样点，16kHz的采样频率，即每秒声音信号由16k个采样点来表示，以此来达到较高的音质要求。

相比现有技术，本发明的有益效果在于：

本发明对WAV语音文件的采样数据信息基于G.711编码规则进行重新编码，生成新的文件头信息，得到加密并压缩的WAV语音文件，并且可以通过相应的解码器恢复原始的WAV语音文件，从而使WAV语音文件获得加密和压缩的效果且能保证语音信号质量，同时解决了语音数据在存储和传输过程中的数据安全性问题。

附图说明

图1为本发明一种WAV语音文件的加密及解密方法的流程图。

具体实施方式

以下实施例用于说明本发明，但不用来限定本发明的保护范围。若未特别指明，实施例中所用技术手段为本领域技术人员所熟知的常规手段。下述实施例中的试验方法，如无特别说明，均为常规方法。

实施例一

图1为本发明一种WAV语音文件的加密及解密方法的流程图。本发明一种WAV语音文件的加密及解密方法中包含了加密压缩过程S102～S105和解密解压过程S106～S108。具体步骤如下：

步骤101：获取原始WAV语音文件。

原始WAV语音文件可以是通过麦克风等设备采集的WAV语音文件或准备好的WAV语音文件。WAV语音文件的数据编码格式为16bit PCM编码。

步骤102：编码器通过G.711标准编码方式对WAV语音文件的每个采样点的16bitPCM编码的语音数据进行编码得到压缩的8bit语音数据。

原始WAV语音文件中每个采样点由16bit数据量来存储，经过编码后，每个采样点所占的空间大小变为8bit，即进行了数据压缩处理。

步骤103：将压缩的8bit语音数据通过乱序排列进行加密得到新的8bit语音数据。

G.711标准是一种由国际电信联盟(ITU-T)定制的语音压缩标准，目前G.711标准有两个编码方式：一种是u-law又称mu-law，主要运用于北美和日本；另一种是a-law，主要运用于欧洲和世界其他地区。G.711标准是将14bit(u-Law)或者13bit(a-Law)采样的PCM数据编码成8bit的数据流。针对16bitPCM数据，抽取其中的高14位或13位，以a-law为例具体编码方式如下：

1)取符号位并取反得到s；

2)获取强度位eee，获取方法如表1所示。

表1 G.711标准(a-law)输出形式

3)获取高位样本位wxyz；

4)组合为seeewxyz，将seeewxyz逢偶数位去补数，编码完毕。

步骤104：将原始WAV语音文件的文件头信息块进行乱序排列形成新的文件头。

WAV文件头含有三个信息块，这些信息块存储了WAV文件的一些属性和编码信息，本发明将这些信息块也进行乱序排列，这样保留了原始WAV文件的基本信息。

步骤105：新的文件头加上新的8bit语音数据得到新WAV语音文件。

步骤106：针对加密压缩过的新WAV语音文件，解码器通过读取新WAV语音文件的文件头信息块获得原始WAV语音文件的文件头信息并生成原始的WAV语音文件的文件头。

步骤107：解码器通过读取加密参数获得每个采样点数据的加密规则，将加密过的每个采样点的8bit数据解码为G.711标准编码方式编码的8bit数据得到原始的PCM编码的语音数据。

值得说明的是，此时的数据恢复并不是和原始PCM编码数据完全一致，会有一定量的信息损失，不过对音频的质量影响不大，可以忽略不记。

步骤108：将原始的WAV语音文件的文件头加上原始的PCM编码的语音数据得到原始的WAV语音文件。

以上所述之实施例，只是本发明的较佳实施例而已，仅仅用以解释本发明，并非限制本发明实施范围，对于本技术领域的技术人员来说，当然可根据本说明书中所公开的技术内容，通过置换或改变的方式轻易做出其它的实施方式，故凡在本发明的原理上所作的变化和改进等，均应包括于本发明申请专利范围内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张文林;冯立恒;李喜坤;陈琦;何振华;牛铜;贺晓年;
专利申请人：中国人民解放军战略支援部队信息工程大学;郑州信大先进技术研究院;