掌桥专利:专业的专利平台
掌桥专利
首页

一种基于深度学习的端到端手发等幅电报译码系统

文献发布时间:2023-06-19 12:13:22


一种基于深度学习的端到端手发等幅电报译码系统

技术领域

本发明属于手发等幅电报译码技术领域,尤其涉及一种基于深度学习的端到端手发等幅电报译码系统。

背景技术

等幅电报(Continuous Wave,CW)本质是一种振幅键控调制信号,一般利用摩尔斯(Morse)码作为发送信息。它通过电键控制发信机产生短信号“.”和长信号“_”,并利用其不同组合表示不同的字符,从而组成词组和句子。CW信号具有信号带宽窄、抗干扰能力强、编码方式简单等优点,一直作为一种重要的短波无线通信手段,活跃在航空、海事、军事通信等领域。

等幅电报译码,用于将CW信号转写为对应的报文。当前,等幅电报的译码方法主要分为两种。一种是统计判决的方法,最典型的是基于传统的机器学习的方法,如支持向量机、聚类等,它首先对信号进行时频特征提取,得到信号的时频图,然后通过支持向量机、聚类等分类算法对点、划和不同间隔进行识别。最后,根据码本将识别得到的点划序列转化为报文。另一种是基于深度学习的CRNN方法,它采用CNN(Convolution Neural Networks,卷积神经网络)和RNN(Recurrent Neural Networks,循环神经网络)级联的方式提取Morse码的特征和上下文关联信息,然后通过全连接层,采用CTC(Connectionist TemporalClassification,连接时序分类)的损失函数作为目标函数,得到输出序列的后验概率,进而得到预测报文。

上述两种译码方法都存在一定的缺陷,对于传统的机器学习方法,仅仅利用了Morse信号时域码长的特征,忽略了Morse码上下文的关联信息,当码长出现抖动时,该类方法的有效性显著下降。对于后者,该模型虽然能达到较好的收敛效果,但是它未考虑CW信号的信道传输特性,没有对CW信号做预处理,直接计算信号的时频矩阵。同时,该方法采用CNN对时频矩阵进行特征提取,在提取频域特征的同时也对时域进行了降维且在卷积操作时没有对通道数进行拓展,在一定程度上造成了时域信息的损失,进而削弱了RNN对Morse码时域特征的利用。

发明内容

本发明目的在于提供一种基于深度学习的端到端手发等幅电报译码系统,以解决传统机器学习译码方法对手发电报码长抖动不鲁棒和现有神经网络译码方法Morse码时域特征损失的技术问题。

为解决上述技术问题,本发明的具体技术方案如下:

一种基于深度学习的端到端手发等幅电报译码系统,包括预处理模块和端到端识别模型;

所述预处理模块包括信号限幅和短时傅里叶变换;输入的CW信号经所述限幅和短时傅里叶变换处理后,得到信号的时频矩阵,时频矩阵的时间维度为短时傅里叶变换得到的帧数;

端到端识别模型,包括FC-N层,Bi-LSTM层,全连接层,Softmax层以及CTC层;Morse信号的时频矩阵获取后,经所述FC-N层、Bi-LSTM层、全连接层、Softmax层以及CTC层处理后,得到每一帧输出序列的概率分布,根据概率分布将每一帧的预测输出整合为预测报文。

进一步的,所述FC-N层包括全连接层,每个全连接层的输出通过Relu函数进行激活,在利用FC-N层进行特征提取的过程中,能够保持时域特征维度不变,在频域上对Morse码的特征进行提取,便于后续网络充分利用Morse码的时域信息。

进一步的,所述Bi-LSTM层包括多层Bi-LSTM结构。

本发明的一种基于深度学习的端到端手发等幅电报译码系统,具有以下优点:

本发明的端到端识别模型采用FC-N-Bi-LSTM-CTC框架,直接将待识别CW信号转写为报文,不需要再进行查表映射操作。同时,在特征提取过程中保持了时间维度不变,可以充分利用Morse码的上下文关联信息。此外,利用CTC自动解决了输入序列与预测标签的对齐问题,通过模型输出的概率分布确定每一帧的输出,最后将每一帧对应的输出序列整合为预测报文。

附图说明

图1为本发明的基于深度学习的端到端手发等幅电报译码系统结构原理图;

图2为本发明的CW信号预处理示意图;

图3为本发明的FC-N的结构原理图;

图4为本发明的端到端识别模型输出示意图;

图5为本发明的基于深度学习的端到端手发等幅电报译码系统处理过程示意图;

具体实施方式

为了更好地了解本发明的目的、结构及功能,下面结合附图,对本发明一种基于深度学习的端到端手发等幅电报译码系统做进一步详细的描述。

如图1所示,本发明基于深度学习的端到端等幅电报译码系统,包括:

预处理,依次包括信号限幅和短时傅里叶变换。输入的等幅电报(CW)信号经所述限幅和短时傅里叶变换处理后,得到信号的时频矩阵;

端到端识别模型,依次包括FC-N(Full Connection-N,N个全连接)层,Bi-LSTM层(Bi-directional Long Short-Term Memory,双向长短时记忆网络),全连接层,Softmax层以及CTC(Connectionist Temporal Classification,连接时序分类)层。Morse(摩尔斯)信号的二维时频特征提取后,经所述FC-N层、Bi-LSTM层、全连接层、Softmax层以及CTC层处理后,得到每一帧上的输出不同字符的概率分布,最后,根据概率分布将每一帧上的输出序列整合为最终的预测标签。

对于预处理模块,本发明中,如图2所示,模型的输入是CW信号,通过对输入信号进行限幅,以达到滤除噪声的目的,然后对处理后的信号进行短时傅里叶变换,得到CW信号的二维时频矩阵。

对于端到端识别模型,本发明中,输入是预处理得到的时频矩阵。模型的前端采用的是FC-N结构,如图3所示,此网络结构多次采用全连接层和Relu激活函数在保持时间维度不变的条件下进行特征提取和维度变换,输出Morse码的特征序列。然后,特征序列通过Bi-LSTM层,依次输入每一帧的特征,以学习Morse码的上下文关联信息,紧接着,通过一个全连层得到每一时刻上输出不同字符的未归一化的概率分布,即对Bi-LSTM输出的序列化特征进行降维,在保持时间维度不变的条件下,将频域的维数降到最小建模单元数(各个标签字符和一个表示空白的字符构成)。如图4所示,经过Softmax层后,输出一个概率分布矩阵,在该矩阵中,每一列表示该帧上对应某个字符的概率,每一列的第一行代表输出空白字符(图中用“—”表示)的概率,后面行依次表示输出其他相应字符的概率。然后,利用CTC将每一时刻的预测输出与真实标签之间的差异作为端到端译码模型的损失函数,实现输入序列与输出标签的自动对齐。最后,利用概率分布矩阵得到每一帧对应的输出序列,通过整合得到最终的预测报文。

所述限幅处理,是利用CW信号的等幅特性,对待译码的CW信号的幅度进行限制,以达到滤除信号中部分噪声的目的。假设接收到的CW信号为r(n),门限为A,则限幅处理后的信号r′(n)可以表示为

其中,所述短时傅里叶变换是对信号r′(n)进行分帧加窗处理,对每一帧分别进行离散傅里叶变换,得到CW信号的时频矩阵X(k,l),可表示为

式中N为窗函数的长度,K为离散傅里叶变换的点数,L为窗函数的每次步进的长度。

其中,所述FC-N层包括N个全连接层。全连接层具有维度变换的作用,可以在实现特征矩阵维度变换的同时将有用信息记录下来,同时,经FC-N层处理后,保持了Morse码特征矩阵的时间维度不变,保证后续Bi-LSTM层对时域信息的充分利用;

其中,所述Bi-LSTM层是双向RNN结构的一种改进,通过引入门控机制解决了RNN网络梯度爆炸或梯度消失的问题,由多层Bi-LSTM构成,可以有选择地遗忘之前的累积信息或加入新的信息,使得模型可以充分学习Morse码的上下文关联信息。

其中,经所述Softmax层及CTC层处理后,得到每一帧输出不同字符的概率,根据概率关系,可以得到每一帧输出的预测字符,进而整合得到预测报文。

本发明完整的输入输出之间的映射关系如图5所示。

本发明的预处理过程采用限幅结合短时傅里叶变换的方式,利用CW信号自身的幅度特性,对待识别信号进行限幅,有效地滤除部分噪声。同时,利用短时傅里叶变换获取Morse信号的时频矩阵,用于识别模型的学习和训练。

本发明的端到端识别模型采用FC-N-Bi-LSTM-CTC框架,直接将待识别CW信号转写为报文,不需要再进行查表映射操作。同时,在特征提取过程中保持了时间维度不变,可以充分利用Morse码的上下文关联信息。此外,利用CTC自动解决了输入序列与预测标签的对齐问题,通过模型输出的概率分布确定每一帧的输出,最后将每一帧对应的输出序列整合为预测报文。

可以理解,本发明是通过一些实施例进行描述的,本领域技术人员知悉的,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明所保护的范围内。

相关技术
  • 一种基于深度学习的端到端手发等幅电报译码系统
  • 基于深度学习的空间调制接收端译码方法
技术分类

06120113211241