掌桥专利:专业的专利平台
掌桥专利
首页

技术领域

本发明实施例涉及信号处理技术领域,尤其涉及一种通信调制识别模型训练方法及装置。

背景技术

随着无线通信和雷达技术的不断发展,信号识别技术的应用越来越广泛。对通信信号的识别过程可以划分为三步:首先,对信号进行预处理;其次,对某些关键的特征进行选择和提取;最后,通过构建分类器进行分类和识别。目前,对通信信号的认知和识别主要采用基于最大似然比的判别识别方法,基于最大似然比的判别识别方法是把对信号的识别问题转化为假设检验问题,通过定义信号的似然函数并对其进行处理,得到可用于分类的特征量,然后输入到分类器中进行比较,从而得到识别的结果。

在实现本发明的过程中,发明人发现如下技术问题:目前,普遍采用基于AI的通信调制识别,已经有许多学者将ResNet50、CNN、CLDNN等深度神经网络用于通信信号识别。但在实际工程应用中,由于电磁信道环境复杂多变,通信信号在传输的过程中会经历不同程度的瑞利衰落、莱斯衰落、多普勒频移及自然噪声影响等等,并且随着传输距离的增加,接收的信号幅度将会很弱,大大降低了深度学习网络模型对于通信信号识别的准确性。

发明内容

本发明实施例提供一种通信调制识别模型训练方法及装置,通过建立一种新的模型,并通过训练,以解决现有技术中深度学习网络模型对于通信信号识别的准确性较差的技术问题。

第一方面,本发明实施例提供了一种通信调制识别模型训练方法,包括:

提取实际采集通信信号的敏感特征集;

将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;

将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;

设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),

Ata

基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;

采用强化学习算法, 更新朴素贝叶斯分类器的权重。

进一步的,所述朴素贝叶斯分类器,包括:

根据采集到的通信信号类别的数量,构建相同数量的朴素贝叶斯分类器:

其中fea1, fea2, fea3, …, feaα分别为采集通信信号的电磁信道环境,共计α种,P{·}代表·出现的统计概率。

进一步的,所述带权重值的朴素贝叶斯分类器包括:

Class_β

Class_β

Class_β

Class_β

Class_β={Class_β

进一步的,所述提取实际采集通信信号的敏感特征集包括:

提取实际采集通信信号的时域IQ特征;

提取实际采集通信信号的频域功率谱特征;

提取实际采集通信信号的频域相位差特征;

基于时域IQ特征、频域功率谱特征和频域相位差特征构建敏感特征融合集。

进一步的,在所述提取实际采集通信信号的时域IQ特征之前,所述方法还包括:

根据实际采集通信信号在实际工程环境传输的信道环境,对采集通信信号进行预处理。

更进一步的,所述采用强化学习算法,更新朴素贝叶斯分类器的权重。,包括:

对权重值进行统计;

初始化Q-Table,所述Q-Table的行对应奖励值权重系数,列对应惩罚值权重系数,表中的数值对应相应的奖励函数;

采用贪婪策略循环更新表中的每一个奖励函数值,直至所述Q-Table中主对角线的奖励函数值满足设定的期望值,其中,贪婪策略根据朴素贝叶斯多轮识别结果制定,奖励函数值的更新步长为1,权重系数的更新步长为0.001~0.01。

第二方面,本发明实施例还提供了一种通信调制识别模型训练装置,包括:

提取模块,用于提取实际采集通信信号的敏感特征集;

深度神经网络模型输入模块,用于将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;

朴素贝叶斯分类器输入模块,用于将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;

构造模块,用于设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),

Ata

优化模块,用于基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;

修正模块,用于采用强化学习算法,更新朴素贝叶斯分类器的权重。

进一步的,所述朴素贝叶斯分类器,包括:

根据采集到的通信信号类别的数量,构建相同数量的朴素贝叶斯分类器:

其中fea1,fea2,fea3,…,feaα分别为采集通信信号的电磁信道环境,共计α种,P{·}代表·出现的统计概率。

进一步的,所述带权重值的朴素贝叶斯分类器包括:

Class_β1=β11*T_value+β12*Ata_value,

Class_β2=β21*T_value+β22*Ata_value,

Class_β2=β21*T_value+β22*Ata_value,

Class_βk=βk1*T_value+βk2*Ata_value

Class_β={Class_β1,Class_β2,Class_β3,…,Class_βk,}。

进一步的,所述提取模块包括:

时域IQ特征提取单元,用于提取实际采集通信信号的时域IQ特征;

频域功率谱特征提取单元,用于提取实际采集通信信号的频域功率谱特征;

频域相位差特征提取单元,用于提取实际采集通信信号的频域相位差特征;

构建单元,用于基于时域IQ特征、频域功率谱特征和频域相位差特征构建敏感特征融合集。

进一步的,所述提取模块还包括:

预处理单元,用于根据实际采集通信信号在实际工程环境传输的信道环境,对采集通信信号进行预处理。

更进一步的,所述修正模块,包括:

统计单元,用于对权重值进行统计;

初始化单元,用于初始化Q-Table,所述Q-Table的行对应奖励值权重系数,列对应惩罚值权重系数,表中的数值对应相应的奖励函数;

更新单元,用于采用贪婪策略循环更新表中的每一个奖励函数值,直至所述Q-Table中主对角线的奖励函数值满足设定的期望值,其中,贪婪策略根据朴素贝叶斯多轮识别结果制定,奖励函数值的更新步长为1,权重系数的更新步长为0.001~0.01。

本发明实施例提供的通信调制识别模型训练方法及装置,通过提取实际采集通信信号的敏感特征集;将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;采用强化学习算法,更新朴素贝叶斯分类器的权重。利用朴素贝叶斯分类器对深度神经网络模型的粗略分类结果再次进行分类,并通过设定奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,并通过采用强化学习算法,不断更新朴素贝叶斯分类器的权重,进一步提升通信调制识别模型识别信号的准确性,通过该训练方法得到的通信调制识别模型,可以避免电磁信道环境复杂多变产生的信号识别准确性降低的情况,进一步提升了通信信号识别的准确性。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:

图1为本发明实施例一提供的通信调制识别模型训练方法的流程图;

图2为本发明实施例二提供的通信调制识别模型训练装置的结构图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1为本发明实施例一提供的通信调制识别模型训练方法的流程图,本实施例可适用于对一种基于深度学习神经网络模型和朴素贝叶斯分类器的通信调制识别模型进行训练的情况,该方法可以由通信调制识别模型训练装置来执行,并可集成于服务器中,具体包括如下步骤:

步骤110、提取实际采集通信信号的敏感特征集。

在本实施例中,可以通过提取实际采集到的通信信号,并进行相应的特征提取,并根据提取到的特征生成敏感特征集。示例性可以通过现有的通信信号接收装置接收到相应的通信信号,并对所述通信信号进行处理。示例性的,可以包括:提取实际采集通信信号的时域IQ特征;提取实际采集通信信号的频域功率谱特征;提取实际采集通信信号的频域相位差特征;基于时域IQ特征、频域功率谱特征和频域相位差特征构建敏感特征融合集。另外,由于信号受到实际工程环境传输的信道环境影响,因此,可先对其进行预处理。示例性的,可通过如下方式进行预处理,可根据实际工程环境及任务条件,采集一定量的k类通信信号x(t):x(t)={x

首先进行正交分解,得到通信IQ信号,示例性的,可通过如下方式进行正交分解,得到基于时域IQ特征。

时域IQ特征s

s(t)=s

分别提取s(t)的实部和虚部得到时域特征s

频域功率谱特征Ps(w)可通过如下方式提取:

Ps(w)=20*log

S(w)=fft(s(t)),其中fft为快速傅里叶变换函数,用于计算s(t)的频谱S(w),|S(w)|为频谱S(w)的绝对值,代表s(t)的幅度谱。

还可通过如下方式生成频域相位差特征:

频域相位差特征Ψs(t)提取:

Ψs(t)=arctan(s

基于上述计算得到的时域IQ特征、频域功率谱特征和频域相位差特征构建敏感特征融合集Φ,Φ={s

步骤120、将所述敏感特征集输入到深度神经网络模型中,得到初分类结果。

构建深度神经网络DeepNet,设置超参数(learningrate、epoch、batchsize、randstate)、AI模型训练回调函数callbacks、优化器等。可选的,所述深度神经网络可采用ResNet50模型,输出为各种信号的分类结果对应的通信信号。

步骤130、将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建。

朴素贝叶斯分类器是一系列以假设特征之间强独立下运用贝叶斯定理为基础的简单概率分类器。该分类器模型会给问题实例分配用特征值表示的类标签,类标签取自有限集合。因此,可基于概率初始构建朴素贝叶斯分类器。

由于采集的通信信号共有k类,故构建k个BCBT如下:

其中fea1,fea2,fea3,…,feaα分别为采集通信信号的电磁信道环境,共计α种,P{·}代表·出现的统计概率

步骤140、设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k)。

在本实施例中,可以根据经验设置奖励阈值thr,相应的,奖励函数Q(k)为:

Ata

步骤150、基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器。

示例性的,带权重值的朴素贝叶斯分类器如下:

Class_β

Class_β

Class_β

Class_β

Class_β={Class_β

通过上述方式,可将朴素贝叶斯分类器各个BCPT改写为带有权重值的方式。

步骤160、采用强化学习算法,更新朴素贝叶斯分类器的权重。

示例性的,可以采用如下方式对朴素贝叶斯分类器的权重值进行更新,对权重值进行统计;初始化Q-Table,所述Q-Table的行对应奖励值权重系数,列对应惩罚值权重系数,表中的数值对应相应的奖励函数;采用贪婪策略循环更新表中的每一个奖励函数值,直至所述Q-Table中主对角线的奖励函数值满足设定的期望值,其中,贪婪策略根据朴素贝叶斯多轮识别结果制定,奖励函数值的更新步长为1,权重系数的更新步长为0.001~0.01。

统计后的权重值β如下:

β={[β

初始化Q-Table,所述Q-Table的行对应奖励值权重系数,列对应惩罚值权重系数,表中的数值对应相应的奖励函数,基于统计后的权重值β对Q-Table,进行填充,填充后的Q-Table如下:

采用贪婪策略循环更新表中的每一个奖励函数值,直至所述Q-Table中主对角线的奖励函数值满足设定的期望值,其中,贪婪策略根据朴素贝叶斯多轮识别结果制定,奖励函数值的更新步长为1,权重系数的更新步长为0.001~0.01。利用上述方式不断对其进行迭代更新,最终确定合适的权重值。通过上述方式,确定每个BCPT对应的权重值,进而完成整个模型的训练。

此外,还可利用上述方式,在后续过程中,对新采集的信号进行识别测试,并根据测试结果优化强化学习算法,对朴素贝叶斯分类器的权重β进行持续修正,以持续优化分类器的准确性。

本实施例通过提取实际采集通信信号的敏感特征集;将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;采用强化学习算法,更新朴素贝叶斯分类器的权重。利用朴素贝叶斯分类器对深度神经网络模型的粗略分类结果再次进行分类,并通过设定奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,并通过采用强化学习算法,不断更新朴素贝叶斯分类器的权重,进一步提升通信调制识别模型识别信号的准确性,通过该训练方法得到的通信调制识别模型,可以避免电磁信道环境复杂多变产生的信号识别准确性降低的情况,进一步提升了通信信号识别的准确性。

实施例二

图2是本发明实施例二提供的通信调制识别模型训练装置的结构示意图,如图2所示,所述装置包括:

提取模块210,用于提取实际采集通信信号的敏感特征集;

深度神经网络模型输入模块220,用于将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;

朴素贝叶斯分类器输入模块230,用于将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;

构造模块240,用于设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),

Ata

优化模块250,用于基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;

修正模块260,用于采用强化学习算法,更新朴素贝叶斯分类器的权重。

本实施例提供的通信调制识别模型训练装置,过提取实际采集通信信号的敏感特征集;将所述敏感特征集输入到深度神经网络模型中,得到初分类结果;将所述初分类结果输入至朴素贝叶斯分类器,所述朴素贝叶斯分类器利用通信信号进行初始构建;设置奖励阈值thr,并基于奖励阈值thr构造奖励函数Q(k),基于奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,得到带权重值的朴素贝叶斯分类器;采用强化学习算法,更新朴素贝叶斯分类器的权重。利用朴素贝叶斯分类器对深度神经网络模型的粗略分类结果再次进行分类,并通过设定奖励值和惩罚值对所述朴素贝叶斯分类器进行优化,并通过采用强化学习算法,不断更新朴素贝叶斯分类器的权重,进一步提升通信调制识别模型识别信号的准确性,通过该训练方法得到的通信调制识别模型,可以避免电磁信道环境复杂多变产生的信号识别准确性降低的情况,进一步提升了通信信号识别的准确性。

在上述各实施例的基础上,所述朴素贝叶斯分类器,包括:

根据采集到的通信信号类别的数量,构建相同数量的朴素贝叶斯分类器:

其中fea1,fea2,fea3,…,feaα分别为采集通信信号的电磁信道环境,共计α种,P{·}代表·出现的统计概率。

在上述各实施例的基础上,所述带权重值的朴素贝叶斯分类器包括:

Class_β1=β11*T_value+β12*Ata_value,

Class_β2=β21*T_value+β22*Ata_value,

Class_β2=β21*T_value+β22*Ata_value,

Class_βk=βk1*T_value+βk2*Ata_value

Class_β={Class_β1,Class_β2,Class_β3,…,Class_βk,}。

在上述各实施例的基础上,所述提取模块包括:

时域IQ特征提取单元,用于提取实际采集通信信号的时域IQ特征;

频域功率谱特征提取单元,用于提取实际采集通信信号的频域功率谱特征;

频域相位差特征提取单元,用于提取实际采集通信信号的频域相位差特征;

构建单元,用于基于时域IQ特征、频域功率谱特征和频域相位差特征构建敏感特征融合集。

在上述各实施例的基础上,所述提取模块还包括:

预处理单元,用于根据实际采集通信信号在实际工程环境传输的信道环境,对采集通信信号进行预处理。

在上述各实施例的基础上,所述修正模块,包括:

统计单元,用于对权重值进行统计;

初始化单元,用于初始化Q-Table,所述Q-Table的行对应奖励值权重系数,列对应惩罚值权重系数,表中的数值对应相应的奖励函数;

更新单元,用于采用贪婪策略循环更新表中的每一个奖励函数值,直至所述Q-Table中主对角线的奖励函数值满足设定的期望值,其中,贪婪策略根据朴素贝叶斯多轮识别结果制定,奖励函数值的更新步长为1,权重系数的更新步长为0.001~0.01。

本发明实施例所提供的通信调制识别模型训练装置可执行本发明任意实施例所提供的通信调制识别模型训练方法,具备执行方法相应的功能模块和有益效果。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如”C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

相关技术
  • 医学文本识别方法及装置、语句识别模型训练方法及装置
  • 命名实体识别模型训练方法、命名实体识别方法及装置
  • 一种图像识别模型的训练方法、图像识别方法和相关装置
  • 车牌识别模型训练方法、车牌识别方法、装置及设备
  • 一种人脸表情识别模型训练方法、装置及设备
  • 光OFDM信号子载波调制格式识别模型训练方法、识别方法及装置
  • 光OFDM信号子载波调制格式识别模型训练方法、识别方法及装置
技术分类

06120116480957