掌桥专利:专业的专利平台
掌桥专利
首页

一种应用于电力作业中的声纹识别方法及其系统

文献发布时间:2024-04-18 20:01:30


一种应用于电力作业中的声纹识别方法及其系统

技术领域

本发明涉及计算机技术领域,具体涉及一种应用于电力作业中的声纹识别方法及其系统。

背景技术

目前为了保证电网稳定与的安全运行,在需要电网工作人员具有良好的业务技能的同时,也需要保证专业人员具有独一无二的身份特征进行实施操作。身份认证技术大致分为两个分支:一是身份标识输入,如使用用户名、密码登录的账户模式;二是通过身份标识物,即钥匙、证件等。这两种方式已经被绝大多数人所接受并被广泛应用与电网系统中。但是一些不法之徒通过非法手段获得他人的身份标识后,就可以顺利地通过检测,冒充他人,最终对电网系统造成重大损失。对于这种问题,基于生物特性识别和文本识别的身份认证技术就应运而生。声纹是生物特征的一种,对于人体来说,声纹是长期稳定的特征信号,通过声纹鉴别技术可以区分不同个体。因为每个人的声道和发音器官具有差异,而且身体状况、生活环境等后天的因素都会造成不同的人发出的语音在倒谱系数上呈现出差异性,因此这种特征具有独特性,利用这一特性,可以使用机器学习及人工智能的方法实现不同说话人的识别。

说话人识别也称为声纹识别,是利用说话人的声纹特征来辨别说话者的身份,以其自然性、唯一性、易采集性等特点,可广泛应用于需要进行身份验证的各种安全领域、互联网应用领域以及通信领域等。为了提高说话人识别系统的性能,选择最能代表说话人语音特性的特征是非常重要的。那么,在电力作业中如何精准、高效的进行声纹识别是一种具备基础科学研究意义和实际应用价值的课题。

综上所述,传统的应用于电力作业中的身份识别方法存在可靠性较差,易被他人获取身份标识的问题。

发明内容

有鉴于此,本发明提供一种应用于电力作业中的声纹识别方法及其系统,通过将ICA特征提取算法与SVM二分类器相结合,实现了对用户声音进行准确的身份验证,解决了传统的应用于电力作业中的身份识别方法存在的可靠性较差,易被他人获取身份标识的问题。

为解决以上问题,本发明的技术方案为采用一种应用于电力作业中的声纹识别方法,包括:获取待建档人员的声音信号,并进行预处理;基于Gammatone滤波器组提取预处理后的所述声音信号的时频数据生成第一GFCS参数矩阵,并基于所述Gammatone滤波器组中各通道的输出信号构建频域信号的能量谱,生成第二GFCS参数矩阵;利用FastICA算法,提取所述第一GFCS参数矩阵和所述第二GFCS参数矩阵构成的混合信号中的ICA分离矩阵,并获取所述待建档人员的声纹特征;基于所述声纹特征训练SVM二分类器;在存在待测声音信号时,待测声音信号经过Gammatone滤波器组及FastICA算法处理后输入至训练完成的所述SVM二分类器,所述SVM二分类器输出声纹识别结果。

可选地,对待建档人员的声音信号进行预处理的方法至少包括预加重、分帧和加窗。

可选地,基于Gammatone滤波器组提取预处理后的所述声音信号的时频数据,包括:采用Gammatone滤波器组对预处理后的信号进行滤波处理后,使用快速傅里叶变换将所述声音信号进行时域到频域的转换,得到所述声音信号的时频数据。

可选地,基于所述Gammatone滤波器组中各通道的输出信号构建频域信号的能量谱,包括:获取所述Gammatone滤波器组中各通道的输出信号频域的能量值并取对数,构建所述频域信号的能量谱。

可选地,基于所述声纹特征训练SVM二分类器的方法,包括:构建初始SVM二分类器;获取包含待建档人员的声音的多人员声音信号构成的所述混合信号,并预标记待建档人员的声音,构成训练样本;基于所述训练样本训练并验证所述SVM二分类器。

相应地,本发明提供,一种应用于电力作业中的声纹识别系统,包括:预处理模块,用于对待建档人员的声音信号进行预处理,所述预处理至少包括预加重、分帧和加窗;GFCs特征提取模块,基于Gammatone滤波器组提取预处理后的所述声音信号的时频数据生成第一GFCS参数矩阵,并基于所述Gammatone滤波器组中各通道的输出信号构建频域信号的能量谱,生成第二GFCS参数矩阵;声纹特征选取模块,利用FastICA算法,提取所述第一GFCS参数矩阵和所述第二GFCS参数矩阵构成的混合信号中的ICA分离矩阵,并获取所述待建档人员的声纹特征;声纹身份识别模块,基于所述声纹特征训练SVM二分类器,训练完成后,在存在待测声音信号时,待测声音信号经过Gammatone滤波器组及FastICA算法处理后输入至训练完成的所述SVM二分类器,所述SVM二分类器输出声纹识别结果。

可选地,所述声纹识别系统还包括数据存储模块,用于存储所述待测声音信号和所述声纹识别结果。

本发明的首要改进之处为提供的应用于电力作业中的声纹识别方法,利用声学独立分量(Acoustic Independent Component Analysis,AICA)的特征选取方法来提取待建档人员的声纹特征后,基于声纹特征训练SVM二分类器,从而通过将ICA特征提取算法与SVM二分类器相结合,实现了对用户声音进行准确的身份验证,解决了传统的应用于电力作业中的身份识别方法存在的可靠性较差,易被他人获取身份标识的问题。

附图说明

图1是本发明的应用于电力作业中的声纹识别方法的简化流程图;

图2是本发明的应用于电力作业中的声纹识别系统的简化单元连接图。

具体实施方式

为了使本领域的技术人员更好地理解本发明的技术方案,下面结合附图和具体实施例对本发明作进一步的详细说明。

如图1所示,一种应用于电力作业中的声纹识别方法,包括:

S1:获取待建档人员的声音信号,并进行预处理。

进一步的,对待建档人员的声音信号进行预处理的方法至少包括预加重、分帧和加窗。其中,预加重为采用一阶高通数字滤波器对信号预加重处理,提升其高频部分;分帧、加窗用于实现提取不同分辨率的特征参数,选用两个不同的长度对预加重的信号进行分帧处理,再在相邻帧之间设置一部分重叠,实现平稳过渡。

S2:基于Gammatone滤波器组提取预处理后的所述声音信号的时频数据生成第一GFCS参数矩阵,并基于所述Gammatone滤波器组中各通道的输出信号构建频域信号的能量谱,生成第二GFCS参数矩阵。其中,GFCS为伽玛通频率系数(Gammatone FrequencyCoefficients:GFCS)。

具体的,本发明通过采用Gammatone滤波器组对预处理后的信号进行滤波处理后,使用快速傅里叶变换将所述声音信号进行时域到频域的转换,得到所述声音信号的时频数据,并通过获取所述Gammatone滤波器组中各通道的输出信号频域的能量值并取对数,构建所述频域信号的能量谱。

S3:利用FastICA算法,提取所述第一GFCS参数矩阵和所述第二GFCS参数矩阵构成的混合信号中的ICA分离矩阵,并获取所述待建档人员的声纹特征。

本发明基于Gammatone滤波器组提取出GFCS参数矩阵作为FastICA的输入,进而基于FastICA构建能够提取待建档人员的声纹特征的ICA分离矩阵,从而为选取语音时频参数中的声纹特征提供先验信息,解决了ICA算法中独立成分次序的不确定性的问题,并进一步的保证了SVM二分类器的输入的可靠性与稳定性,提高了非线性二分类SVM模型的识别性能,从而实现不同说话人的声音的精准判别。

S4:基于所述声纹特征训练SVM二分类器。

进一步的,基于所述声纹特征训练SVM二分类器的方法,包括:构建初始SVM二分类器;获取包含待建档人员的声音的多人员声音信号构成的所述混合信号,并预标记待建档人员的声音,构成训练样本;基于所述训练样本训练并验证所述SVM二分类器。

更进一步的,若待建档人员的人数为多个,则在训练阶段,给待建档人员的特征附标签为1,即正集,其余说话人特征的标签为-1,即负集;则基于k个类别的样本构造k个SVM,k为待建档人员的人数。同时,考虑到当待识别说话人较多的情况下,使用该二分类SVM完成多分类识别任务时,负集数据过多可能导致数据偏移情况,可以使用-1/(k-1)作为负集标签。

S5:在存在待测声音信号时,待测声音信号经过Gammatone滤波器组及FastICA算法处理后输入至训练完成的所述SVM二分类器,所述SVM二分类器输出声纹识别结果。

本发明利用声学独立分量(Acoustic Independent Component Analysis,AICA)的特征选取方法来提取待建档人员的声纹特征后,基于声纹特征训练SVM二分类器,从而通过将ICA特征提取算法与SVM二分类器相结合,实现了对用户声音进行准确的身份验证,解决了传统的应用于电力作业中的身份识别方法存在的可靠性较差,易被他人获取身份标识的问题。

相应的,本发明提供,一种应用于电力作业中的声纹识别系统,包括:预处理模块,用于对待建档人员的声音信号进行预处理,所述预处理至少包括预加重、分帧和加窗;GFCs特征提取模块,基于Gammatone滤波器组提取预处理后的所述声音信号的时频数据生成第一GFCS参数矩阵,并基于所述Gammatone滤波器组中各通道的输出信号构建频域信号的能量谱,生成第二GFCS参数矩阵;声纹特征选取模块,利用FastICA算法,提取所述第一GFCS参数矩阵和所述第二GFCS参数矩阵构成的混合信号中的ICA分离矩阵,并获取所述待建档人员的声纹特征;声纹身份识别模块,基于所述声纹特征训练SVM二分类器,训练完成后,在存在待测声音信号时,待测声音信号经过Gammatone滤波器组及FastICA算法处理后输入至训练完成的所述SVM二分类器,所述SVM二分类器输出声纹识别结果。

进一步的,所述声纹识别系统还包括数据存储模块,用于存储所述待测声音信号和所述声纹识别结果。

以上对本发明实施例所提供的应用于电力作业中的声纹识别方法及其系统。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

技术分类

06120116561741