导航：首页> 教育；密码术；显示；广告；印鉴>一种智能语音调度方法、系统、设备及存储介质

一种智能语音调度方法、系统、设备及存储介质

文献发布时间：2023-06-19 19:27:02

技术领域

本发明属于语音识别技术领域，具体涉及一种智能语音调度方法、系统、设备及存储介质。

背景技术

在电力系统中，为保证系统的正常、安全运行，需要有相应的调度管理体制来指挥、监督和管理电力的生产和运行。高效的调度模式可以领导电力系统内发电、输电、变电、配电及供电部门按安全、经济运行要求向用户不间断地提供优质电能，以及在事故情况下，采取措施，迅速排除事故，及时恢复至正常运行状态。而目前电力系统调度主要还是依靠人工通话调度的方式，这样的调度方式已经难以满足如今智能化要求越来越高的电力系统调度的需要。人工通话调度方式下，调度员与相应厂站人员进行电话沟通时，很容易因语言差异、语速过快、说话不标准、噪声干扰、通话音量等问题造成被调度执行端的信息接收失误和差错。这样的方式如不加以改进，将不利于系统的调度业务联系，也无法有效保障系统的安全、稳定运行。

发明内容

本发明的目的是提供一种智能语音调度方法、系统、设备及存储介质，用以解决现有技术中存在的上述问题。

为了实现上述目的，本发明采用以下技术方案：

第一方面，提供一种智能语音调度方法，包括：

获取目标人员的语音信息；

提取语音信息的声纹特征，并将语音信息转换为对应的文本信息，所述文本信息包含数字编号和文本语句；

将声纹特征导入预置的分类器模型进行声纹分类，得到声纹分类结果；

根据声纹分类结果判定目标人员是否为权限人员，在判定目标人员为权限人员后，匹配到对应权限人员的指令库；

将完整的文本语句作为第一匹配特征，对文本语句进行关键词提取，将提取出的关键词按顺序排列，形成第二匹配特征，将文本语句的每个字单独提取后按顺序排列，形成第三匹配特征；

将第一匹配特征、第二匹配特征和第三匹配特征导入对应权限人员的指令库中进行检索匹配，得到对应的调度控制指令；

根据数字编号将调度控制指令发送至对应的执行终端。

基于上述技术内容，通过获取目标人员的语音信息来提取声纹特征，并将语音信息识别转换为文本信息，进行多级文本特征的提取组建，通过声纹特征判定目标人员是否为权限人员，并匹配该权限人员的专用指令库，通过多级文本特征在该权限人员的指令库中精细化匹配对应的调度控制指令，然后将匹配到的调度控制指令根据文本信息中的数字编号发送至对应的执行终端，就可以实现智能化的语音调度流程，替代传统人工通话的调度模式，提高电力系统调度的效率和精准性。

在一个可能的设计中，在提取语音信息的声纹特征时，采用MFCC特征提取方法提取出语音信息的声纹特征；在将语音信息转换为文本信息时，将语音信息导入预置的语音识别引擎进行语音识别，得到对应的文本信息。

在一个可能的设计中，所述分类器模型采用经过样本训练后的SVM模型。

在一个可能的设计中，所述将第一匹配特征、第二匹配特征和第三匹配特征导入对应权限人员的指令库中进行检索匹配，得到对应的调度控制指令，包括：

将第一匹配特征、第二匹配特征和第三匹配特征按优先级从高到低的顺序依次导入对应权限人员的指令库中进行检索匹配；

在第一匹配特征匹配成功时，调取第一匹配特征匹配到的调度控制指令；在第一匹配特征匹配失败且第二匹配特征匹配成功时，调取第二匹配特征匹配到的调度控制指令；在第一匹配特征和第二匹配特征均匹配失败且第三匹配特征匹配成功时，调取第三匹配特征匹配到的调度控制指令。

在一个可能的设计中，所述第二匹配特征匹配成功的判定条件为第二匹配特征中的关键词顺序包含于对应的调度控制指令中，所述第三匹配特征匹配成功的判定条件为第三匹配特征中有达到设定比例的文字次序包含于对应的调度控制指令中。

在一个可能的设计中，所述指令库中包含各调度控制指令对应的拼音字符串，在第一匹配特征、第二匹配特征和第三匹配特征均匹配失败时，所述方法还包括：将第一匹配特征、第二匹配特征和第三匹配特征中的文字转换为拼音字符；将转换为拼音字符后的第一匹配特征、第二匹配特征和第三匹配特征按优先级从高到低的顺序依次导入对应权限人员的指令库中再进行检索匹配，匹配到对应的拼音字符串；调取该拼音字符串对应的调度控制指令。

在一个可能的设计中，所述文本信息中，在文本语句的前后均附带数字编号，所述根据数字编号将调度控制指令发送至对应的执行终端，包括：

提取文本语句之前和之后的数字编号进行一致性校验；

在判定文本语句之前和之后的数字编号一致时，根据该数字编号查找到对应的执行终端；

将调度控制指令发送至查找到的执行终端。

第二方面，提供一种智能语音调度系统，包括获取单元、识别单元、分类单元、判定单元、组建单元、匹配单元和发送单元，其中：

获取单元，用于获取目标人员的语音信息；

识别单元，用于提取语音信息的声纹特征，并将语音信息转换为对应的文本信息，所述文本信息包含数字编号和文本语句；

分类单元，用于将声纹特征导入预置的分类器模型进行声纹分类，得到声纹分类结果；

判定单元，用于根据声纹分类结果判定目标人员是否为权限人员，在判定目标人员为权限人员后，匹配到对应权限人员的指令库；

组建单元，用于将完整的文本语句作为第一匹配特征，对文本语句进行关键词提取，将提取出的关键词按顺序排列，形成第二匹配特征，将文本语句的每个字单独提取后按顺序排列，形成第三匹配特征；

匹配单元，用于将第一匹配特征、第二匹配特征和第三匹配特征导入对应权限人员的指令库中进行检索匹配，得到对应的调度控制指令；

发送单元，用于根据数字编号将调度控制指令发送至对应的执行终端。

第三方面，提供一种智能语音调度设备，包括：

存储器，用于存储指令；

处理器，用于读取所述存储器中存储的指令，并根据指令执行上述第一方面中任意一种所述的方法。

第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，使得所述计算机执行第一方面中任意一种所述的方法。同时，还提供一种包含指令的计算机程序产品，当所述指令在计算机上运行时，使所述计算机执行第一方面中任意一种所述的方法。

有益效果：本发明通过获取目标人员的语音信息来提取声纹特征，并将语音信息识别转换为文本信息，进行多级文本特征的提取组建，通过声纹特征判定目标人员是否为权限人员，并匹配该权限人员的专用指令库，通过多级文本特征在该权限人员的指令库中精细化匹配对应的调度控制指令，然后将匹配到的调度控制指令根据文本信息中的数字编号发送至对应的执行终端，就可以实现智能化的语音调度流程。本发明可以替代传统人工通话的调度方式，实现智能化的语音识别调度，并通过精细化的指令库和调度控制指令匹配，提高电力系统调度的效率和精准性，杜绝人工通话调度的失误和差错。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例中方法的步骤示意图；

图2为本发明实施例中系统的构成示意图；

图3为本发明实施例中设备的构成示意图。

具体实施方式

在此需要说明的是，对于这些实施例方式的说明用于帮助理解本发明，但并不构成对本发明的限定。本文公开的特定结构和功能细节仅用于描述本发明的示例实施例。然而，可用很多备选的形式来体现本发明，并且不应当理解为本发明限制在本文阐述的实施例中。

应当理解，除非另有明确的规定和限定，术语“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以根据具体情况理解上述术语在实施例中的具体含义。

在下面的描述中提供了特定的细节，以便于对示例实施例的完全理解。然而，本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。例如可以在框图中示出系统，以避免用不必要的细节来使得示例不清楚。在其他实施例中，可以不以非必要的细节来示出众所周知的过程、结构和技术，以避免使得实施例不清楚。

实施例1：

本实施例提供一种智能语音调度方法，如图1所示，方法包括以下步骤：

S1.获取目标人员的语音信息。

具体实施时，可通过相应的语音采集设备来采集目标人员的语音信息，目标人员只需对着语音采集设备发出语音信息即可。

S2.提取语音信息的声纹特征，并将语音信息转换为对应的文本信息，所述文本信息包含数字编号和文本语句。

具体实施时，在获取到目标人员的语音信息后，可采用MFCC(梅尔频率倒谱系数)特征提取方法提取出语音信息的声纹特征，具体过程包括：

对语音信息进行预处理，包括预加重、分帧和加窗处理。预加重通常使用带有6dB/倍频的一阶数字滤波器来实现。声音信号是非线性时变信号，具有短时平稳的特点，对其进行分帧可以提取其短时特性，为了进行短时分析，还必须通过加窗来选取窗口内的声音信号，通过预加重、分帧和加窗处理，可以加强语音信号的性能，如信噪比、处理精度等。

对于每一个短时分析窗，通过快速傅里叶变换(FFT)可得到对应的频谱。由于声音信号在时域上的变化快速且不稳定，通常要将它转换到频域上来分析其特征参数。梅尔倒频谱特征参数提取需要通过快速傅里叶变换，计算出每帧数据的频谱参数，再将每帧数据的频谱参数通过由多个三角带通滤波器组成的梅尔频率滤波器做卷积运算，之后对每个频带的输出取对数，求出每个输出的对数能量(Log Energy)，最后再进行离散余弦变换(DCT)，求出梅尔倒谱系数作为声纹特征参数。

在将语音信息转换为对应的文本信息时，可将语音信息导入预置的语音识别引擎进行语音识别，得到对应的文本信息，如将语音信息导入第三方语音识别平台进行语音识别，输出文本信息，或者预先构建本地语音识别用的深度神经网络模型，进行充足的样本的训练和测试，得到本地专用的语音识别模型，将语音信息输入该模型进行识别，得到相应的文本信息。

S3.将声纹特征导入预置的分类器模型进行声纹分类，得到声纹分类结果。

具体实施时，在获得声纹特征后，即可将声纹特征导入预置的分类器模型进行声纹分类，得到声纹分类结果。所述分类器模型可选用经过样本训练测试后的SVM(支持向量机)模型，即先构建好初始的SVM模型，然后获取各权限人员的若干声纹特征样本数据组，组成原始数据集，再将原始数据集的一部分作为训练集，另一部分作为测试集，利用训练集和测试集对初始的SVM模型进行测试训练，得到训练测试后的SVM模型。

S4.根据声纹分类结果判定目标人员是否为权限人员，在判定目标人员为权限人员后，匹配到对应权限人员的指令库。

具体实施时，在得到声纹分类结果后，即可根据声纹分类结果判定目标人员是否为权限人员，如果是权限人员，就根据结果匹配到对应的权限人员及该权限人员对应的指令库，以便后续从该指令库中匹配调度控制指令。

S5.将完整的文本语句作为第一匹配特征，对文本语句进行关键词提取，将提取出的关键词按顺序排列，形成第二匹配特征，将文本语句的每个字单独提取后按顺序排列，形成第三匹配特征。

具体实施时，为了实现精细化的调度控制指令查找匹配，可以先构建出多层级的匹配特征来进行后续的调度控制指令匹配，包括将完整的文本语句作为第一匹配特征，对文本语句进行关键词提取，将提取出的关键词按顺序排列，形成第二匹配特征，将文本语句的每个字单独提取后按顺序排列，形成第三匹配特征。

S6.将第一匹配特征、第二匹配特征和第三匹配特征导入对应权限人员的指令库中进行检索匹配，得到对应的调度控制指令。

具体实施时，可将第一匹配特征、第二匹配特征和第三匹配特征按优先级从高到低的顺序(即从第一匹配特征、第二匹配特征到第三匹配特征)依次导入对应权限人员的指令库中进行检索匹配；在第一匹配特征匹配成功时，调取第一匹配特征匹配到的调度控制指令；在第一匹配特征匹配失败且第二匹配特征匹配成功时，调取第二匹配特征匹配到的调度控制指令；在第一匹配特征和第二匹配特征均匹配失败且第三匹配特征匹配成功时，调取第三匹配特征匹配到的调度控制指令，以此实现多层级、精细化的调度控制指令匹配，提高匹配的准确性。其中，所述第二匹配特征匹配成功的判定条件为第二匹配特征中的关键词顺序包含于对应的调度控制指令中，所述第三匹配特征匹配成功的判定条件为第三匹配特征中有达到设定比例的文字次序包含于对应的调度控制指令中，如第三匹配特征中有超过80％的文字按照次序包含于对应的调度控制指令中。

并且，所述指令库中还可包含各调度控制指令对应的拼音字符串，在第一匹配特征、第二匹配特征和第三匹配特征均匹配失败时，可将第一匹配特征、第二匹配特征和第三匹配特征中的文字转换为拼音字符，将转换为拼音字符后的第一匹配特征、第二匹配特征和第三匹配特征按优先级从高到低的顺序依次导入对应权限人员的指令库中再进行类似的多层级检索匹配，匹配到对应的拼音字符串，调取该拼音字符串对应的调度控制指令，以此提高指令匹配全面性和成功率。

S7.根据数字编号将调度控制指令发送至对应的执行终端。

具体实施时，目标人员按照预先设定的规则发出语音信息，以使得语音信息转换后的文本信息包含数字编号和文本语句，且在文本语句的前后均附带数字编号，如文本信息为“001请闭合开关001”，其中“请闭合开关”为文本语句，前后两个“001”为数字编号。在匹配到相应的调度控制指令后，即可提取文本语句之前和之后的数字编号进行一致性校验，在判定文本语句之前和之后的数字编号一致时，表明数字编号无误，然后就可根据该数字编号在终端库中查找到对应的执行终端，如“001”对应的执行终端，将调度控制指令发送至查找到的执行终端，实现智能化的语音调度流程。

实施例2：

本实施例提供一种智能语音调度系统，如图2所示，包括获取单元、识别单元、分类单元、判定单元、组建单元、匹配单元和发送单元，其中：

获取单元，用于获取目标人员的语音信息；

识别单元，用于提取语音信息的声纹特征，并将语音信息转换为对应的文本信息，所述文本信息包含数字编号和文本语句；

分类单元，用于将声纹特征导入预置的分类器模型进行声纹分类，得到声纹分类结果；

判定单元，用于根据声纹分类结果判定目标人员是否为权限人员，在判定目标人员为权限人员后，匹配到对应权限人员的指令库；

匹配单元，用于将第一匹配特征、第二匹配特征和第三匹配特征导入对应权限人员的指令库中进行检索匹配，得到对应的调度控制指令；

发送单元，用于根据数字编号将调度控制指令发送至对应的执行终端。

实施例3：

本实施例提供一种智能语音调度设备，如图3所示，在硬件层面，包括：

数据接口，用于建立处理器与外部语音采集设备的数据对接，以获取目标人员的语音信息；

存储器，用于存储指令；

处理器，用于读取所述存储器中存储的指令，并根据指令执行实施例1中的智能语音调度方法。

可选地，该计算机设备还包括内部总线。处理器与存储器和数据接口可以通过内部总线相互连接，该内部总线可以是ISA(Industry Standard Architecture，工业标准体系结构)总线、PCI(Peripheral Component Interconnect，外设部件互连标准)总线或EISA(Extended Industry Standard Architecture，扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。

所述存储器可以但不限于包括随机存取存储器(Random Access Memory，RAM)、只读存储器(Read Only Memory，ROM)、闪存(Flash Memory)、先进先出存储器(First InputFirst Output，FIFO)和/或先进后出存储器(First In Last Out，FILO)等。所述处理器可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

实施例4：

本实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有指令，当所述指令在计算机上运行时，使得所述计算机执行实施例1中的智能语音调度方法。其中，所述计算机可读存储介质是指存储数据的载体，可以但不限于包括软盘、光盘、硬盘、闪存、优盘和/或记忆棒(Memory Stick)等，所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。

本实施例还提供一种包含指令的计算机程序产品，当所述指令在计算机上运行时，使所述计算机执行实施例1中的智能语音调度方法。其中，所述计算机可以是通用计算机、专用计算机、计算机网络或者其他可编程系统。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明的保护范围。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：赵发云;陈民海;王越强;王荣业;马世雄;哈奕如;范海燕;张丽婷;李伟;王永娟;
专利申请人：国网青海省电力公司海北供电公司;