语音检测的方法、装置、电子设备及存储介质

文献发布时间：2023-06-19 18:37:28

技术领域

本发明涉及语音质检技术领域，特别是涉及一种语音检测的方法、一种语音检测的装置、一种电子设备，以及一种计算机可读存储介质。

背景技术

语音质检通常用于检测销售或客服人员是否规范用语、是否服务到位，以提升客户满意度、实现客户有价值信息挖掘和提取。传统的语音质检通常由专门的质检人员进行人工质检，而由于往往场景的语音数据的庞大，以及传统的人工质检效率低下，传统语音质检难以实现语音数据全检。

现阶段出现了许多机器学习、深度学习来分析语义的方法，来协助语音质检。但是，基于语义的语音质检方法完全依赖于第三方的语音识别转写结果，对于一些特定场景往往语音识别效果很不理想，导致无法保证将语音的内容完全质检出来。

发明内容

鉴于上述问题，提出了本发明实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种语音检测的方法、一种语音检测的装置、一种电子设备，以及一种计算机可读存储介质。

为了解决上述问题，本发明实施例公开了一种语音检测的方法，包括：

将待检测的第一语音数据转换成文本数据；

基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值；

将所述预设关键词转换成第二语音数据，并基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值；

分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值；

基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。

可选地，所述基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值，包括：

检测所述文本数据中是否包括所述预设关键词，得到所述第一检测结果；

当所述第一监测结果指示所述文本数据中包括所述预设关键词时，则将所述第一分值确定为预设分值。

可选地，所述基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值，还包括：

当所述第一监测结果指示所述文本数据中不包括所述预设关键词时，则根据所述预设关键词对所述文本数据进行模糊匹配，得到至少一个匹配结果；

计算每个匹配结果与所述预设关键词的相似度，将所述相似度中的最大值确定为所述第一分值。

可选地，所述基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值，包括：

提取所述第一语音数据的至少一个第一语音特征，以及所述第二语音数据的至少一个第二语音特征；

计算每个所述第一语音特征与所述第二语音特征的相似度，将所述相似度中的最大值确定为所述第二分值。

可选地，所述基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果，包括：

若所述目标第一分值大于第一评分阈值，则计算所述目标第二分值与第一预设比例系数的乘积，得到第一目标乘积；

将所述第一目标乘积与所述目标第一分值相加，得到第三分值；

对所述第三分值进行归一化处理，得到目标第三分值；

判断所述目标第三分值是否属于第一预设区间，得到检索结果。

可选地，所述基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果，还包括：

若所述目标第一分值不大于第一评分阈值，则计算所述目标第二分值与第二预设比例系数的乘积，得到第二目标乘积；

将所述第二目标乘积与所述目标第一分值相加，得到第四分值；

对所述第四分值进行归一化处理，得到目标第四分值；

判断所述目标第四分值是否属于第一预设区间，得到检索结果。

可选地，所述分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值，包括：

获取至少一个所述预设关键词对应的所述第一分值，得到至少一个所述第一分值；

将至少一个所述第一分值中的最大值确定为第一数值；

将至少一个所述第一分值分别除以所述第一数值，得到至少一个所述预设关键词对应的所述目标第一分值；

获取至少一个所述预设关键词对应的所述第二分值，得到至少一个所述第二分值；

将至少一个所述第二分值中中的最大值确定为第二数值；

将至少一个所述第二分值分别除以所述第二数值，得到至少一个所述预设关键词对应的所述目标第二分值。

相应的，本发明实施例还公开了一种语音检测的装置，所述装置包括：

语音转换模块，用于将待检测的第一语音数据转换成文本数据；

关键词检测模块，用于基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值；

语音特征检测模块，用于将所述预设关键词转换成第二语音数据，并基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值；

归一化处理模块，用于分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值；

分值处理模块，用于基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。

可选地，所述关键词检测模块包括：

关键词检测子模块，用于检测所述文本数据中是否包括所述预设关键词，得到所述第一检测结果；

预设分值确定子模块，用于当所述第一监测结果指示所述文本数据中包括所述预设关键词时，则将所述第一分值确定为预设分值。

可选地，所述关键词检测模块还包括：

模糊匹配子模块，用于当所述第一监测结果指示所述文本数据中不包括所述预设关键词时，则根据所述预设关键词对所述文本数据进行模糊匹配，得到至少一个匹配结果；

第一分值确定子模块，用于计算每个匹配结果与所述预设关键词的相似度，将所述相似度中的最大值确定为所述第一分值。

可选地，所述语音特征检测模块包括：

特征提取子模块，用于提取所述第一语音数据的至少一个第一语音特征，以及所述第二语音数据的至少一个第二语音特征；

第二分值确定子模块，用于计算每个所述第一语音特征与所述第二语音特征的相似度，将所述相似度中的最大值确定为所述第二分值。

可选地，所述分值处理模块包括：

第一目标乘积确定子模块，用于若所述目标第一分值大于第一评分阈值，则计算所述目标第二分值与第一预设比例系数的乘积，得到第一目标乘积；

第三分值确定子模块，用于将所述第一目标乘积与所述目标第一分值相加，得到第三分值；

第三分值确定子模块，用于对所述第三分值进行归一化处理，得到目标第三分值；

第三分值判断子模块，用于判断所述目标第三分值是否属于第一预设区间，得到检索结果。

可选地，所述分值处理模块还包括：

第二目标乘积确定子模块，用于若所述目标第一分值不大于第一评分阈值，则计算所述目标第二分值与第二预设比例系数的乘积，得到第二目标乘积；

第四分值确定子模块，用于将所述第二目标乘积与目标所述第一分值相加，得到第四分值；

第四分值判断子模块，用于对所述第四分值进行归一化处理，得到目标第四分值；

第四分值判断子模块，用于判断所述目标第四分值是否属于第一预设区间，得到检索结果。

可选地，所述归一化处理模块包括：

第一分值获取子模块，用于获取至少一个所述预设关键词对应的所述第一分值，得到至少一个所述第一分值；

第一数值确定子模块，用于将至少一个所述第一分值中的最大值确定为第一数值；

第一分值相除子模块，用于将至少一个所述第一分值分别除以所述第一数值，得到至少一个所述预设关键词对应的所述目标第一分值；

第二分值获取子模块，用于获取至少一个所述预设关键词对应的所述第二分值，得到至少一个所述第二分值；

第二数值确定子模块，用于将至少一个所述第二分值中中的最大值确定为第二数值；

第二分值相除子模块，用于将至少一个所述第二分值分别除以所述第二数值，得到至少一个所述预设关键词对应的所述目标第二分值。

相应的，本发明实施例公开了一种电子设备，包括：处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述语音检测的方法实施例的各个步骤。

相应的，本发明实施例公开了一种计算机可读存储介质，所述计算机可读存储介质上存储计算机程序，所述计算机程序被处理器执行时实现上述语音检测的方法实施例的各个步骤。

本发明实施例包括以下优点：将待检测的第一语音数据转换成文本数据；基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值；将所述预设关键词转换成第二语音数据，并基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值；分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值；基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。本发明实施例可以将语音数据转换成文本数据，与预设关键词进行匹配，得到文本匹配的结果，为了防止某些场景中的数据无法被检测出来，还将预设关键词转换成目标语音数据，与语音数据进行匹配，得到语音匹配的结果，通过对文本数据和语音数据的双重检测，解决现有技术中，只是对语音识别转写后的文本进行检索或者对语音进行检索，导致无法检索出语音中需要的全部信息的问题。

附图说明

图1是本发明实施例提供的一种语音检测的方法的步骤流程图；

图2是本发明实施例提供的另一种语音检测的方法的步骤流程图；

图3是本发明实施例提供的一种语音检测的装置的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂，下面结合附图和具体实施方式对本发明作进一步详细的说明。

参照图1，示出了本发明实施例提供的一种语音检测的方法的步骤流程图，所述方法可以应用于服务器，具体可以包括如下步骤：

步骤101，将待检测的第一语音数据转换成文本数据。

为了提高客户的评价，提升客户体验，可以对客户的语音数据进行检测，实现客户有价值信息的挖掘和提取。

可以获取客户的待检测的第一语音数据，还可以将第一语音数据转换成文本数据，通过对文字数据的检测，起到对第一语音数据进行检测的作用。

步骤102，基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值。

在服务器中，可以储存多个预设关键词，也可以实时更新预设关键词。在获取到文本数据之后，可以根据预设关键词对文本数据进行关键词检测，得到预设关键词的第一检测结果，还可以基于第一检测结果进行第一评分处理，得到第一分值，其中，关键词检测可以包括判断预设关键词是否存在于文本数据中。

步骤103，将所述预设关键词转换成第二语音数据，并基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值。

在文本数据检测完成之后，有一些特殊场景的数据可能在文字数据上无法被检测出来，则需要将预设关键词装换成第二语音数据，基于第二语音数据对第一语音数据进行语音特征检测，可以得到第二检测结果，还可以基于第二检测结果进行第二评分处理，得到第二分值，其中，语音特征检测可以包括将第一语音数据和第二语音数据进行对比，得到对比结果。

步骤104，分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值

在得到第一分值之后，可以对第一分值进行归一化处理，从而可以得到第一分值对应的目标第一分值，同样，在得到第二分值之后，也可以对第二分值进行归一化处理，得到第二分值对应的目标第二分值。

步骤105，基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。

为了可以通过多方面对待检测的第一语音数据进行检测，得到更加准确的检测结果，可以对经过归一化处理得到的目标第一分值和目标第二分值进行处理，得到第一语音数据的语音检测最终的检测结果。

将待检测的第一语音数据转换成文本数据；基于文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于第一检测结果进行第一评分处理，得到第一分值；将预设关键词转换成第二语音数据，并基于第一语音数据和第二语音数据进行语音特征检测，得到第二检测结果，以及基于第二检测结果进行第二评分处理，得到所述第二分值；分别对第一分值和第二分值进行归一化处理，得到目标第一分值和目标第二分值；基于目标第一分值对目标第二分值进行处理，得到第一语音数据的语音检测的检测结果。本发明实施例可以将语音数据转换成文本数据，与预设关键词进行匹配，得到文本匹配的结果，为了防止某些场景中的数据无法被检测出来，还可以将预设关键词转换成目标语音数据，与语音数据进行匹配，得到语音匹配的结果，通过对文本数据和语音数据的双重检测，解决现有技术中，只是对语音识别转写后的文本进行检索或者对语音进行检索，导致无法检索出语音中需要的全部信息的问题。

参照图2，示出了本发明实施例提供的另一种语音检测的方法的步骤流程图，所述方法包括：

步骤201，将待检测的第一语音数据转换成文本数据；

步骤202，基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值；

在本发明实施例中，所述基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值，包括：

检测所述文本数据中是否包括所述预设关键词，得到所述第一检测结果；

当所述第一监测结果指示所述文本数据中包括所述预设关键词时，则将所述第一分值确定为预设分值。

可以检测待检测的第一语音数据转换成文本数据中是否包括预设关键词，得到第一监测结果，如果第一监测结果指示文本数据中包括预设关键词，则将第一分值确定为预设分值，例如，预设分值为1，预设关键词为目标数据，则当文本数据的内容中包括目标数据这几个字时，则确定预设关键词的第一分值为1。具体预设分值可以根据实际情况进行设置，本发明实施例对此不加以限制。

在本发明实施例中，所述基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值，还包括：

当所述第一监测结果指示所述文本数据中不包括所述预设关键词时，则根据所述预设关键词对所述文本数据进行模糊匹配，得到至少一个匹配结果；

计算每个匹配结果与所述预设关键词的相似度，将所述相似度中的最大值确定为所述第一分值。

如果第一监测结果指示文本数据中不包括预设关键词，则可以根据预设关键词对文本数据进行模糊匹配，得到至少一个匹配结果，然后计算每个匹配结果与预设关键词的相似度，从这些相似度获取数值最大的相似度，将这个相似度确定为第一分值，例如，预设关键词为“目标数据”，文本数据的匹配结果可以包括目标数值、目标对象、参考数据，目标数值与预设关键词的相似度可以为75，目标对象与预设关键词的相似度可以为50，参考数据与预设关键词的相似度可以为50，所以，75就是这些数值中的最大值，将75确定为第一分值。具体的相似度计算方法，可以根据实际情况进行设置，本发明实施例对此不加以限制。

步骤203，将所述预设关键词转换成第二语音数据，并提取所述第一语音数据的至少一个第一语音特征，以及所述第二语音数据的至少一个第二语音特征；

为了对待检测的第一语音数据进行更加全面的检测，可以将预设关键词转换成第二语音数据之后，提取第一语音数据的至少一个第一语音特征，以及第二语音数据的至少一个第二语音特征，其中，可以通过梅尔频率倒谱系数(Mel-frequency cepstralcoefficients，MFCC)提取语音特征。

步骤204，计算每个所述第一语音特征与所述第二语音特征的相似度，将所述相似度中的最大值确定为所述第二分值。

可以计算每个第一语音特征与每个第二语音特征的相似度，从这些相似度获取数值最大的相似度，将这个相似度确定为第二分值，例如，第一语音特征可以包括3个特征，第二语音特征可以包括2个特征，将第一语音特征的3个特征与第二语音特征的2个特征进行计算，可以得到6个相似度10、60、50、80、40、50，所以，80就是这些数值中的最大值，将75确定为第二分值。具体的相似度计算方法，可以根据实际情况进行设置，本发明实施例对此不加以限制。

步骤205，分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值；

在本发明实施例中，所述分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值，包括：

获取至少一个所述预设关键词对应的所述第一分值，得到至少一个所述第一分值；

将至少一个所述第一分值中的最大值确定为第一数值；

将至少一个所述第一分值分别除以所述第一数值，得到至少一个所述预设关键词对应的所述目标第一分值；

获取至少一个所述预设关键词对应的所述第二分值，得到至少一个所述第二分值；

将至少一个所述第二分值中中的最大值确定为第二数值；

将至少一个所述第二分值分别除以所述第二数值，得到至少一个所述预设关键词对应的所述目标第二分值。

当存在至少一个预设关键词时，可以得到每个预设关键词对应的第一分值，这样可以得到至少一个第一分值，然后从这些第一分值中获取数值最大的第一分值，将该第一分值确定为第一数值，将每一个第一分值都除以第一数值，可以得到每个第一分值对应的目标第一分值，例如，有3个预设关键词，第一分值分别为70、60、80，则第一数值为80，然后用70除以80，60除以80，80除以80，可以得到目标第一分值分别为0.875、0.75、1。还可以得到每个预设关键词对应的第二分值，这样可以得到至少一个第二分值，然后从这些第二分值中获取数值最大的第二分值，将该第二分值确定为第二数值，将每一个第二分值都除以第二数值，可以得到每个第二分值对应的目标第二分值，例如，有3个预设关键词，第二分值分别为50、20、80，则第二数值为80，然后用50除以80，20除以80，80除以80，可以得到目标第二分值分别为0.625、0.25、1。

步骤206，基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。

在本发明实施例中，所述基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果包括：

若所述目标第一分值大于第一评分阈值，则计算所述目标第二分值与第一预设比例系数的乘积，得到第一目标乘积；

将所述第一目标乘积与所述目标第一分值相加，得到第三分值；

对所述第三分值进行归一化处理，得到目标第三分值；

判断所述目标第三分值是否属于第一预设区间，得到检索结果。

在得到文本数据的目标第一分值和语音数据的目标第二分值之后，可以对文本数据归一化处理后的目标第一分值进行判断，如果目标第一分值大于第一评分阈值，则可以将目标第二分值乘以第一预设比例系数，得到第一目标乘积，再将第一目标乘积加上目标第一分值，可以得到第三分值，再对第三分值进行归一化处理，可以得到第三分值对应的目标第三分值，例如，第一评分阈值为0.6，目标第一分值为0.875，目标第二分值为0.625，第一预设比例系数为0.2，因为目标第一分值大于0.6，所以将第二分值0.625乘以第一预设比例系数0.2，得到第一目标乘积0.125，再将第一目标乘积0.125加上第一分值0.875，得到第三分值1，通过第一预设比例系数，可以将第三分值控制在0-1之间，归一化的过程可以为当存在至少一个预设关键词时，可以得到每个预设关键词对应的第三分值，这样可以得到至少一个第三分值，然后从这些第三分值中获取数值最大的第三分值，将该第三分值确定为第三数值，将每一个第三分值都除以第三数值，可以得到每个第三分值对应的目标第三分值，例如，有3个预设关键词，第三分值分别为1、0.6、0.8，则第三数值为1，然后用1除以1，0.6除以1，0.8除以1，可以得到目标第三分值分别为1、0.6、0.8。对这些第三分值进行归一化处理，可以得到处于0-1之间的目标第三分值，具体的第一评分阈值和第一预设比例系数可以根据实际情况进行设置，本发明实施例对此不加以限制。

在得到目标第三分值之后，可以对目标第三分值进行判断，当目标第三分值属于第一预设区间时，可以将第一预设区间对应的结果作为检测结果，当目标第三分值不属于第一预设区间时，可以得到对应的检测结果，其中，第一预设区间对应的结果可以为合格，不属于第一预设区间对应的结果可以为不合格，例如，第一预设区间可以为0.7-1，当目标第三分值处于第一预设区间时，检测结果为合格，当分值不处于第易预设区间时，检测结果为不合格。具体第一预设区间、第一预设区间对应的结果可以根据实际情况进行设置，本发明实施例对此不加以限制。

在本发明实施例中，所述基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果还包括：

若所述目标第一分值不大于第一评分阈值，则计算所述目标第二分值与第二预设比例系数的乘积，得到第二目标乘积；

将所述第二目标乘积与所述目标第一分值相加，得到第四分值；

对所述第四分值进行归一化处理，得到目标第四分值；

判断所述目标第四分值是否属于第一预设区间，得到检索结果。

如果目标第一分值不大于第一评分阈值，则可以将目标第二分值乘以第二预设比例系数，得到第二目标乘积，再将第二目标乘积加上目标第一分值，可以得到第四分值，其中，第一预设比例系数小于第二预设比例系数，再对第三分值进行归一化处理，可以得到第三分值对应的目标第三分值，例如，第一评分阈值为0.6，目标第一分值为0.4，目标第二分值为0.7，第二预设比例系数为0.6，因为目标第一分值小于0.6，所以将目标第二分值0.7乘以第二预设比例系数0.6，得到第二目标乘积0.42，再将第二目标乘积0.42加上目标第一分值0.4，得到第四分值0.82，通过第二预设比例系数，可以将第四分值控制在0-1之间，归一化的过程可以为当存在至少一个预设关键词时，可以得到每个预设关键词对应的第四分值，这样可以得到至少一个第四分值，然后从这些第四分值中获取数值最大的第四分值，将该第四分值确定为第四数值，将每一个第四分值都除以第四数值，可以得到每个第四分值对应的目标第四分值，例如，有3个预设关键词，第四分值分别为0.82、0.4、0.5，则第四数值为0.82，然后用0.82除以0.82，0.4除以0.82，0.5除以0.82，可以得到目标第四分值分别为1、0.49、0.61。对这些第四分值进行归一化处理，可以得到处于0-1之间的目标第四分值，具体的第一评分阈值和第二预设比例系数可以根据实际情况进行设置，本发明实施例对此不加以限制。

在得到目标第四分值之后，可以对目标第四分值进行判断，当目标第四分值属于第一预设区间时，可以将第一预设区间对应的结果作为检测结果，当目标第四分值不属于第一预设区间时，可以得到对应的检测结果，其中，第一预设区间对应的结果可以为合格，不属于第一预设区间对应的结果可以为不合格，例如，第一预设区间可以为0.7-1，当目标第四分值处于第一预设区间时，检测结果为合格，当分值不处于第易预设区间时，检测结果为不合格。具体第一预设区间、第一预设区间对应的结果可以根据实际情况进行设置，本发明实施例对此不加以限制。

将待检测的第一语音数据转换成文本数据；基于文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于第一检测结果进行第一评分处理，得到第一分值；将预设关键词转换成第二语音数据，并提取第一语音数据的至少一个第一语音特征，以及第二语音数据的至少一个第二语音特征；计算第一语音特征与第二语音特征的相似度，将相似度中的最大值确定为第二分值；分别对第一分值和第二分值进行归一化处理，得到目标第一分值和目标第二分值；基于目标第一分值对目标第二分值进行处理，得到第一语音数据的语音检测的检测结果。本发明实施例可以将语音数据转换成文本数据，与预设关键词进行匹配，得到文本匹配的结果，为了防止某些场景中的数据无法被检测出来，还可以将预设关键词转换成目标语音数据，提取目标语音数据和语音数据的语音特征，再计算相似度，从而对语音数据进行匹配，得到语音匹配的结果，通过对文本数据和语音数据的双重检测，解决现有技术中，只是对语音识别转写后的文本进行检索或者对语音进行检索，导致无法检索出语音中需要的全部信息的问题。

需要说明的是，对于方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本发明实施例并不受所描述的动作顺序的限制，因为依据本发明实施例，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作并不一定是本发明实施例所必须的。

参照图3，示出了本发明实施例提供的一种语音检测的装置的结构框图，具体可以包括如下模块：

语音转换模块301，用于将待检测的第一语音数据转换成文本数据；

关键词检测模块302，用于基于所述文本数据和预设关键词进行关键词检测，得到第一检测结果，并基于所述第一检测结果进行第一评分处理，得到第一分值；

语音特征检测模块303，用于将所述预设关键词转换成第二语音数据，并基于所述第一语音数据和所述第二语音数据进行语音特征检测，得到第二检测结果，以及基于所述第二检测结果进行第二评分处理，得到所述第二分值；

归一化处理模块，用于分别对所述第一分值和所述第二分值进行归一化处理，得到目标第一分值和目标第二分值；

分值处理模块304，用于基于所述目标第一分值对所述目标第二分值进行处理，得到所述第一语音数据的语音检测的检测结果。

可选地，所述关键词检测模块包括：

关键词检测子模块，用于检测所述文本数据中是否包括所述预设关键词，得到所述第一检测结果；

预设分值确定子模块，用于当所述第一监测结果指示所述文本数据中包括所述预设关键词时，则将所述第一分值确定为预设分值。

可选地，所述关键词检测模块还包括：

第一分值确定子模块，用于计算每个匹配结果与所述预设关键词的相似度，将所述相似度中的最大值确定为所述第一分值。

可选地，所述语音特征检测模块包括：

特征提取子模块，用于提取所述第一语音数据的至少一个第一语音特征，以及所述第二语音数据的至少一个第二语音特征；

第二分值确定子模块，用于计算每个所述第一语音特征与所述第二语音特征的相似度，将所述相似度中的最大值确定为所述第二分值。

可选地，所述分值处理模块包括：

第一目标乘积确定子模块，用于若所述目标第一分值大于第一评分阈值，则计算所述目标第二分值与第一预设比例系数的乘积，得到第一目标乘积；

第三分值确定子模块，用于将所述第一目标乘积与所述目标第一分值相加，得到第三分值；

第三分值确定子模块，用于对所述第三分值进行归一化处理，得到目标第三分值；

第三分值判断子模块，用于判断所述目标第三分值是否属于第一预设区间，得到检索结果。

可选地，所述分值处理模块还包括：

第二目标乘积确定子模块，用于若所述目标第一分值不大于第一评分阈值，则计算所述目标第二分值与第二预设比例系数的乘积，得到第二目标乘积；

第四分值确定子模块，用于将所述第二目标乘积与所述目标第一分值相加，得到第四分值；

第四分值判断子模块，用于对所述第四分值进行归一化处理，得到目标第四分值；

第四分值判断子模块，用于判断所述目标第四分值是否属于第一预设区间，得到检索结果。

可选地，所述归一化处理模块包括：

第一分值获取子模块，用于获取至少一个所述预设关键词对应的所述第一分值，得到至少一个所述第一分值；

第一数值确定子模块，用于将至少一个所述第一分值中的最大值确定为第一数值；

第一分值相除子模块，用于将至少一个所述第一分值分别除以所述第一数值，得到至少一个所述预设关键词对应的所述目标第一分值；

第二分值获取子模块，用于获取至少一个所述预设关键词对应的所述第二分值，得到至少一个所述第二分值；

第二数值确定子模块，用于将至少一个所述第二分值中中的最大值确定为第二数值；

第二分值相除子模块，用于将至少一个所述第二分值分别除以所述第二数值，得到至少一个所述预设关键词对应的所述目标第二分值。

对于装置实施例而言，由于其与方法实施例基本相似，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本发明实施例还提供了一种电子设备，包括：

包括处理器、存储器及存储在所述存储器上并能够在所述处理器上运行的计算机程序，该计算机程序被处理器执行时实现上述语音检测的方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质上存储计算机程序，计算机程序被处理器执行时实现上述语音检测的方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本说明书中的各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。

本领域内的技术人员应明白，本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此，本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上，使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明实施例的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改。

最后，还需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。

以上对本发明所提供的一种语音检测的方法、一种语音检测的装置、一种电子设备，以及一种计算机可读存储介质，进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：张云斌;
专利申请人：长城汽车股份有限公司;