一种用于智能语音外呼系统的语义识别方法

文献发布时间：2024-01-17 01:26:37

技术领域

本发明涉及语义识别技术领域，具体涉及一种用于智能语音外呼系统的语义识别方法。

背景技术

语音识别技术是一种将人类语音转换为可读文本的技术，已经在各种领域得到广泛应用。随着人工智能和自然语言处理技术的不断发展，语音识别的准确性和智能化程度不断提高，成为人们日常生活中不可或缺的一部分。

在智能语音外呼系统中，语音识别技术用于将客户输入的语音信号转换为文本格式，以便后续进行语义分析、意图分类等操作。然而，由于语音信号的特殊性质(如噪声、口音、语速等)，以及不同领域的专业术语和表达方式的差异性，导致传统的语音识别技术在实际应用中存在一定的局限性和误差率。

为了解决这些问题，研究人员提出了多种改进方法，包括使用深度学习模型、引入上下文信息、使用预训练模型等。这些方法可以提高语音识别的准确性和鲁棒性，但仍然存在一些问题，如对特定领域的适应性不足、对复杂语句的理解能力有限等，并且无法针对不同客户的特定需求进行针对性回复。

发明内容

本发明的目的在于提供一种用于智能语音外呼系统的语义识别方法，解决以下技术问题：

现有语义识别技术对特定领域的适应性不足、对复杂语句的理解能力有限等，并且无法针对不同客户的特定需求进行针对性回复。

本发明的目的可以通过以下技术方案实现：

一种用于智能语音外呼系统的语义识别方法，包括以下步骤：

接收客户输入的语音信号，对所述语音信号进行预处理，将预处理后的语音信号转换为文本格式；

对所述文本进行文字过滤，并对过滤后的文本进行语义分析，根据语义识别结果确定文本中各单词的含义；

根据含义将单词归纳为标准的意图标签，对文本中的所有意图标签进行统计分析，确定客户想要咨询的业务领域，并提取对应业务领域的数据库内容，生成相应的回复内容；

对所述意图标签进行统计分析的过程为：

建立数据库，所述数据库内存储有已标注业务领域的意图标签，所述意图标签同时与若干个业务领域相关，生成所述意图标签与不同业务领域相关度p，将文本中所有单词归纳为对应的意图标签，统计任一业务领域对应涉及的意图标签的相关度p1,p2,…,pn，筛选所述相关度p1,p2,…,pn中超过预设阈值a的意图标签，分别统计各个业务领域中相关度超过a的意图标签占所有意图标签的比例b，若存在业务领域的a*b≥0.7，则判定对应的业务领域为客户所咨询的业务领域，若不存在a*b≥0.7，则继续识别客户语音信号；

单词意图标签与业务领域的相关度的评价过程为：

从所述文本中提取出文本特征，所述文本特征包括文本长度、命名实体、词频和情感信息，使用深度学习模型建立相关度打分模型，并使用已标注的数据库对相关度打分模型进行验证和优化；将所述文本特征输入到优化后的相关度打分模型中，输出文本中单词对应意图标签的相关度评级分数。

作为本发明进一步的方案：所述预处理的过程为：

设置分贝阈值去除语音信号中的低音部分，并对其余部分进行分帧和加窗，通过IIR滤波器和FIR滤波器分别消除高频噪声和低频噪声，并对降噪后的语音信号进行谱压缩增强处理。

作为本发明进一步的方案：所述文字过滤的过程为：

通过正则表达式去除所述文本中的特殊字符，并将所述特殊字符替换为空白字符串，所述特殊字符包括标点符号、网址和电话号码；使用预定义的停用词列表去除所述文本中的停用词，所述停用词包括“的”、“是”和“了”。

作为本发明进一步的方案：所述语义分析还包括情感识别：

步骤一：使用自然语言处理技术从已标注的文本中提取出与情感相关的特征，包括词性、句法结构、词汇频率；

步骤二：使用机器学习算法对提取的特征进行训练，建立情感分类模型；

步骤三：将客户文本输入到已经训练好的情感分类模型中，根据模型的预测结果判断客户文本的情感极性是正面、负面还是中性。

作为本发明进一步的方案：记录下来访客户号码，将来访客户的意图标签和对应内容存储在数据库中，待号码对应客户后续呼叫时进行调用。

本发明的有益效果：

（1）本发明将所述文本进行文字过滤，对过滤后的文本进行语义分析，根据语义分析结果识别客户意图，可以更准确地理解客户的需求和意图；

（2）本发明对客户意图进行分类并添加意图标签，将意图标签与对应的业务领域进行匹配，生成相应的回复内容，可以根据不同业务领域的需求提供个性化的服务；

（3）本发明在语义分析的过程中，包括情感识别和意图分类的过程，可以更全面地了解客户的情感状态和需求，通过建立数据库存储已标注业务领域和相关程度的预设标签以及客户号码等信息，可以提高系统的效率和准确性。

附图说明

下面结合附图对本发明作进一步的说明。

图1是本发明一种用于智能语音外呼系统的语义识别方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

请参阅图1所示，本发明为一种用于智能语音外呼系统的语义识别方法，包括以下步骤：

接收客户输入的语音信号，对所述语音信号进行预处理，将预处理后的语音信号转换为文本格式；

对所述文本进行文字过滤，并对过滤后的文本进行语义分析，根据语义识别结果确定文本中各单词的含义；

根据含义将单词归纳为标准的意图标签，对文本中的所有意图标签进行统计分析，确定客户想要咨询的业务领域，并提取对应业务领域的数据库内容，生成相应的回复内容。

具体进一步的过程为：

语音信号输入：智能语音外呼系统通过麦克风采集客户的语音信号；

预处理：将采集到的语音信号进行预处理，包括降噪、分帧、加窗等操作，以提高语音识别的准确性和稳定性；

文本转换：使用基于BERT、BiLSTM和CRF的混合模型对预处理后的语音信号进行文本转换，得到对应的文本内容；

意图分类：根据客户输入的文本内容，使用自然语言处理技术对文本进行语义分析，识别出客户的意图，匹配对应的业务标签，并将其归纳为不同的业务领域；

回复生成：根据客户的意图和业务领域，系统可以自动生成相应的回复内容，包括文字、语音等多种形式；

存储与调用：将已联系客户的意图标签和响应内容存储在数据库中，待对应客户后续呼叫时进行调用；同时，可以将该系统部署在云服务器上，实现远程调用和管理。

在本发明的一种优选的实施例中，所述预处理的过程为：

在本发明的另一种优选的实施例中，所述文字过滤的过程为：

在本发明的另一种优选的实施例中，对所述意图标签进行统计分析的过程为：

在本实施例的一种优选的情况中，单词意图标签与业务领域的相关度的评价过程为：

在本发明的另一种优选的实施例中，所述语义分析还包括情感识别：

步骤一：使用自然语言处理技术从已标注的文本中提取出与情感相关的特征，包括词性、句法结构、词汇频率；

步骤二：使用机器学习算法对提取的特征进行训练，建立情感分类模型；

步骤三：将客户文本输入到已经训练好的情感分类模型中，根据模型的预测结果判断客户文本的情感极性是正面、负面还是中性。

在本发明的另一种优选的实施例中，记录下来访客户号码，将来访客户的意图标签和对应内容存储在数据库中，待号码对应客户后续呼叫时进行调用。

以上对本发明的一个实施例进行了详细说明，但所述内容仅为本发明的较佳实施例，不能被认为用于限定本发明的实施范围。凡依本发明申请范围所作的均等变化与改进等，均应仍归属于本发明的专利涵盖范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：齐越;
专利申请人：枣庄福缘网络科技有限公司;