一种基于语音信号处理的意图识别系统

文献发布时间：2024-07-23 01:35:21

技术领域

本发明涉及语音识别技术领域，尤其涉及一种基于语音信号处理的意图识别系统。

背景技术

在现有技术中，基于模板匹配的方法已经被广泛应用于客户意图识别领域，其优点是实现简单、成本低廉；而基于深度学习的方法则可以通过对大量数据的训练来提高识别准确率。然而，上述两种方法仍然存在一些缺点，如无法处理非标准的语音信号、无法处理口音和方言等问题。

中国专利公开号：CN116665676A，公开了一种用于智能语音外呼系统的语义识别方法，属于语义识别技术领域，具体包括以下步骤：接收客户输入的语音信号，对所述语音信号进行预处理，将预处理后的语音信号转换为文本格式；对所述文本进行文字过滤，并对过滤后的文本进行语义分析，根据语义识别结果确定文本中各单词的含义；根据含义将单词归纳为标准的意图标签，对文本中的所有意图标签进行统计分析，确定客户想要咨询的业务领域，并提取对应业务领域的数据库内容，生成相应的回复内容。由此可见，所述语义识别方法，存在以下问题：无法针对输入的口音、方言、语速过快的情况进行适应性调整，并根据判断出的客户需求进行相关银行产品推荐。

发明内容

为此，本发明提供一种基于语音信号处理的意图识别系统，用以克服现有技术中无法针对输入的口音、方言、语速过快的情况进行适应性调整，并根据判断出的客户需求进行相关银行产品推荐的问题。

为实现上述目的，本发明提供一种基于语音信号处理的意图识别系统，包括，

客户端，其用于采集任一用户的语音信号；

系统预处理器，其与所述客户端相连接，用于对采集的语音信号进行预处理，所述预处理包括，对采集信号去除噪声并识别其中的人声并强化处理；

系统特征处理器，其与所述系统预处理器相连接，用于对强化的人声进行特征提取，包括，根据强化处理后的人声生成声谱图并分为若干分段语音，对任一分段语音进行语速调整判断生成调整语音包，根据调整语音包内的口音和方言词汇对其进行语音转译判断生成用户意图语句，并提取此用户的若干个需求特征；

系统识别推荐器，其与所述系统特征处理器相连接，对提取的特征进行意图识别和银行产品推荐，所述系统识别推荐器内根据此用户的用户行为模型，刻画出此用户在交易查询周期内此用户的雷达图，确定此用户的活跃等级，并根据用户的活跃等级和提取的需求特征建立此用户的意图若干个特征树，并判断用户活跃比值是否达到任一分支所关联的银行产品的要求，对此用户进行有关产品推荐，并根据此用户选择习惯建立产品选择习惯模型，更新特征树中分支所关联的银行产品，以及根据用户的语音输入次数对用户行为模型进行查询周期调节、根据任一特征树的存储时长对此特征树的存储时间进行调整。

进一步地，所述系统特征处理器内存有基础识别语速和语速调节基础时长，当任一用户的强化后人声进入所述系统特征处理器时，所述系统特征处理器根据强化处理后的人声生成声谱图，并将其根据语速调节基础时长分为若干分段语音，对于任一分段语音确定其实际识别语速，对比内部的基础识别语速，判断是否需要调整此分段语音的语速；

对于任一分段语音，

若实际识别语速大于基础识别语速，则调整此分段语音的语速减缓，直至实际识别语速小于或等于基础识别语速，进入下一分段语音的语速调整判断；

直至所有分段语音均完成语速调整判断，生成此用户的调整语音包对其进行语音转译判断。

进一步地，所述系统特征处理器内存有口音识别库和方言词库，对于所述调整语音包内的语音数据情况与所述口音识别库内的口音进行匹配，同时，关联方言词库，将调整语音包内的方言词汇转译成系统词汇，并对语音包内其他识别出的词汇进行汇总并进行直接转译，并将转译结果进行语序调整，使其变为用户意图语句并对其中的特征进行提取，所述提取的特征为此用户的若干个需求特征。

进一步地，在所述系统识别推荐器内设有此用户的用户行为模型、交易查询周期、预设查询周期个数，所述用户行为模型根据此用户历史完成的银行交易数据建立，并根据需求特征的采集时间向前回溯预设查询周期个数的交易查询周期，并刻画出所述交易查询周期内此用户的雷达图，算出此用户的雷达图面积，并确定此用户的活跃等级；

所述雷达图面积根据此用户的年龄、收入、现持有资金量、理财交易频率、投资交易频率、理财资金量确定；

在所述系统识别推荐器内针对此用户收入所处的数量级对此用户的现持有资金量、理财资金量、收入的节点进行比例调整。

进一步地，在所述系统识别推荐器内存有雷达图面积比例值，根据此用户的雷达图面积和完整的雷达图面积计算用户活跃比值，确定此用户的活跃等级，在所述系统识别推荐器内存有第一活跃比例、第二活跃比例、第三活跃比例，所述第一活跃比例最小，所述第二活跃比例大于所述第一活跃比例，第三活跃比例大于所述第二活跃比例；

当用户活跃比值小于等于第一活跃比例时，此用户处于第三活跃等级；

当用户活跃比值大于第一活跃比例，且小于等于第二活跃比例时，此用户处于第二活跃等级；

当用户活跃比值大于第二活跃比例时，此用户处于第一活跃等级。

进一步地，所述系统识别推荐器根据任一活跃等级下的此用户的若干个需求特征进行随机抽取，选取其中的部分特征，生成若干不同的特征树，将任一特征树的任一完整分支关联银行内部相关的理财产品或投资产品，再根据用户的活跃等级剔除其中没有达到产品要求的特征树的分支。

进一步地，在所述系统识别推荐器根据若干不同等级的产品存有对应的用户基础活跃比值，在所述系统识别推荐器根据用户活跃比值对比产品对应的用户基础活跃比值，判断是否剔除关联的分支；

若用户活跃比值小于用户基础活跃比值，则剔除特征树内此分支。

进一步地，在所述系统识别推荐器内存有选择周期和针对此用户建立的产品选择习惯模型，所述产品选择习惯模型，根据此用户在预设的前几个选择周期内的所有选择习惯建立，并实时更新选择此用户的选择习惯；

当所述用户行为模型再次对此用户的建立的特征树分支关联产品时，将若干关联产品在产品选择习惯模型进行对比，确定任一关联产品的选择比例，并将各关联产品进行选择比例，进行由高到低排序输出。

进一步地，针对用户行为模型的建立情况在所述系统识别推荐器内存有调节参数、预设输入次数范围，根据用户每一次的语音输入次数确定用户行为模型，是否需要进行交易查询周期调节；

当语音输入次数大于预设输入次数范围时，根据调节参数和交易查询周期计算调整周期，对用户行为模型的交易查询周期进行延长处理。

进一步地，针对每次建立的特征树，在所述系统识别推荐器内存有预设存储时长、预设关联时长，根据任一特征树的存储时长对此特征树的存储时间进行调整；

若存储时间大于预设存储时长，且，后续预设关联时长内出现此特征树内相同的分支情况时，则对此特征树进行存储时间延时处理；

若存储时间大于预设存储时长，且，后续预设关联时长内未出现此特征树内相同的分支情况时，则对此特征树进行删除处理；

若存储时间小于预设存储时长，则对此特征树继续进行存储时间调整判定。

与现有技术相比，本发明的有益效果在于，本发明将采集的用户语音信号生成声谱图，并对其中的口音和方言词汇进行调整，转译成意图成用户意图语句，并对其中用户的需求特征进行提取，结合刻画出的用户的雷达图确定用户的活跃等级，并建立用户意图的特征树与银行产品相关联，以达到根据用户在本银行的相关行为刻画进行的对应产品推荐，使意图识别系统用于银行客户的理财产品推荐过程中，减少人为推荐造成的繁琐程序，使用了先进的机器学习算法进行意图识别，提高了意图识别的精度。

进一步地，本发明对任一用户的输入语音进行语速判断并调整，使得意图识别系统在使用过程中适用用户各种语速情况，使意图识别系统能够准确调整用户的语速情况达到系统内部能够进行识别的范畴。

进一步地，本发明在意图识别系统对调整语音包内的语音数据情况进行口音识别并关联方言词库，进行方言词汇以便转译时能够准确匹配符合的系统词汇，并且对直接转译的结果进行语序调整，确保转译后的语句能够进行识别，同时，提取用户的需求特征形成对用户意图识别的数据基础。

进一步地，本发明在意图识别系统对用户生成雷达图以确定用户近期在本银行所进行的交易情况，并以此来确定此用户在本银行进行的交易行为，从而，达到刻画用户行为的目的，并为后续进行数据处理做铺垫。

进一步地，本发明在意图识别系统根据对刻画出的用户雷达图面积，确定此用户所处的活跃等级以便对用户进行有关产品推荐。

进一步地，本发明根据用户提取的需求特征随机抽取其中的一部分的需求特征，建立生成完整的特征树，并将任何一个完整的分支作为一个完整的意图，并关联银行内部相关的理财产品或投资产品，以此根据用户的意图确定推荐的银行产品。

进一步地，本发明将符合用户选择习惯的产品进行汇总，并将关联产品在用户与选择情况的比例值进行确定，以及排序，从而将符合用户选择习惯的产品进行优先展示，提高用户在使用此意图识别系统更加准确的贴合用户的需求，提高意图识别系统的准确度。

进一步地，本发明根据无法给出确定的意图识别下关联产品导致用户的多次语音输入行为，进行用户行为模型中的交易查询周期调整，使用户行为模型变更扩大查询范围，辅助意图识别系统进行意图识别。

进一步地，本发明针对每次基于用户建立的特征树的存储情况进行调整，以方便基于一段关联时长下用户连续输入的有关的语音中，存有部分关联的需求，意图识别系统能够更好的对用户的需求进行有关产品检索，有助于调整系统的参数，从而在后续建立特征树时提高意图识别系统的精度。

附图说明

图1为实施例所述意图识别系统的软件结构示意图；

图2为实施例所述意图识别系统内数据流程逻辑示意图；

图3为实施例所述意图识别系统对于编号为1的用户生成雷达图的示意图；

图4为实施例所述意图识别系统对于编号为1的用户提取的4条需求特征生成的特征树的示意图；

图5为实施例所述意图识别系统中特征树的存储时长调整的逻辑示意图。

具体实施方式

为了使本发明的目的和优点更加清楚明白，下面结合实施例对本发明作进一步描述；应当理解，此处所描述的具体实施例仅仅用于解释本发明，并不用于限定本发明。

下面参照附图来描述本发明的优选实施方式。本领域技术人员应当理解的是，这些实施方式仅仅用于解释本发明的技术原理，并非在限制本发明的保护范围。

需要说明的是，在本发明的描述中，术语“上”、“下”、“左”、“右”、“内”、“外”等指示的方向或位置关系的术语是基于附图所示的方向或位置关系，这仅仅是为了便于描述，而不是指示或暗示所述装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

此外，还需要说明的是，在本发明的描述中，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域技术人员而言，可根据具体情况理解上述术语在本发明中的具体含义。

请参阅图1、图2所示，图1为实施例所述意图识别系统的软件结构示意图，图2为实施例所述意图识别系统内数据流程逻辑示意图。

本发明提供了一种基于语音信号处理的意图识别系统，包括，

客户端，其用于采集任一用户的语音信号；

系统预处理器，其与所述客户端相连接，用于对采集的语音信号进行预处理，所述预处理包括，对采集信号去除噪声并识别其中的人声并强化处理；

本发明将采集的用户语音信号生成声谱图，并对其中的口音和方言词汇进行调整，转译成意图成用户意图语句，并对其中用户的需求特征进行提取，结合刻画出的用户的雷达图确定用户的活跃等级，并建立用户意图的特征树与银行产品相关联，以达到根据用户在本银行的相关行为刻画进行的对应产品推荐，使意图识别系统用于银行客户的理财产品推荐过程中，减少人为推荐造成的繁琐程序，使用了先进的机器学习算法进行意图识别，提高了意图识别的精度。

具体而言，本实施例中，所述系统特征处理器内存有基础识别语速和语速调节基础时长，当任一用户的强化后人声进入所述系统特征处理器时，所述系统特征处理器根据强化处理后的人声生成声谱图，并将其根据语速调节基础时长分为若干分段语音，对于任一分段语音确定其实际识别语速，对比内部的基础识别语速，判断是否需要调整此分段语音的语速；

对于任一分段语音，

若实际识别语速大于基础识别语速，则调整此分段语音的语速减缓，直至实际识别语速小于或等于基础识别语速，进入下一分段语音的语速调整判断；

直至所有分段语音均完成语速调整判断，生成此用户的调整语音包对其进行内容判断。

系统特征处理器内存有基础识别语速V0和语速调节基础时长Ty0。当任一用户的强化后人声处理后的声谱图时长为T1，根据语速调节基础时长Ty0可分为i段，任一段为分段语音Yi。

对于任一分段语音Y1，其实际识别语速为V1，若实际识别语速V1大于基础识别语速V0，则调整分段语音Y1的语速减缓，直至实际识别语速V1小于或等于基础识别语速V0，进入下一分段语音的语速调整判断，直至所有分段语音均完成语速调整判断，生成此用户的调整语音包对其进行内容判断。

本发明对任一用户的输入语音进行语速判断并调整，使得意图识别系统在使用过程中适用用户各种语速情况，使意图识别系统能够准确调整用户的语速情况达到系统内部能够进行识别的范畴。

具体而言，本实施例中，所述系统特征处理器内存有口音识别库和方言词库，对于所述调整语音包内的语音数据情况与所述口音识别库内的口音进行匹配，同时，关联方言词库，将调整语音包内的方言词汇转译成系统词汇，并对语音包内其他识别出的词汇进行汇总并进行直接转译，并将转译结果进行语序调整，使其变为用户意图语句并对其中的特征进行提取，所述提取的特征为此用户的若干个需求特征。

本发明在意图识别系统对调整语音包内的语音数据情况进行口音识别并关联方言词库，进行方言词汇以便转译时能够准确匹配符合的系统词汇，并且对直接转译的结果进行语序调整，确保转译后的语句能够进行识别，同时，提取用户的需求特征形成对用户意图识别的数据基础。

参阅图3所示，图3为实施例所述意图识别系统对于编号为1的用户生成雷达图的示意图，具体而言，本实施例中，在所述系统识别推荐器内设有此用户的用户行为模型、交易查询周期、预设查询周期个数，所述用户行为模型根据此用户历史完成的银行交易数据建立，并根据需求特征的采集时间向前回溯预设查询周期个数的交易查询周期，并刻画出所述交易查询周期内此用户的雷达图，算出此用户的雷达图面积，并确定此用户的活跃等级；

所述雷达图面积根据此用户的年龄、收入、现持有资金量、理财交易频率、投资交易频率、理财资金量确定；

在所述系统识别推荐器内针对此用户收入所处的数量级对此用户的现持有资金量、理财资金量、收入的节点进行比例调整。

在图3中，编号为1的用户生成的雷达图中，年龄为N1，投资交易频率为ft1，理财交易频率为fc1，收入为S1，现持有资金量为C1，理财资金量L1。

本发明在意图识别系统对用户生成雷达图以确定用户近期在本银行所进行的交易情况，并以此来确定此用户在本银行进行的交易行为，从而，达到刻画用户行为的目的，并为后续进行数据处理做铺垫。

具体而言，本实施例中，在所述系统识别推荐器内存有雷达图面积比例值，根据此用户的雷达图面积和完整的雷达图面积计算用户活跃比值，确定此用户的活跃等级，在所述系统识别推荐器内存有第一活跃比例、第二活跃比例、第三活跃比例，所述第一活跃比例最小，所述第二活跃比例大于所述第一活跃比例，第三活跃比例大于所述第二活跃比例；

当用户活跃比值小于等于第一活跃比例时，此用户处于第三活跃等级；

当用户活跃比值大于第一活跃比例，且小于等于第二活跃比例时，此用户处于第二活跃等级；

当用户活跃比值大于第二活跃比例时，此用户处于第一活跃等级。

本发明在意图识别系统根据对刻画出的用户雷达图面积，确定此用户所处的活跃等级以便对用户进行有关产品推荐。

具体而言，本实施例中，所述系统识别推荐器根据任一活跃等级下的此用户的若干个需求特征进行随机抽取，选取其中的部分特征，生成若干不同的特征树，将任一特征树的任一完整分支关联银行内部相关的理财产品或投资产品，再根据用户的活跃等级剔除其中没有达到产品要求的特征树的分支。

如图4所示，图4为实施例所述意图识别系统对于编号为1的用户提取的4条需求特征生成的特征树的示意图，具体而言，本实施例中，在所述系统识别推荐器根据若干不同等级的产品存有对应的用户基础活跃比值，在所述系统识别推荐器根据用户活跃比值对比产品对应的用户基础活跃比值，判断是否剔除关联的分支；

若用户活跃比值小于用户基础活跃比值，则剔除特征树内此分支。

编号为1的用户提取的需求特征包括，M01、M02、M03、M04、M05、M06。选取M01、M02、M03、M04生成的特征树中，完整的分支为一个完整的意图，包括，

第一条分支：M01、M02、M03、M04；

第二条分支：M01、M02、M03；

第三条分支：M01、M02、M04；

第四条分支：M01、M03、M04；

第五条分支：M01、M03；

第六条分支：M01、M04。

若第六条分支的关联产品为投资产品需要用户活跃至达到第一活跃等级，而此用户活跃等级为第二活跃等级，则删除第六条分支及关联产品。

本发明根据用户提取的需求特征随机抽取其中的一部分的需求特征，建立生成完整的特征树，并将任何一个完整的分支作为一个完整的意图，并关联银行内部相关的理财产品或投资产品，以此根据用户的意图确定推荐的银行产品。

具体而言，本实施例中，在所述系统识别推荐器内存有选择周期和针对此用户建立的产品选择习惯模型，所述产品选择习惯模型，根据此用户在预设的前几个选择周期内的所有选择习惯建立，并实时更新选择此用户的选择习惯；

本发明将符合用户选择习惯的产品进行汇总，并将关联产品在用户与选择情况的比例值进行确定，以及排序，从而将符合用户选择习惯的产品进行优先展示，提高用户在使用此意图识别系统更加准确的贴合用户的需求，提高意图识别系统的准确度。

具体而言，本实施例中，针对用户行为模型的建立情况在所述系统识别推荐器内存有调节参数、预设输入次数范围，根据用户每一次的语音输入次数的确定用户行为模型，是否需要进行交易查询周期调节；

当语音输入次数大于预设输入次数范围时，根据调节参数和交易查询周期计算调整周期，对用户行为模型的交易查询周期进行延长处理。

本发明根据无法给出确定的意图识别下关联产品导致用户的多次语音输入行为，进行用户行为模型中的交易查询周期调整，使用户行为模型变更扩大查询范围，辅助意图识别系统进行意图识别。

如图5所示，图5为实施例所述意图识别系统中特征树的存储时长调整的逻辑示意图，具体而言，本实施例中，针对每次建立的特征树，在所述系统识别推荐器内存有预设存储时长、预设关联时长，根据任一特征树的存储时长对此特征树的存储时间进行调整；

若存储时间大于预设存储时长，且，后续预设关联时长内出现此特征树内相同的分支情况时，则对此特征树进行存储时间延时处理；

若存储时间大于预设存储时长，且，后续预设关联时长内未出现此特征树内相同的分支情况时，则对此特征树进行删除处理；

若存储时间小于预设存储时长，则对此特征树继续进行存储时间调整判定。

本发明针对每次基于用户建立的特征树的存储情况进行调整，以方便基于一段关联时长下用户连续输入的有关的语音中，存有部分关联的需求，意图识别系统能够更好的对用户的需求进行有关产品检索，有助于调整系统的参数，从而在后续建立特征树时提高意图识别系统的精度。

至此，已经结合附图所示的优选实施方式描述了本发明的技术方案，但是，本领域技术人员容易理解的是，本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下，本领域技术人员可以对相关技术特征做出等同的更改或替换，这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述仅为本发明的优选实施例，并不用于限制本发明；对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：湖南三湘银行股份有限公司;

上一篇：基于热词图的语音识别方法、装置、设备及存储介质
下一篇：一种课堂状态确定方法、装置、介质和电子设备