掌桥专利:专业的专利平台
掌桥专利
首页

一种基于呼叫中心通话录音的热词分析系统

文献发布时间:2023-06-19 11:35:49


一种基于呼叫中心通话录音的热词分析系统

技术领域

本发明属于NLP自然语言处理技术领域,具体涉及一种基于呼叫中心通话录音的热词分析系统。

背景技术

传统的呼叫中心录音热词分析,一般时把实时通话保存为语音文件,然后通过人工方法,使用传统经验进行人工听取、分析。传统方法对热词标签覆盖率不够高,没有固定标准,口口相传,太过依赖于行业传统经验,难以在多维度对热词进行分析。同时由于的不同的分析人员由于经验、认知的理解的不一致,分析结果也不好统一,导致无法形成精准、可靠的分析结果,客户也很难认可分析结果。

发明内容

本发明的目的在于提供一种基于呼叫中心通话录音的热词分析系统,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;

ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;

NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;

执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;

分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。

优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。

优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);

对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;

依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。

优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。

与现有技术相比,本发明的有益效果是:本发明使用了NLP自然语言处理技术、语音识别技术、中文分词技术等,通过自研热词分析算法模型实现分析结果;解决了传统的呼叫中心录音分析中对热词标签覆盖率不够高,没有固定标准,太过于依赖行业传统经验,难以在多维度对热词进行分析的问题;本发明实现了准确率更高的识别引擎,私有化部署,确保数据安全,定制语音识别引擎,识别一切想识别的专有词,对现有的热词进行标准化定义,使多维度分析统一化。

附图说明

图1为本发明的热词分析算法模型原理示意图;

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1

请参阅图1,本发明提供一种技术方案:一种基于呼叫中心通话录音的热词分析系统,包括执行实时通话转录音服务模块,通过实时通话转为录音服务模块保存呼叫中心实时录音数据,以便后续分析提取录音数据;

ASR服务模块,将通话录音文件提取转换为文本,自动保存到数据库,以便下一过程进行分析;

NLP模块是对文本文件进行分析,主要为语义识别,该模块基于大数据及算法模型搭建,主要包括词法分析技术,语句分析技术,语义分析技术,语用分析技术;分别对于文本进行了自然语言处理,自然语言理解,自然语言生成,分词,词干提取,词形还原,词性标注;

执行热词分析算法模型,通过算法模型,自动进行中文分词处理,对分出的词汇进行类型判定,对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地,最终输入分析结果,如热词类型、词语名、词频,以及词云图;

分析结果呈现,多种维度的数据分析结果呈现,依据大数据进行的可靠数据分析结果,给相关部门提供科学的辅助决策。

本实施例中,优选的,ASR服务模块进行了录音特征提取,模式匹配,参考模式这三个基本单元,ASR服务模块包括两部分,主要为训练和识别;训练通常通过离线完成,对预先收集好的语音,语言数据库进行信号处理和知识挖掘,获取语音所需要的“声学模型”和“语言模型”;而识别通常是在线完成的,对录音进行实时提取处理,进行自动识别,将语音文件转化为文本文件。

本实施例中,优选的,对数据中取到的文本内容进行分词处理,对分出的词汇进行类型判定(词性判定,类似于动名词人名地名等);

对分词结果进行词频统计并关联工单问题属地,计算每个热词的问题属地topN;

依次在界面上展示热词类型、词语名、词频,并做词云图,词云图左上角展示数据源时间周期,中部展示词云图,单击单个热词可展示该热词的问题属地topN及其出现次数;右下角展示导出词云图日期。

本实施例中,优选的,实时通话转录音服务模块的实时通话转换录音的技术涉及大型呼叫中心,并发多路转换技术。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

相关技术
  • 一种基于呼叫中心通话录音的热词分析系统
  • 一种基于呼叫中心系统线路资源的利用和管控分析方法
技术分类

06120112980795