掌桥专利:专业的专利平台
掌桥专利
首页

一种电话号码状态判断方法及系统

文献发布时间:2023-06-19 11:14:36


一种电话号码状态判断方法及系统

技术领域

本发明涉及互联网技术领域,具体涉及一种电话号码状态判断方法及系统。

背景技术

在智能外呼的应用场景中,拨打的客户号码状态是十分重要的信息,以便根据客户号码状态进行相应的响应策略,从而提高外呼效率。

相关的客户号码状态的判断方法为:人工标注判断和状态码检测判断。

人工标注判断:对于规模较小的呼叫中心,一般由人工外呼来完成,坐席人员根据客户的反馈直接进行标注和记录,但在人工智能愈发发达的今天,大规模的外呼系统上,这种方案需要大量的人工,运营的成本会有极大的浪费,效率不够高。

状态码检测判断:在电话网络的搭建中,对于电话的拨打会在电信网关返回相关的状态码,一般的智能外呼系统会根据该信息对客户号码状态进行记录。但由于目前的电信行业业务越来越丰富,组网的复杂度越来越高,网络运营商状态码的扩充无法得到统一的标准,客户号码状态的判断准确率受到了很大的影响。

为了更好地服务用户的同时,同时规避对用户造成的骚扰,且更加真实地反馈业务状态,在呼叫用户时,对该号码状态判断的准确性显得尤为重要。

发明内容

为解决现有技术中的问题,本发明提供一种电话号码状态判断方法及系统,通过设置关键词词库和检索评分模块,在音频数据内检索是否含有关键词词库内的关键词来评分,从而根据评分判断通话号码的状态,大幅度提高了对客户号码状态判断的准确性。

本发明的一种电话号码状态判断方法包括如下步骤:

步骤1:系统接收运营商返回的音频数据;

步骤2:系统以单次完整通话为单位对音频数据进行梳理;

步骤3:系统将梳理后的音频数据进行语音端点检测并切割分段;

步骤4:系统将分段后的音频数据转译成文本信息;

步骤5:系统将转译后的文本信息在关键词词库内进行检索评分;

步骤6:系统判断转译后的文本信息内是否有关键词获得权重分;

步骤7:当转译后的文本信息内有关键词获得权重分时,系统根据单段音频内最高权重分的关键词来判断音频所属通话号码的状态;

步骤8:系统返回通话号码的状态值并保存和显示。

本发明作进一步改进,在所述步骤6中,当转译后的文本信息内没有关键词获得权重分时,还包括以下步骤:

步骤601:系统将未获得权重分的文本信息加入待标注词库;

步骤602:系统判断未获得权重分的文本信息所属音频是否存在运营商返回的状态码;

步骤603:当未获得权重分的文本信息所属音频存在运营商返回的状态码时,系统根据状态码判断音频所属通话号码的状态,并执行步骤8。

本发明作进一步改进,在所述步骤602中,当未获得权重分的文本信息所属音频不存在运营商返回的状态码时,还包括以下步骤:

步骤6021:系统梳理出该文本信息的唯一关键词并判断其对应的通话号码的状态;

步骤6022:系统判断关键词词库是否存在该唯一关键词对应的通话号码的状态;

步骤6023:当关键词词库存在该唯一关键词对应的通话号码的状态时,系统分析该唯一关键词出现的频率并设置权重分;

步骤6024:系统将该唯一关键词和对应权重分存入关键词词库,返回执行步骤2。

本发明作进一步改进,在所述步骤6022中,当关键词词库不存在该唯一关键词对应的通话号码的状态时,系统将该唯一关键词的权重分设置为100分,并执行步骤6024。

本发明作进一步改进,在所述步骤1中,所述运营商返回的音频数据包括通话音频和运营商对该通话音频所做出判断的状态码。

本发明作进一步改进,在所述步骤5中,所述关键词词库内预存有多个关键词及每一个关键词对应的权重分。

本发明作进一步改进,所述关键词词库内,所述关键词对应的权重分最高分为100分。

本发明作进一步改进,在所述步骤7中,当系统已经发现一次完整通话中的一段音频数据中有关键词获得对应的权重分时,则判定该单段音频内最高权重分的关键词所对应的通话号码的状态为音频所属通话号码的状态,同时不再对该完整通话中其他未处理的分段音频数据进行处理。

本发明还提供一种实现上述的电话号码状态判断方法的系统,包括:

接收模块,用于接收运营商返回的音频数据;

存储模块,用于存储音频数据和通话号码的状态值;

梳理模块,用于对音频数据进行梳理;

语音端点检测模块,用于对音频数据进行语音端点检测并切割分段;

文本转语音模块,用于将音频数据转译成文本信息;

关键词词库,用于存储关键词及关键词所对应的权重分信息;

检索评分模块,用于将文本信息在关键词词库内进行检索评分;

判断模块,用于判断转译后的文本信息内是否有关键词获得权重分,用于根据单段音频内最高权重分的关键词来判断音频所属通话号码的状态,还用于判断未获得权重分的文本信息所属音频是否存在运营商返回的状态码;

显示模块,用于通话号码的状态值。

本发明的有益效果是:通过设置关键词词库和检索评分模块,在音频数据内检索是否含有关键词词库内的关键词,然后对关键词进行评分,从而根据获得最高权重分的关键词来判断通话号码的状态,大幅度提高了对客户号码状态判断的准确性,如果音频数据内不存在关键词库内的关键词,则将该音频数据进行解析,扩增新的关键字及对应权重分存入关键词词库,进一步提高了系统对客户号码状态判断的准确性。

附图说明

图1为本发明的一种电话号码状态判断方法的流程图。

具体实施方式

下面结合附图和实施例对本发明做进一步详细说明。

请参见图1,本发明的一种电话号码状态判断方法包括如下步骤:

步骤1:系统接收运营商返回的音频数据;

步骤2:系统以单次完整通话为单位对音频数据进行梳理;

步骤3:系统将梳理后的音频数据进行语音端点检测并切割分段;

步骤4:系统将分段后的音频数据转译成文本信息;

步骤5:系统将转译后的文本信息在关键词词库内进行检索评分;

步骤6:系统判断转译后的文本信息内是否有关键词获得权重分;

步骤7:当转译后的文本信息内有关键词获得权重分时,系统根据单段音频内最高权重分的关键词来判断音频所属通话号码的状态;

步骤8:系统返回通话号码的状态值并保存和显示。

语音端点检测(Voice Activity Detection,VAD)又称语音活动检测,语音边界检测。目的是从声音信号流里识别和消除长时间的静音期,以达到在不降低业务质量的情况下节省话路资源的作用,它是IP电话应用的重要组成部分,静音抑制可以节省宝贵的带宽资源,可以有利于减少用户感觉到的端到端的时延。本实施例通过对梳理后的音频数据进行语音端点检测可以把音频数据识别成若干个音频段落,然后将音频数据切割分段得到若干个具备有效信息的不含静音期的音频段落。

自动语音识别技术(Automatic Speech Recognition)是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论、信息论、计算机科学等众多学科紧密相连。由于语音信号的多样性和复杂性,语音识别系统只能在一定的限制条件下获得满意的性能,或者说只能应用于某些特定的场合。语音识别系统的性能大致取决于以下4类因素:识别词汇表的大小和语音的复杂性;语音信号的质量;单个说话人还是多说话人;硬件。本实施例中通过自动语音识别技术依次将分段后的音频数据转译成文本信息。

请参见图1,在所述步骤6中,当转译后的文本信息内没有关键词获得权重分时,还包括以下步骤:

步骤601:系统将未获得权重分的文本信息加入待标注词库;

步骤602:系统判断未获得权重分的文本信息所属音频是否存在运营商返回的状态码;

步骤603:当未获得权重分的文本信息所属音频存在运营商返回的状态码时,系统根据状态码判断音频所属通话号码的状态,并执行步骤8。

请参见图1,在所述步骤602中,当未获得权重分的文本信息所属音频不存在运营商返回的状态码时,还包括以下步骤:

步骤6021:系统梳理出该文本信息的唯一关键词并判断其对应的通话号码的状态;

步骤6022:系统判断关键词词库是否存在该唯一关键词对应的通话号码的状态;

步骤6023:当关键词词库存在该唯一关键词对应的通话号码的状态时,系统分析该唯一关键词出现的频率并设置权重分;

步骤6024:系统将该唯一关键词和对应权重分存入关键词词库,返回执行步骤2。

请参见图1,在所述步骤6022中,当关键词词库不存在该唯一关键词对应的通话号码的状态时,系统将该唯一关键词的权重分设置为100分,并执行步骤6024。

请参见图1,在所述步骤1中,所述运营商返回的音频数据包括通话音频和运营商对该通话音频所做出判断的状态码,所述状态码就是运营商返回的SIP信令。SIP(SessionInitiation Protocol,会话初始协议)是由IETF(Internet Engineering Task Force,因特网工程任务组)制定的多媒体通信协议,它是一个基于文本的应用层控制协议,用于创建、修改和释放一个或多个参与者的会话,广泛应用于CS(Circuit Switched,电路交换)、NGN(Next Generation Network,下一代网络)以及IMS(IP Multimedia Subsystem,IP多媒体子系统)的网络中,可以支持并应用于语音、视频、数据等多媒体业务,同时也可以应用于Presence(呈现)、Instant Message(即时消息)等特色业务,SIP类似于HTTP,SIP可以减少应用特别是高级应用的开发时间。信令是这样一个系统,它允许程控交换、网络数据库、网络中其它"智能"节点交换下列有关信息:呼叫建立、监控(Supervision)、拆除(Teardown)、分布式应用进程所需的信息(进程之间的询问/响应或用户到用户的数据)、网络管理信息。信令是在无线通信系统中,除了传输用户信息之外,为使全网有轶序地工作,用来保证正常通信所需要的控制信号。本实施例中,所述状态码就是各大运行商返回的表明通话号码状态的SIP信令。

请参见图1,在所述步骤5中,所述关键词词库内预存有多个关键词及每一个关键词对应的权重分。

请参见图1,所述关键词词库内,所述关键词对应的权重分最高分为100分。

请参见图1,在所述步骤7中,当系统已经发现一次完整通话中的一段音频数据中有关键词获得对应的权重分时,则判定该单段音频内最高权重分的关键词所对应的通话号码的状态为音频所属通话号码的状态,同时不再对该完整通话中其他未处理的分段音频数据进行处理。

本发明还提供一种实现上述的电话号码状态判断方法的系统,包括:

接收模块,用于接收运营商返回的音频数据;

存储模块,用于存储音频数据和通话号码的状态值;

梳理模块,用于对音频数据进行梳理;

语音端点检测模块,用于对音频数据进行语音端点检测并切割分段;

文本转语音模块,用于将音频数据转译成文本信息;

关键词词库,用于存储关键词及关键词所对应的权重分信息;

检索评分模块,用于将文本信息在关键词词库内进行检索评分;

判断模块,用于判断转译后的文本信息内是否有关键词获得权重分,用于根据单段音频内最高权重分的关键词来判断音频所属通话号码的状态,还用于判断未获得权重分的文本信息所属音频是否存在运营商返回的状态码;

显示模块,用于通话号码的状态值。

由上可知,本发明的有益效果是:通过设置关键词词库和检索评分模块,在音频数据内检索是否含有关键词词库内的关键词,然后对关键词进行评分,从而根据获得最高权重分的关键词来判断通话号码的状态,大幅度提高了对客户号码状态判断的准确性,如果音频数据内不存在关键词库内的关键词,则将该音频数据进行解析,扩增新的关键字及对应权重分存入关键词词库,进一步提高了系统对客户号码状态判断的准确性。

以上所述之具体实施方式为本发明的较佳实施方式,并非以此限定本发明的具体实施范围,本发明的范围包括并不限于本具体实施方式,凡依照本发明所作的等效变化均在本发明的保护范围内。

相关技术
  • 一种电话号码状态判断方法及系统
  • 使用光学信号判断人体状态与动作的系统以及判断人体状态的方法
技术分类

06120112856946