掌桥专利:专业的专利平台
掌桥专利
首页

freeswitch呼叫异常断开详因追踪方法、系统、电子设备及存储介质

文献发布时间:2023-06-19 19:30:30


freeswitch呼叫异常断开详因追踪方法、系统、电子设备及存储介质

技术领域

本发明属于数据处理的技术领域,具体地涉及一种freeswitch呼叫异常断开详因追踪方法、系统、电子设备及存储介质。

背景技术

freeswitch作为一款开源的、免费的、好用的电话软交换解决方案,已经被广泛应用于适合自动外呼的各实际业务场景,比如助力抗疫的接种新冠疫苗通知、电信运营商的欠费催缴通知等。一通自动外呼电话从发起到结束的正常流程大致可以分为三个阶段:第一阶段,由业务控制调度系统通过事件套接字和freeswitch服务器建立稳定的长连接并订阅相关通道事件,然后向freewitch发送发起外呼的命令,其中携带需要呼叫的号码等参数;第二阶段,freeswitch内部对该命令字符串文本进行解析、向对应的中继服务器发送会话初始协议中的邀请报文(INVITE),该报文通过远端网络最终会被路由发送到该号码所在的硬件终端,一系列的会话初始协议报文交互后,该号码所在硬件终端会收到来电振铃提醒;第三阶段,用户摘机后开始正常交互直至挂机,与此同时,业务控制调度系统会收到相应的通道事件,并执行播音、录音等一系列预定操作,背后会按需调用自动语音识别引擎和意图理解引擎和文本转语音引擎。

一般地,freeswitch会将表征呼叫断开详细原因的数字代码(XXX_YYY,如480_19)固定存放在某些通道事件的固定某些字段中,在上述呼叫过程的第二阶段或第三阶段,业务控制调度系统可以直接从对应通道事件的相关字段中获取到呼叫断开的详因代码。在实际的外呼应用过程中,自动外呼都是批量高并发地进行,受实时网络因素、呼叫链路各环节的软硬件实时状态因素等影响;有些号码存在呼叫过程异常断开,且存放详因数字代码的对应通道事件对应字段丢失为空的情况。

针对freeswitch的自动外呼系统在实际复杂网络软硬件环境、高并发外呼时易产生呼叫异常中断,以及存储详因代码值的字段易丢失为空的技术问题,出于业务需要、系统优化等动机,常需要快速精准获取这些号码对应的呼叫异常断开的详因。为了获取该详因,通常采用如图1所示的人工分析办法。具体来说,可分为如图2所示的步骤进行:S1,需要从呼叫链路各环节(如freeswitch服务器等)导出运行时现场数据;S2,协商讨论,分析对比、排查检测其中存在的异常问题;S3,根据猜想原因组织测试,不是当前原因就迭代猜想原因进一步测试验证;S4,验证得到真实呼叫异常断开的详细原因。可见,这种人工分析办法,整个过程只能依赖各呼叫链路各环节中每位技术专家的专业能力、协作能力、严谨思维和精神意志力等进行排查、检测、分析,整个过程人工成本高、耗时长、效率低。

因此,针对上述人工分析办法存在的人工成本高、耗时长、效率低等问题,目前尚未提出有效的解决方案。

发明内容

为了解决上述技术问题,本发明提供了一种freeswitch呼叫异常断开详因追踪方法、系统、电子设备及存储介质,通过迭代策略在off-line训练系统中定期补充更新数据针对其追因模型进行增量训练及微调,以使更新至on-line推理系统,当存在详因代码缺失的呼叫时可快速根据uuid值从现场实时记录系统中取出对应数据,并将数据送入on-line推理系统中预测得到详因代码。

第一方面,本发明提供一种freeswitch呼叫异常断开详因追踪方法,包括:

构建现场数据实时记录系统;

根据所述现场实时记录系统选用匹配的追因模型,并基于所述追因模型编写off-line训练系统及on-line推理系统;

从所述现场实时记录系统及人工质检历史数据库中按预设比例抽取定量的数据作为训练数据;

通过所述训练数据迭代训练所述off-line训练系统中的追因模型以调整其模型参数,得到最优追因模型;

采用所述最优追因模型更新所述on-line推理系统得到目标on-line推理系统;

根据异常断开的freeswitch呼叫的uuid获取其对应的目标现场数据,并基于所述目标现场数据通过所述目标on-line推理系统预测得到所述freeswitch呼叫异常断开的目标详因代码。

较佳地,所述构建现场数据实时记录系统的步骤具体包括:

根据呼叫链路确定所需采集的各环节以及所述各环节中所需采集的字段信息;

通过采集服务器和所述各环节的服务器的白名单互相添加IP,以实现所述各环节的网络通道的互联互通;

针对所述各环节的服务器编写python监听程序脚本,定时采集所述字段信息并将其保存为新文件;

将所述新文件存放至所述各环节的服务器上配置的源文件夹目录,以使flume系统实现实时监听并将监听结果自动采集到kafka系统;

通过所述flume系统及所述kafka系统构建现场数据实时记录系统。

较佳地,所述根据所述现场实时记录系统选用匹配的追因模型,并基于所述追因模型编写off-line训练系统及on-line推理系统的步骤具体包括:

根据所述现场实时记录系统针对预训练模型所需的考虑因数选用匹配的追因模型,并下载所述追因模型的初始参数文件;

基于所述初始参数文件针对所述追因模型编写off-line训练系统及on-line推理系统。

较佳地,所述通过所述训练数据迭代训练所述off-line训练系统中的追因模型以调整其模型参数,得到最优追因模型的步骤具体包括:

将所述训练数据进行清洗及转换处理,以使所述训练数据的键值格式转换成文本表达形式格式;

将转换格式后的所述训练数据进行拼接符切分得到最终数据,其中所述最终数据具体为输入是SEP分隔开的长文本串、输出是对应详因代码的id;

根据所述最终数据选择适配的损失函数进行超参数组合以迭代训练所述off-line训练系统中的追因模型;其中所述损失函数为交叉熵损失函数或焦点损失函数;

迭代训练结束后采用评价公式选取最优模型作为最优追因模块。

较佳地,所述评价公式为:

式中,F

较佳地,所述根据异常断开的freeswitch呼叫的uuid获取其对应的目标现场数据,并基于所述目标现场数据通过所述目标on-line推理系统预测得到所述freeswitch呼叫异常断开的目标详因代码的步骤具体包括:

当获取freeswitch呼叫的断开详因丢失信号时,根据所述freeswitch呼叫的uuid从所述现场数据实时记录系统中截取对应的目标现场数据;

将所述目标现场数据进行预处理得到预处理现场数据;

将所述预处理现场数据输入所述目标on-line推理系统进行预测得到所述freeswitch呼叫异常断开的目标详因代码。

较佳地,以从所述人工质检历史数据库中抽取的历史数据全部采用为基础,通过所述预设比例抽取所述现场实时记录系统中的数据。

第二方面,本发明提供一种freeswitch呼叫异常断开详因追踪系统,包括:

构建模块,用于构建现场数据实时记录系统;

编写模块,用于根据所述现场实时记录系统选用匹配的追因模型,并基于所述追因模型编写off-line训练系统及on-line推理系统;

抽取模块,用于从所述现场实时记录系统及人工质检历史数据库中按预设比例抽取定量的数据作为训练数据;

训练模块,用于通过所述训练数据迭代训练所述off-line训练系统中的追因模型以调整其模型参数,得到最优追因模型;

更新模块,用于采用所述最优追因模型更新所述on-line推理系统得到目标on-line推理系统;

预测模块,用于根据异常断开的freeswitch呼叫的uuid获取其对应的目标现场数据,并基于所述目标现场数据通过所述目标on-line推理系统预测得到所述freeswitch呼叫异常断开的目标详因代码。

较佳地,所述构建模块包括:

确定单元,用于根据呼叫链路确定所需采集的各环节以及所述各环节中所需采集的字段信息;

互通单元,用于通过采集服务器和所述各环节的服务器的白名单互相添加IP,以实现所述各环节的网络通道的互联互通;

采集单元,用于针对所述各环节的服务器编写python监听程序脚本,定时采集所述字段信息并将其保存为新文件;

实时单元,用于将所述新文件存放至所述各环节的服务器上配置的源文件夹目录,以使flume系统实现实时监听并将监听结果自动采集到kafka系统;

构建单元,用于通过所述flume系统及所述kafka系统构建现场数据实时记录系统。

较佳地,所述编写模块包括:

匹配单元,用于根据所述现场实时记录系统针对预训练模型所需的考虑因数选用匹配的追因模型,并下载所述追因模型的初始参数文件;

编写单元,用于基于所述初始参数文件针对所述追因模型编写off-line训练系统及on-line推理系统。

较佳地,所述训练模块包括:

转换单元,用于将所述训练数据进行清洗及转换处理,以使所述训练数据的键值格式转换成文本表达形式格式;

拼接单元,用于将转换格式后的所述训练数据进行拼接符切分得到最终数据,其中所述最终数据具体为输入是SEP分隔开的长文本串、输出是对应详因代码的id;

迭代单元,用于根据所述最终数据选择适配的损失函数进行超参数组合以迭代训练所述off-line训练系统中的追因模型;其中所述损失函数为交叉熵损失函数或焦点损失函数;

选取单元,用于迭代训练结束后采用评价公式选取最优模型作为最优追因模块。

较佳地,所述预测模块包括:

截取单元,用于当获取freeswitch呼叫的断开详因丢失信号时,根据所述freeswitch呼叫的uuid从所述现场数据实时记录系统中截取对应的目标现场数据;

预处理单元,用于将所述目标现场数据进行预处理得到预处理现场数据;

预测单元,用于将所述预处理现场数据输入所述目标on-line推理系统进行预测得到所述freeswitch呼叫异常断开的目标详因代码。

第三方面,本发明提供一种电子设备,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的freeswitch呼叫异常断开详因追踪方法。

第四方面,本实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的freeswitch呼叫异常断开详因追踪方法。

相比于现有技术,本发明提供的一种freeswitch呼叫异常断开详因追踪方法、系统、设备及存储介质,通过使用迭代策略,在off-line训练系统中,可以定期使用补充更新的数据,对追因模型进行增量训练和微调,并推送到on-line推理系统中去生产使用;每次业务控制调度系统发现存在详因代码缺失的呼叫,可以快速根据唯一标识一通呼叫的uuid值,从现状数据实时记录系统中取出与某个号码相关的数据,并将其送入on-line推理系统中,获取自动追因模型预测的详因代码。相比于每次使用人工技术专家进行排查分析存在的人工成本高、耗时长、效率低等问题,本发明具有越用越准、成本更低、速度更快、效率更高等优点。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为现有技术采用人工分析呼叫异常断开详因的示意图;

图2为现有技术采用人工分析呼叫异常断开详因的步骤流程图;

图3为本发明基于预训练语言模型的自动追踪呼叫异常断开详因的架构图;

图4为本发明实施例1提供的freeswitch呼叫异常断开详因追踪方法的流程图;

图5为本发明实施例1提供的通道事件CHANNEL_HANGUP_COMPLETE的前部分行示例;

图6为本发明实施例1提供的通道事件CHANNEL_HANGUP_COMPLETE的后部分行示例;

图7为本发明实施例1提供的部分详因代码的示例;

图8为本发明实施例1提供的业务控制调度系统中某些呼叫断开详因丢失情况的示例;

图9是本发明实施例2提供的与实施例1方法对应的freeswitch呼叫异常断开详因追踪系统结构框图;

图10是本发明实施例3提供的电子设备的硬件结构示意图。

附图标记说明:

10-构建模块、11-确定单元、12-互通单元、13-采集单元、14-实时单元、15-构建单元;

20-编写模块、21-匹配单元、22-编写单元;

30-抽取模块;

40-训练模块、41-转换单元、42-拼接单元、43-迭代单元、44-选取单元;

50-更新模块;

60-预测模块、61-截取单元、62-预处理单元、63-预测单元;

70-总线、71-处理器、72-存储器、73-通信接口。

具体实施方式

现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。

此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。

附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。

附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。

本发明针对现有技术中为获取呼叫异常断开的详因时,存在的人工成本高,耗时长、效率低等问题,提出基于预训练语言模型技术的自动追踪呼叫异常断开详因的方法,其具体的架构图如图3所示。一方面,从自然语言处理的技术理论角度,对人工技术专家排查解决呼叫异常断开详因的过程进行分析,得出详因可从呼叫断开时的运行时现场寻迹、该解决过程及规律可通过预训练语言模型训练学习进行建模的结论。呼叫链路各环节的人工专家在相互协作、排查分析的时候,都需要去获取呼叫断开现场各部分的软硬件运行时数据,比如中继侧的运行压力指标、对应号码的报文收发记录及对应时间序列,freeswitch服务器侧的报文收发记录及时间序列、各类通道事件内容及产收时间序列等等。这些分析对象都是以文本形式存在,呼叫断开详因及其逻辑特征蕴含于其中。基于自注意力模型的双向编码器预训练语言模型,凭借其优异的文本表征能力和特征学习能力,在自然语言处理领域的许多开放评测任务上取得了Sota(State of the arts)效果。所以,可以将可以呼叫断开详因分析问题归类为自然语言处理领域中的文本分类(Text Classification)任务,利用预训练语言模型的强大学习能力,通过训练微调去学习其中规律,以实现自动追踪呼叫断开详因。

实施例1

具体而言,图4所示为本实施例所提供的一种freeswitch呼叫异常断开详因追踪方法的流程示意图。

如图4所示,本实施例的freeswitch呼叫异常断开详因追踪方法包括以下步骤:

S101,构建现场数据实时记录系统。

具体地,现场数据实时记录系统用于记录每次自动外呼时的呼叫链路各环节现场数据。

进一步地,本实施例的S101具体步骤包括:

S1011,根据呼叫链路确定所需采集的各环节以及所述各环节中所需采集的字段信息。

具体地,为简洁说明,本实施例只采集freeswitch服务器模块和中继服务器模块两个模块。其中,freeswitch服务器模块的环节,必要的采集的字段信息是会话初始协议的交互记录文本及其收发时间序列、通道事件及其收发时间序列等。

需要说明的是,采集到的某些字段信息可能存在大量无关子数据,出于使用需求和具体硬件存储压力等实际情况,可自行考虑是否删除还是保留;本实施例以图5和图6所示的通道事件CHANNEL_HANGUP_COMPLETE为例,完整的该事件有几百个子字段,可选地,对子字段内容进行去重和删除无关子字段。

S1012,通过采集服务器和所述各环节的服务器的白名单互相添加IP,以实现所述各环节的网络通道的互联互通。

具体地,构建现场数据实时记录系统需要为freeswitch服务器模块、中继服务器模块的IP添加到采集服务器的白名单中,反之亦是,即将采集服务器的IP添加到freeswitch服务器模块、中继服务器模块等的白名单中,实现freeswitch服务器模块、中继服务器模块以及采集服务器模块的网络层面可互联互通。

S1013,针对所述各环节的服务器编写python监听程序脚本,定时采集所述字段信息并将其保存为新文件;

具体地,针对freeswitch服务器模块和中继服务器模块编写listener.py,每隔10秒采集经过去重及删除无关子字段的字段信息,并将采集的字段信息以文件格式暂存为新文件。

S1014,将所述新文件存放至所述各环节的服务器上配置的源文件夹目录,以使flume系统实现实时监听并将监听结果自动采集到kafka系统。

具体地,源文件夹目录具体为SrcPath,将暂存的新文件存放至SrcPath,调试配置直至当SrcPath下有新文件生成时,flume系统能实时监听到,并自动采集到kafka系统中。

S1015,通过所述flume系统及所述kafka系统构建现场数据实时记录系统。

S102,根据所述现场实时记录系统选用匹配的追因模型,并基于所述追因模型编写off-line训练系统及on-line推理系统。

具体地,本实施例的追因模型采用预训练模语言模型中的RoBERTa模型。当然,对于其它实施例,完全可以选择任何适合的预训练语言模型,并不局限于RoBERTa模型。

进一步地,本实施例的S102具体步骤包括:

S1021,根据所述现场实时记录系统针对预训练模型所需的考虑因数选用匹配的追因模型,并下载所述追因模型的初始参数文件。

具体地,本实施例所需要考虑的因素,诸如模型参数量级、预训练时使用的数据集、微调需要的硬件要求等。如硬件配置低就尽量选择base版本,数据集尽量使用接近自己下游任务的数据集,由于该任务中采集的大部分模块信息都是以英文存储的,因此不建议使用跨语言的数据集微调出来的模型参数版本。

S1022,基于所述初始参数文件针对所述追因模型编写off-line训练系统及on-line推理系统。

具体地,off-line训练系统及on-line推理系统均包括数据清洗模块及数据转换模块。其中,off-line训练系统支持方便进行数据更新、参数更新和增量训练等;on-line推理系统支持方便进行模型更新替换,调用请求接口参数支持扩展等,接口请求协议可以为http等协议。

S103,从所述现场实时记录系统及人工质检历史数据库中按预设比例抽取定量的数据作为训练数据。

其中,以从所述人工质检历史数据库中抽取的历史数据全部采用为基础,通过所述预设比例抽取所述现场实时记录系统中的数据。

具体地,从现场数据实时记录系统中抽取适量数据,具体数量以实际情况决定,暂不做具体限制,本实施例取5000条。从历史积累的小比例(如1/10000,以实际需要和人力情况决定,不做具体限制)人工质检数据中抽取适量新数据。由于是人工质检数据,质量高,建议全用。本实施例的预设比例采用10:1的参数。

S104,通过所述训练数据迭代训练所述off-line训练系统中的追因模型以调整其模型参数,得到最优追因模型。

具体地,本实施例通过针对追因模型进行迭代训练以其模型参数进行微调,实现对所选用的RoBERTa模型进行优化处理,提高freeswitch呼叫异常断开详因追踪的准确性。

进一步地,本实施例的S104具体步骤包括:

S1041,将所述训练数据进行清洗及转换处理,以使所述训练数据的键值格式转换成文本表达形式格式。

具体地,数据清洗的目的在于去除不需要乱码符号、大小写转换等,诸如图5中存在很多大小写单词,本实施例约定统一使用小写即可。将清洗后的数据送入数据转换系统,因为采集到的是各环节的全量数据,通常都是以键值对的形式存在,这时为了方便微调时模型学习收敛,需要把k:v形式的数据转为文本表达“kis v.”。

S1042,将转换格式后的所述训练数据进行拼接符切分得到最终数据,其中所述最终数据具体为输入是SEP分隔开的长文本串、输出是对应详因代码的id。

具体地,具体实践中各种格式的时间表达需要统一并规范,有多个单词拼接的变量名需以拼接符切分开等细节,因为存在处理方案,在此不做唯一限制,合理即可。处理好的最终数据,输入是[SEP]分隔开的长文本串,输出是对应详因代码的id(取值0到N-1),N为详因代码类别总数。本实施例中部分详因代码如图7,假设详因代时码总数N=80。

本实施例以图6为例,假设子字段variable_rtp_audio_in_mos是所需的字段信息,对其处理各步骤及结果输入如下:

原始表达:variable_rtp_audio_in_mos:4.50;

键值对转文本表达:“variable_rtp_audio_in_mos is 4.50”;

拼接符切分(单词前缀可去除):“rtp audio in mos is 4.50”;

最终数据:

输入:“....[SEP]rtp audio in mos is 4.50.[SEP]”;

输出:79;

此处79可能是代表详因510_29,也可能是其它,取决于代码如何实现。

S1043,根据所述最终数据选择适配的损失函数进行超参数组合以迭代训练所述off-line训练系统中的追因模型;其中所述损失函数为交叉熵损失函数或焦点损失函数。

具体地,超参数的设置重点关注服务器硬件配置的实际容纳能力和模型学习收敛策略等。比如,如果训练环境硬件配置高,可以考虑多卡多机进行分布式训练;在模型学习策略和收敛速度方面,可以根据数据分布选择不同的损失函数。该任务可选常见损失函数有交叉熵损失函数(CrossEntropy Loss),另有焦点损失函数(Focal Loss),如果数据样本类别不均衡,优先选择焦点损失函数。

S1044,迭代训练结束后采用评价公式选取最优模型作为最优追因模块。

具体地,训练结束自动保存最优模型及最优评测结果。其中,最优模型的评价标准采用F

式中,F

S105,采用所述最优追因模型更新所述on-line推理系统得到目标on-line推理系统。

具体地,本实施例从优化后的RoBERTa模型选用评价最优的RoBERTa模型,将该最优的RoBERTa模型输入至on-line推理系统得到目标on-line推理系统,起到进一步提高freeswitch呼叫异常断开追因的准确性。

S106,根据异常断开的freeswitch呼叫的uuid获取其对应的目标现场数据,并基于所述目标现场数据通过所述目标on-line推理系统预测得到所述freeswitch呼叫异常断开的目标详因代码。

进一步地,本实施例的S106具体步骤包括:

S1061,当获取freeswitch呼叫的断开详因丢失信号时,根据所述freeswitch呼叫的uuid从所述现场数据实时记录系统中截取对应的目标现场数据。

具体地,当业务控制调度系统发现某通呼叫的断开详因丢失时,具体如图8所示,可将根据uuid从现场系统记录系统中取回现场数据;具体原因是因为uuid作为唯一标识一通呼叫的变量,通过uuid即可取回对应号码的所有现场数据,如该号码的会话初始协议报文的交互记录及收发时间等。

S1062,将所述目标现场数据进行预处理得到预处理现场数据。

具体地,预处理的目的是因为取到的目标现场数据需要做对应的处理后才能输入至系统模型得到预测的详因代码结果。

S1063,将所述预处理现场数据输入所述目标on-line推理系统进行预测得到所述freeswitch呼叫异常断开的目标详因代码。

综上所述,本实施例通过使用迭代策略,在off-line训练系统中,可以定期使用补充更新的数据,对追因模型进行增量训练和微调,并推送到on-line推理系统中去生产使用;每次业务控制调度系统发现存在详因代码缺失的呼叫,可以快速根据唯一标识一通呼叫的uuid值,从现状数据实时记录系统中取出与某个号码相关的数据,并将其送入on-line推理系统中,获取自动追因模型预测的详因代码。

实施例2

本实施例提供了与实施例1所述方法相对应的系统的结构框图。图9是根据本实施例的freeswitch呼叫异常断开详因追踪系统的结构框图,如图9所示,该系统包括:

构建模块10,用于构建现场数据实时记录系统;

编写模块20,用于根据所述现场实时记录系统选用匹配的追因模型,并基于所述追因模型编写off-line训练系统及on-line推理系统;

抽取模块30,用于从所述现场实时记录系统及人工质检历史数据库中按预设比例抽取定量的数据作为训练数据;

训练模块40,用于通过所述训练数据迭代训练所述off-line训练系统中的追因模型以调整其模型参数,得到最优追因模型;

更新模块50,用于采用所述最优追因模型更新所述on-line推理系统得到目标on-line推理系统;

预测模块60,用于根据异常断开的freeswitch呼叫的uuid获取其对应的目标现场数据,并基于所述目标现场数据通过所述目标on-line推理系统预测得到所述freeswitch呼叫异常断开的目标详因代码。

较佳地,所述构建模块10包括:

确定单元11,用于根据呼叫链路确定所需采集的各环节以及所述各环节中所需采集的字段信息;

互通单元12,用于通过采集服务器和所述各环节的服务器的白名单互相添加IP,以实现所述各环节的网络通道的互联互通;

采集单元13,用于针对所述各环节的服务器编写python监听程序脚本,定时采集所述字段信息并将其保存为新文件;

实时单元14,用于将所述新文件存放至所述各环节的服务器上配置的源文件夹目录,以使flume系统实现实时监听并将监听结果自动采集到kafka系统;

构建单元15,用于通过所述flume系统及所述kafka系统构建现场数据实时记录系统。

进一步地,所述编写模块20包括:

匹配单元21,用于根据所述现场实时记录系统针对预训练模型所需的考虑因数选用匹配的追因模型,并下载所述追因模型的初始参数文件;

编写单元22,用于基于所述初始参数文件针对所述追因模型编写off-line训练系统及on-line推理系统。

进一步地,所述训练模块40包括:

转换单元41,用于将所述训练数据进行清洗及转换处理,以使所述训练数据的键值格式转换成文本表达形式格式;

拼接单元42,用于将转换格式后的所述训练数据进行拼接符切分得到最终数据,其中所述最终数据具体为输入是SEP分隔开的长文本串、输出是对应详因代码的id;

迭代单元43,用于根据所述最终数据选择适配的损失函数进行超参数组合以迭代训练所述off-line训练系统中的追因模型;其中所述损失函数为交叉熵损失函数或焦点损失函数;

选取单元44,用于迭代训练结束后采用评价公式选取最优模型作为最优追因模块;其中,所述评价公式为:

式中,F

进一步地,所述预测模块60包括:

截取单元61,用于当获取freeswitch呼叫的断开详因丢失信号时,根据所述freeswitch呼叫的uuid从所述现场数据实时记录系统中截取对应的目标现场数据;

预处理单元62,用于将所述目标现场数据进行预处理得到预处理现场数据;

预测单元63,用于将所述预处理现场数据输入所述目标on-line推理系统进行预测得到所述freeswitch呼叫异常断开的目标详因代码。

需要说明的是,上述各个模块可以是功能模块也可以是程序模块,既可以通过软件来实现,也可以通过硬件来实现。对于通过硬件来实现的模块而言,上述各个模块可以位于同一处理器中;或者上述各个模块还可以按照任意组合的形式分别位于不同的处理器中。

实施例3

结合图4所描述的freeswitch呼叫异常断开详因追踪方法可以由电子设备来实现。图10为根据本实施例的电子设备的硬件结构示意图。

电子设备可以包括处理器71以及存储有计算机程序指令的存储器72。

具体地,上述处理器71可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,简称为ASIC),或者可以被配置成实施本实施例的一个或多个集成电路。

其中,存储器72可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器72可包括硬盘驱动器(Hard Disk Drive,简称为HDD)、软盘驱动器、固态驱动器(SolidState Drive,简称为SSD)、闪存、光盘、磁光盘、磁带或通用串行总线(Universal SerialBus,简称为USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下,存储器72可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器72可在数据处理装置的内部或外部。在特定实施例中,存储器72是非易失性(Non-Volatile)存储器。在特定实施例中,存储器72包括只读存储器(Read-Only Memory,简称为ROM)和随机存取存储器(RandomAccess Memory,简称为RAM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable Read-Only Memory,简称为PROM)、可擦除PROM(Erasable ProgrammableRead-Only Memory,简称为EPROM)、电可擦除PROM(Electrically Erasable ProgrammableRead-Only Memory,简称为EEPROM)、电可改写ROM(Electrically Alterable Read-OnlyMemory,简称为EAROM)或闪存(FLASH)或者两个或更多个以上这些的组合。在合适的情况下,该RAM可以是静态随机存取存储器(Static Random-Access Memory,简称为SRAM)或动态随机存取存储器(Dynamic Random Access Memory,简称为DRAM),其中,DRAM可以是快速页模式动态随机存取存储器(Fast Page Mode Dynamic Random Access Memory,简称为FPMDRAM)、扩展数据输出动态随机存取存储器(Extended Date Out Dynamic RandomAccess Memory,简称为EDODRAM)、同步动态随机存取内存(Synchronous Dynamic Random-Access Memory,简称SDRAM)等。

存储器72可以用来存储或者缓存需要处理和/或通信使用的各种数据文件,以及处理器71所执行的可能的计算机程序指令。

处理器71通过读取并执行存储器72中存储的计算机程序指令,以实现上述实施例1的freeswitch呼叫异常断开详因追踪方法。

在其中一些实施例中,电子设备还可包括通信接口73和总线70。其中,如图10所示,处理器71、存储器72、通信接口73通过总线70连接并完成相互间的通信。

通信接口73用于实现本实施例中各模块、装置、单元和/或设备之间的通信。通信接口73还可以实现与其他部件例如:外接设备、图像/数据采集设备、数据库、外部存储以及图像/数据处理工作站等之间进行数据通信。

总线70包括硬件、软件或两者,将设备的部件彼此耦接在一起。总线70包括但不限于以下至少之一:数据总线(Data Bus)、地址总线(Address Bus)、控制总线(ControlBus)、扩展总线(Expansion Bus)、局部总线(Local Bus)。举例来说而非限制,总线70可包括图形加速接口(Accelerated Graphics Port,简称为AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,简称为EISA)总线、前端总线(FrontSide Bus,简称为FSB)、超传输(Hyper Transport,简称为HT)互连、工业标准架构(Industry Standard Architecture,简称为ISA)总线、无线带宽(InfiniBand)互连、低引脚数(Low Pin Count,简称为LPC)总线、存储器总线、微信道架构(Micro ChannelArchitecture,简称为MCA)总线、外围组件互连(Peripheral Component Interconnect,简称为PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial AdvancedTechnology Attachment,简称为SATA)总线、视频电子标准协会局部(Video ElectronicsStandards Association Local Bus,简称为VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线70可包括一个或多个总线。尽管本实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。

该设备可以基于获取到freeswitch呼叫异常断开详因追踪系统,执行本实施例1的freeswitch呼叫异常断开详因追踪方法。

另外,结合上述实施例1的freeswitch呼叫异常断开详因追踪方法,本实施例可提供一种存储介质来实现。该存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例1的freeswitch呼叫异常断开详因追踪方法。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

相关技术
  • 路径追踪方法及装置、电子设备、存储介质
  • 存储方法、存储系统、电子设备及存储介质
  • 引导电子设备系统开机的方法,电子设备,可读存储介质
  • 基于统计异常值的池化计算方法、电子设备、存储介质
  • 电子设备及其功耗异常的检测方法、存储介质
  • 统计呼叫详单的方法、装置、电子设备和可读存储介质
  • 统计呼叫详单的方法、装置、电子设备和可读存储介质
技术分类

06120115935344