导航：首页> 输送；包装；贮存；搬运薄的或细丝状材料>交互式语音应答方法、装置、终端设备以及存储介质

交互式语音应答方法、装置、终端设备以及存储介质

文献发布时间：2024-04-18 19:58:21

技术领域

本发明涉及电信通讯领域，尤其涉及一种交互式语音应答方法、装置、终端设备以及存储介质。

背景技术

在客服中心、银行、保险公司等大型企事业单位常用IVR(Interactive VoiceResponse，交互式语音应答)技术来帮助管理客户呼叫中心，IVR可以根据用户输入的按键或语音指令，自动播放音频内容，如菜单提示、业务介绍等，并实现相应的业务处理。

但是，目前主流的自动语音IVR的实现技术包括VXML语音应用程序的标记语言、基于WebRTC(Web Real-Time Communications)框架构建的Voice Gateway模型和SIP(Session Initiation Protocol)服务器模型，这些IVR实现技术开发复杂度高，不支持Microsoft C#技术体系进行开发，灵活性和可维护性受到限制。

上述内容仅用于辅助理解本发明的技术方案，并不代表承认上述内容是现有技术。

发明内容

本申请的主要目的在于提供一种交互式语音应答方法、装置、终端设备以及存储介质，旨在解决交互式语音应答开发过程复杂，对Microsoft C#技术体系支持不够，不易于扩展和维护的问题。

为实现上述目的，本申请提供一种交互式语音应答方法，所述交互式语音应答方法包括：

接收用户业务指令；

根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程；

根据所述语音业务流程，获取流程节点以及流程脚本类；

根据所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答。

可选地，所述根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程的步骤包括：

根据所述用户业务指令，获取流程配置信息；

根据所述流程配置信息，基于所述语音业务流程模型，对预设的流程节点进行配置，构建语音业务流程。

可选地，所述根据所述流程配置信息，基于所述语音业务流程模型，对预设的流程节点进行配置，构建语音业务流程的步骤包括：

根据所述流程配置信息，获取节点属性配置和事件脚本配置；

根据所述节点属性配置和事件脚本配置，基于所述语音业务流程模型，对所述流程节点的属性标签和事件脚本标签进行配置，构建语音业务流程。

可选地，所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答的步骤包括：

基于所述流程引擎和预设的编译器，对所述流程节点进行编译，生成流程库文件；

通过所述流程引擎加载所述库文件，生成引擎内存对象并调用所述流程脚本类，以完成交互式语音应答。

可选地，所述基于所述流程引擎和预设的编译器，对所述流程节点进行编译，生成流程库文件的步骤包括：

通过所述流程引擎和预设的脚本解释类，将所述流程节点的脚本标签转化为事件类，生成脚本中间文件；

通过所述流程引擎和序列化工具，对所述流程节点的节点标签进行序列化处理，生成流程中间文件；

通过所述编译器对所述脚本中间文件和所述流程中间文件进行编译，生成所述语音流程对应的库文件。

可选地，所述通过所述编译器对所述脚本中间文件和所述流程中间文件进行编译，生成所述语音流程对应的库文件的步骤包括：

通过所述编译器的写资源类对所述脚本中间文件和所述流程中间文件进行编译，生成二进制资源文件；

根据预设的库文件配置，通过所述编译器的编译类对所述二进制资源文件进行编译，生成所述语音流程对应的库文件。

可选地，所述通过所述流程引擎加载所述库文件，生成引擎内存对象并调用所述流程脚本类，以完成交互式语音应答的步骤包括：

通过所述流程引擎加载所述库文件，生成引擎内存对象；

通过所述引擎内存对象对所述流程脚本类进行实例化，生成流程脚本实例并调用所述流程脚本类的逻辑处理函数和方法，以完成交互式语音应答。

本申请实施例还提出一种交互式语音应答装置，所述交互式语音应答装置包括：

指令接收模块，用于接收用户业务指令；

流程构建模块，用于根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程；

节点获取模块，用于根据所述语音业务流程，获取流程节点以及流程脚本类；

语音应答模块，用于根据所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答。

本申请实施例还提出一种终端设备，所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的交互式语音应答程序，所述交互式语音应答程序被所述处理器执行时实现如上所述的交互式语音应答方法的步骤。

本申请实施例还提出一种计算机可读存储介质，所述计算机可读存储介质上存储有交互式语音应答程序，所述交互式语音应答程序被处理器执行时实现如上所述的交互式语音应答方法的步骤。

本申请实施例提出的交互式语音应答方法、装置、终端设备以及存储介质，接收用户业务指令；根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程；根据所述语音业务流程，获取流程节点以及流程脚本类；根据所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答。本发明基于面向对象编程语言，兼顾标记语言技术灵活性的特点，在接收到用户业务指令后，利用语音业务流程模型构建语音业务流程，以流程节点结合流程脚本类实现业务逻辑处理，从而实现语音应答功能，解决了现有交互式语言应答技术开发复杂度高，对C#技术体系支持不够的问题，简化了交互式语言应答开发过程，保障了代码的灵活性和可维护性。

附图说明

图1是本申请交互式语音应答装置所属终端设备的功能模块示意图；

图2为本申请交互式语音应答方法第一示例性实施例的流程示意图；

图3为本申请交互式语音应答方法第二示例性实施例的流程示意图；

图4为本申请交互式语音应答方法流程节点的结构示意图；

图5为本申请交互式语音应答方法流程节点Script标签的结构示意图；

图6为本申请交互式语音应答方法流程节点Script标签事件执行示意图；

图7为本申请交互式语音应答方法第三示例性实施例的流程示意图；

图8为本申请交互式语音应答方法流程文件编译成二进制资源文件的流程示意图；

图9为本申请交互式语音应答方法二进制资源文件编译成库文件的流程示意图；

图10为本申请交互式语音应答方法加载库文件成内存对象的流程示意图。

本发明目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

本申请实施例的主要解决方案是：接收用户业务指令；根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程；根据所述语音业务流程，获取流程节点以及流程脚本类；根据所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答。本发明基于面向对象编程语言，兼顾标记语言技术灵活性的特点，解决了现有交互式语言应答技术开发复杂度高，对C#技术体系支持不够的问题，简化了交互式语言应答开发过程，保障了代码的灵活性和可维护性。

本申请涉及的技术术语：

Microsoft C#技术：C#(C Sharp)是一种通用、面向对象的编程语言技术，是一种功能强大、易学易用的编程语言，适用于各种应用程序开发，并且可以与丰富的Microsoft生态系统和工具集成，提供便捷的开发体验。

自动语音应答：IVR(Interactive Voice Response)，是一种基于语音交互的自动化电话系统，通过预先录制的语音提示和语音识别技术与呼叫者进行交互，提供信息查询、服务请求和问题解决等功能，无需人工操作。

VXML：VoiceXML，是一种用于开发语音应用程序的标记语言，是一种基于XML的语言，用于描述和控制与语音交互的应用程序。

脚本解释类：ScriptWriter，是一种用于编写、创建和执行脚本的工具或软件，可以帮助开发者将逻辑和操作步骤转化为可执行的脚本代码。

写资源类：ResourceWriter，是一个用于创建和管理二进制资源文件的类，提供了一种将数据写入二进制资源文件的方法，可用于将多种类型的数据(例如字符串、图像、音频等)写入资源文件，以便在应用程序中进行使用。

C#编译类：在C#中，编译类是指将源代码文件(.cs文件)转换为可执行的二进制文件(例如可执行文件、DLL文件等)的过程。

库文件：DLL(Dynamic Link Library)文件，是一种可执行文件格式，用于存储可重用的代码和数据，包含被多个程序共享的函数、类、变量和资源等，提供了代码的模块化和重用，可以被其他程序动态链接和调用。

流程文件：.tpl.xml格式文件，是一种模板文件，用于定义工作流程的结构和逻辑，通常使用XML(eXtensible Markup Language)格式来描述工作流程的各个元素、节点和连接。

本申请实施例考虑到，相关技术方案交互式语音应答技术开发过程复杂，对Microsoft C#技术体系支持不够，不易于扩展和维护。

基于此，本申请实施例提出一种解决方案，在XML内嵌C#脚本实现自动语音流程模型，简化了交互式语言应答开发过程，保障了代码的灵活性和可维护性。

具体地，参照图1，图1为本申请交互式语音应答装置所属终端设备的功能模块示意图。该交互式语音应答装置可以为独立于终端设备的、能够进行交互式语音应答的装置，其可以通过硬件或者软件的形式承载于终端设备上。该终端设备可以为手机、平板电脑等具有交互式语音应答功能的智能移动设备，还可以为具有交互式语音应答功能的固定终端设备或服务器等。

在本实施例中，该交互式语音应答装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。

存储器130中存储有操作系统以及交互式语音应答程序，交互式语音应答装置可以将接收到的和处理的数据信息存储于该存储器130中；输出模块110可为显示屏、扬声器等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等，通过通信模块140与外部设备或服务器进行通信。

其中，存储器130中的交互式语音应答程序被处理器执行时实现以下步骤：

接收用户业务指令；

根据所述用户业务指令，基于预设的语音业务流程模型，构建语音业务流程；

根据所述语音业务流程，获取流程节点以及流程脚本类；

根据所述流程节点以及流程脚本类进行业务逻辑处理，以完成交互式语音应答。