音视频处理方法、装置、设备、存储介质及程序产品

文献发布时间：2024-04-18 19:58:26

技术领域

本申请属于音视频处理技术领域，尤其涉及一种音视频处理方法、装置、设备、存储介质及程序产品。

背景技术

目前，国家在大力发展5G技术，各相关企业普遍配合支持5G建设的情况下，Volte作为4G下的通信制式可以平滑过渡到5G下的VoNR制式，基于VoLTE/VoNR的视频客服有机会享受到客服行业发展和更替的红利。基于此背景市场上视频导航产品层出不穷，但是目前基于freeswitch做的视频导航产品功能比较单一，只能播放离线视频。

发明内容

本申请实施例提供了一种音视频处理方法、装置、设备、存储介质及程序产品，能够解决现有的音视频处理方式的视频导航产品功能单一的问题。

第一方面，本申请实施例提供一种音视频处理方法，方法包括：

接收终端设备发送的用户指令；

解析所述用户指令对应的交互式话音应答IVR流程，得到解析结果；

获取与所述解析结果对应的音视频文件，所述音视频文件包括本地音视频和数字人实时流中的至少一项；

采用目标封装方式对音视频数据进行封装，所述音视频数据基于所述音视频文件确定；

将封装之后的音视频数据发送至所述终端设备。

在一些实施例中，所述获取与所述解析结果对应的音视频文件之后，所述采用目标封装方式对音视频数据进行封装之前，所述方法还包括：

在所述音视频文件为本地音视频的情况下，对所述本地音视频进行解码和编码，得到所述音视频数据。

在一些实施例中，所述在所述音视频文件为本地音视频的情况下，所述对所述本地音视频进行解码和编码，得到所述音视频数据，包括：

将所述本地音视频解码成为yuv数据和脉冲编码调制pcm数据；

获取所述yuv数据的编码参数，所述编码参数包括：分辨率、帧率、码率和图片组单元；

删除所述yuv数据的b帧；

根据所述编码参数对删除b帧之后的所述yuv数据进行编码；

根据所述pcm数据和编码后的所述yuv数据，生成所述音视频数据。

在一些实施例中，所述分辨率是360*640像素每英寸、所述帧率是25 帧每秒、所述码率是200千比特每秒、所述图片组单元大小是10。

在一些实施例中，所述音视频数据包括视频数据；所述采用目标封装方式对音视频数据进行封装，包括：

将所述视频数据拆分为至少一个视频单元；

在所述至少一个视频单元中存在大于第一预设长度的视频单元的情况下，将所述大于第一预设长度的视频单元拆分为至少两个视频子单元，所述视频子单元的长度小于或等于第一预设长度；

对所述视频子单元，以及小于或等于第一预设长度的所述视频单元分别添加实时传输协议rtp报文头；

封装添加rtp报文头的所述视频单元和所述视频子单元。

在一实施例中，所述将所述视频数据拆分为至少一个视频单元之后，所述方法还包括：

在所述至少一个视频单元不存在大于第一预设长度的视频单元的情况下，对所有至少一个视频单元分别添加rtp报文头；

封装添加rtp报文头的所述视频单元。

在一实施例中，所述音视频数据包括音频数据，所述音视频数据包括音频数据，所述采用目标封装方式对音视频数据进行封装，包括：

将所述音频数据拆分为成音频单元，所述音频单元的长度为第二预设长度；

对所述音频单元分别添加rtp报文头；

封装添加rtp报文头的所述音频单元。

第二方面，本申请实施例提供一种音视频处理装置，装置包括：

接收模块，用于根据用户指令获取音视频文件；

解析模块，用于根据所述音视频文件的音视频类型进行解析，得到音视频数据；

获取模块，用于将所述音视频数据进行封装；

封装模块，用于将封装之后的音视频数据发送至客户终端；

发送模块，用于将封装之后的所述音视频数据发送至所述终端设备。

第三方面，本申请实施例提供了一种音视频处理设备，设备包括：处理器以及存储有计算机程序指令的存储器；

处理器执行计算机程序指令时实现如上的音视频处理方法。

第四方面，本申请实施例提供了一种计算机存储介质，计算机存储介质上存储有计算机程序指令，计算机程序指令被处理器执行时实现如上的音视频处理方法。

第五方面，本申请实施例提供了一种计算机程序产品，所述计算机程序产品包括计算机程序指令，所述计算机程序指令被处理器执行时实现如上的音视频处理方法。

在本申请中，通过接收终端设备发送的用户指令，解析用户指令对应的IVR流程，得到解析结果，获取与解析结果对应的音视频文件，该音视频文件包括本地音视频和数字人实时流中的至少一项，采用目标封装方式对音视频数据进行封装，将封装之后的音视频数据发送至所述终端设备。如此一来，在视频导航产品中，无论是经过处理的本地音视频，还是数字人实时流，都能够应用统一的封装方式进行封装，并发送至用户的终端设备进行播放，从而视频导航产品能够播放至少两种来源的音视频数据，丰富了视频导航产品的功能。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，显而易见地，下面所描述的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例提供的音视频处理方法的流程示意图；

图2是本申请再一实施例提供的音视频处理方法的场景示意图；

图3是本申请一实施例提供的音视频处理装置的结构示意图；

图4是本申请一实施例提供的音视频处理设备的硬件结构示意图；

图5是本申请一实施例提供的音视频处理装置的结构示意图。

具体实施方式

下面将详细描述本申请的各个方面的特征和示例性实施例，为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及具体实施例，对本申请进行进一步详细描述。应理解，此处所描述的具体实施例仅意在解释本申请，而不是限定本申请。对于本领域技术人员来说，本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请的更好的理解。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语 “包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括……”限定的要素，并不排除在包括要素的过程、方法、物品或者设备中还存在另外的相同要素。

需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互组合。下面将结合附图对实施例进行详细描述。

在大力发展第五代移动通信技术(5th Generation Mobile CommunicationTechnology，5G)技术的情况下，Volte作为第四代移动通信技术(4th Generation MobileCommunication Technology，4G)下的通信制式可以平滑过渡到5G下的VoNR制式，基于VoLTE/VoNR的视频客服有机会享受到客服行业发展和更替的红利。基于此背景，市场上视频导航产品层出不穷，但是目前基于freeswitch的视频导航产品功能比较单一，相关技术中通常是直接借助freeswitch中的mod_av模块对视频文件进行解析，mod_av是freeswitch的一个专门用来处理离线视频的模块，mod_av解析离线视频得到h264数据和脉冲编码调制(Pulse Code Modulation，pcm) 数据，然后将上述h264数据和pcm数据封装成实时传输协议(Real-time Transport Protocol，rtp)流，同时通过实时控制协议rtcp进行媒体包的控制，最后借助运营商的IP多媒体子系统(IP Multimedia Subsystem，ims)线路发送到用户的手机。

基于上述的mod_av模块的视频导航产品，由于mod_av模块功能的限制，视频导航产品无法对接第三方的数字人实时流，并且在播放离线视频时，也常常出现终端的兼容性问题，如在手机上播放离线视频时，常常会出现卡顿、花屏或者绿屏等现象，导致用户的体验较差。

针对上述视频导航产品中容易出现的问题，本申请重新设计了一套基于freeswitch的视频导航系统，具体地，本申请增加了一个ms模块，ms模块用于统一编码参数，并基于统一的编码参数对离线视频进行解码和重新编码；ms模块还可以用于调用第三方的数字人实时流；本申请还增加了一个mod_digitalman_rtc模块，通过mod_digitalman_rtc模块可以对第三方的数字人实时流的实时流数据和离线视频的本地视频流数据进行统一的rtp报文头封装，从而实现数字人实时流和离线视频无感知切换。

具体地，为了解决现有技术问题，本申请实施例提供了一种音视频处理方法、装置、设备、存储介质及程序产品。下面首先对本申请实施例所提供的音视频处理方法进行介绍。

图1示出了本申请一个实施例提供的音视频处理方法的流程示意图。该方法包括以下步骤：

S110，接收终端设备发送的用户指令。

在本实施例中，在用户应用视频导航产品之后，可以通过终端设备向视频导航产品发送用户指令。具体地，用户可以利用终端设备拨打指定的号码，通过会话初始协议(Session Initialization Protocol，SIP)呼入的方式进入视频导航产品，并在终端设备上通过按键或者语音的方式，向视频导航产品发送用户指令。

S120，解析所述用户指令对应的交互式话音应答IVR流程，得到解析结果。

在本实施例中，不同的用户指令对应着不同的互动式语音问答 (InteractiveVoice Response，IVR)流程，从用户指令中可以获知该用户指令对应的IVR流程，对IVR流程进行解析，得到解析结果之后，即可从解析结果中得知用户想要的是哪种服务，并调用相应的音视频文件。

S130，获取与所述解析结果对应的音视频文件，所述音视频文件包括本地音视频和数字人实时流中的至少一项。

在本实施例中，当对不同的IVR流程进行解析之后，可以调用不同的音视频文件发送给用户，而音视频文件可以包括本地音视频和数字人实时流中的至少一项。本地音视频可以是存储在视频导航产品的管理系统上的音视频文件，数字人实时流可以是第三方实时传输的音视频文件。

S140，采用目标封装方式对音视频数据进行封装，所述音视频数据基于所述音视频文件确定。

在本实施例中，由于音视频数据需要从视频导航产品的后台发送至用户的终端设备，因此为了便于发送，可以采用目标封装方式对音视频数据进行封装。目标封装方式可以为，对音视频数据中的音频数据和视频数据采用不同的封装方式，分别进行封装。

在所述音视频文件为数字人实时流的情况下，所述音视频数据为所述音视频文件的数据；在所述音视频文件为本地音视频的情况下，所述音视频数据可以通过对本地音视频进行解码和编码得到。需要说明的是，对于基于不同音视频文件类型得到的音视频数据的格式相同。采用同一封装方式，对基于本地音视频确定音视频数据，和基于数字人实时流确定的音视频数据为相同格式的音视频数据，如此一来，可以实现本地视频数据和数字人实时流数据在终端设备上播放时的无感切换。

S150，将封装之后的所述音视频数据发送至所述终端设备。

在本实施例中，由于音视频文件需要由视频导航产品的后台传输到用户的终端设备进行播放，为了便于传输，如果音视频文件不为裸流格式，可以将不为裸流格式的音视频文件转为裸流格式进行传输。

进一步地，如果本地音视频为mp4格式的音视频文件，需要先对本地音视频进行解码和重新编码，得到h264格式和/或pcm格式的裸流音视频数据，再对裸流音视频数据进行封装；如果音视频文件本身即为数字人实时流，而数字人实时流又为h264格式和/或pcm格式的裸流音视频数据，那么就可以直接将数字人实时流进行封装。

在一实施例中，本申请中的音视频处理方法应用在视频导航产品上，该视频导航产品的系统架构如图2所示，系统架构可以包括IVR画布、展示层、业务层音视频能力层和运行环境五层架构。

其中，IVR画布中可以包括jQuery框架、超文本标记语言(HTML) 文本、层叠样式表(CSS)和图片，IVR画布可以采用antdesign vue前端框架设计，用于对IVR流程进行编辑，编辑得到的IVR流程中的流程节点可以包括本地视频节点、H5节点、图片节点、实名认证节点、转人工节点、短信节点等。

展示层则为系统架构前端和后台业务的交互通道，用于对前端界面效果图进行渲染。展示层可以包括模板引擎渲染模块和异步JavaScript和 XMLAjax交互模块，Ajax交互模块可以将前端的POST请求和Get请求发送给后台。

业务层可以包括esl模块、task模块、系统设置模块、统计报表模块、系统日志模块等，esl模块用于处理进线的话务，来实现具体的业务逻辑，而task模块则用于解析IVR画布编辑的流程节点。

音视频能力层中可以包括freeswitch模块、ms模块和 mod_digitalman_rtc模块，其中，，freeswitch负责sip信令的交互，提供 rtp/rtcp媒体通道和运营商ims线路对接，ms模块用于获取并解析本地音视频，以及对接第三方的数字人实时流，因此ms模块可以控制随时切换本地音视频和数字人实时流，还可以用于通过超文本传输协议(Hyper TextTransfer Protocol，HTTP)接口的形式对接业务层中的task模块； mod_digitalman_rtc模块则可以用于接收ms模块发送的音视频数据，并将音视频数据进行封装和发送。

运行环境则可以包括云主机、独立服务器和第三方虚拟主机。

基于上述的系统架构，如图3所示，用户进行呼叫之后，运营商ims 会将sip信令发送到与之对接的freeswitch模块，通过freeswitch模块的 diaplan单元配置拨号计划，然后freeswitch模块通过传输控制协议 (Transmission Control Protocol，tcp)的方式连接esl模块，esl模块响应用户指令，通过task模块解析用户指令对应的IVR流程，在得到解析结果之后，调用ms模块，ms模块则根据解析结果获取音视频文件，即本地音视频或者对接第三方的数字人实时流，并将基于音视频文件确定的音视频数据发送给mod_digitalman_rtc模块，mod_digitalman_rtc模块对音视频数据进行封装，并将封装后的音视频数据发送给用户的终端设备。

在本申请中，通过接收终端设备发送的用户指令，解析用户指令对应的IVR流程，得到解析结果，获取与解析结果对应的音视频文件，该音视频文件包括本地音视频和数字人实时流中的至少一项，采用目标封装方式对音视频数据进行封装，将封装之后的音视频数据发送至所述终端设备。如此一来，无论是经过处理的本地音视频，还是数字人实时流，都应用统一的封装方式进行封装，并发送至用户的终端设备，从而保证本地音视频和第三方的数字人实时流的无感切换。

作为一个可选实施例，为了解析本地音视频，上述S130之后，可以包括：

S210，在所述音视频文件为本地音视频的情况下，对所述本地音视频进行解码和编码，得到所述音视频数据。

在本实施例中，由于目标封装方式只能对裸流的音视频数据进行封装，而本地音视频的格式并非裸流，因此需要对本地音视频进行解码和重新编码，从而获得能够以目标封装方式进行封装的音视频数据。

通过解码和编码的方式，能够将本地音视频的格式转换为用户所需要的另一种格式，从而方便后续对转换后的本地音视频进行传输。

作为一个可选实施例，为了提升终端的兼容性，上述S210，可以包括：

S310，将所述本地音视频解码成为yuv数据和脉冲编码调制pcm数据；

S320，获取所述yuv数据的编码参数，所述编码参数包括：分辨率、帧率、码率和图片组单元；

S330，删除所述yuv数据的b帧；

S340，根据所述编码参数对删除b帧之后的所述yuv数据进行编码；

S350，根据所述pcm数据和编码后的所述yuv数据，生成所述音视频数据。

在本实施例中，首先将本地音视频解码成为yuv数据和pcm数据，yuv 数据是yuv格式的视频数据，pcm数据是pcm格式的音频数据，在解码之后，将yuv数据放在视频队列中，将pcm数据放在音频队列中。

然后从音频队列和视频队列中分别提取pcm数据和yuv数据，对于yuv 数据，设置yuv数据的编码参数，并删除yuv数据的b帧，然后基于设置好的编码参数对yuv数据进行重新编码。重新编码之后的yuv数据和pcm 数据共同构成音视频数据。

在一实施例中，基于图3，ms模块负责本地音视频的解码和重新编码，然后将重新编码后的yuv数据和pcm数据共同发送给mod_digitalman_rtc模块。

作为一个可选实施例，为了提升终端设备的兼容性，yuv数据的编码参数包括：分辨率是360*640像素每英寸、帧率是25帧每秒、码率是200 千比特每秒、图片组单元大小是10。

在本实施例中，通过上述编码参数对解码后的本地音视频进行重新编码，并删除原始的本地音视频的b帧，能够做到对不同视频的归一化处理，统一了编码器参数，从而能够提升终端的兼容性。

作为一个可选实施例，为了完成对视频数据的封装，音视频数据中包括视频数据，上述S140，可以包括：

S510，将所述视频数据拆分为至少一个视频单元；

S520，在所述至少一个视频单元中存在大于第一预设长度的视频单元的情况下，将所述大于第一预设长度的视频单元拆分为至少两个视频子单元，所述视频子单元的长度小于或等于第一预设长度；

S530，对所述视频子单元，以及小于或等于第一预设长度的所述视频单元分别添加实时传输协议rtp报文头进行封装；

S540，封装添加rtp报文头的所述视频单元和所述视频子单元。

在本实施例中，将视频数据进行拆分，拆分为至少一个视频单元，如果拆分的视频单元中存在长度大于第一预设长度的视频单元，那么就需要将长度大于第一预设长度的视频单元拆分为至少两个视频子单元，并保证视频子单元的长度小于或等于第一预设长度，然后将拆分后的视频子单元分别添加rtp报文头，并将长度小于或等于第一预设长度的视频单元分别添加rtp报文头，并对添加rtp报文头的视频单元和视频子单元分别进行封装。

通过对视频数据拆分为小于或等于第一预设长度的视频单元或视频子单元，并进行封装，能够将视频数据可靠且准确的发送到用户的终端设备，并且高效的利用传输资源。

作为一个可选实施例，为了完成对视频数据的封装，音视频数据包括视频数据，上述S510之后，可以包括：

S610，在所述至少一个视频单元不存在大于第一预设长度的视频单元的情况下，对所有至少一个视频单元分别添加rtp报文头；

S620，封装添加rtp报文头的所述视频单元。

在本实施例中，在对视频数据进行拆分之后，如果所有的视频单元均小于或等于第一预设长度，那么就可以直接对视频单元进行封装。

通过对视频数据拆分为小于或等于第一预设长度的视频单元，并进行封装，能够将视频数据可靠且准确的发送到用户的终端设备，并且高效的利用传输资源。

在一实施例中，如图3所示，mod_digitalman_rtc模块负责视频数据的封装，视频数据为h264格式的h264数据，在接收到h264数据之后，将 h264数据拆分为视频单元，即nalu单元，并将nalu单元存放在视频数据缓存队列中。本实施例中的第一预设长度可以为1200字节。

依次从视频数据缓存队列中取出nalu单元，如果nalu单小于或等于 1200字节，那么就直接将nalu单元封装成rtp报文头，并借助freeswitch的视频通道发送给给用户的终端设备。如果nalu单元大于1200字节，那么就需要将nalu单元进行拆包，拆分为至少两个视频子单元，并将视频子单元封装成rtp报文头，并借助freeswitch的视频通道发送给给用户的终端设备。

作为一个可选实施例，为了完成对音频数据的封装，音视频数据包括音频数据，上述S140，可以包括：

S710，将所述音频数据拆分为成音频单元，所述音频单元的长度为第二预设长度；

S720，对所述音频单元分别添加rtp报文头；

S730，封装添加rtp报文头的所述音频单元。

在本实施例中，音频数据可以是pcm格式的数据，预设格式可以为 8k16bit，在一实施例中，mod_digitalman_rtc模块负责音频数据的封装， mod_digitalman_rtc模块接收ms模块发送的音频数据，并将音频数据转成 8k16bit的数据，然后对转换之后的数据添加rtp报文头进行封装。

通过对视频数据拆分为第二预设长度的音频单元，并进行封装，能够将音频数据可靠且准确的发送到用户的终端设备，并且高效的利用传输资源。

基于上述实施例提供的音视频处理方法，相应地，本申请还提供了音视频处理装置的具体实现方式。请参见以下实施例。

首先参见图4，本申请实施例提供的音视频处理装置800包括以下模块：

接收模块801，用于根据用户指令获取音视频文件；

解析模块802，用于根据所述音视频文件的音视频类型进行解析，得到音视频数据；

获取模块803，用于将所述音视频数据进行封装；

封装模块804，用于将封装之后的音视频数据发送至客户终端；

发送模块805，用于将封装之后的音视频数据发送至所述终端设备。

设备通过接收终端设备发送的用户指令，解析用户指令对应的IVR流程，得到解析结果，获取与解析结果对应的音视频文件，该音视频文件包括本地音视频和数字人实时流中的至少一项，采用目标封装方式对音视频数据进行封装，将封装之后的音视频数据发送至所述终端设备。如此一来，无论是经过处理的本地音视频，还是数字人实时流，都应用统一的封装方式进行封装，并发送至用户的终端设备，从而保证本地音视频和第三方的数字人实时流的无感切换。

作为本申请的一种实现方式，为了解析本地音视频，上述获取模块 803还可以包括：

编解码单元，用于在所述音视频文件为本地音视频的情况下，对所述本地音视频进行解码和编码，得到音视频数据。

作为本申请的一种实现方式，为了完成对本地音视频的编解码，上述获取模块803还可以包括：

解码单元，用于将所述本地音视频解码成为yuv数据和pcm数据；

设置单元，用于获取所述yuv数据的编码参数；

去除单元，用于删除所述yuv数据的b帧；

编码单元，用于根据所述编码参数对所述yuv数据进行编码；

构成单元，用于编码后的所述yuv数据和所述pcm数据共同构成所述音视频数据。

作为本申请的一种实现方式，为了提升终端设备的兼容性，上述设置单元中的编码参数，可以包括：yuv数据的编码参数包括：分辨率是 360*640、帧率是25帧每秒、码率是200k、图片组单元大小是10。

作为本申请的一种实现方式，为了完成对视频数据的封装，上述封装模块804还可以包括：

第一拆分单元，用于将所述视频数据拆分为至少一个视频单元；

第二拆分单元，用于在存在所述视频单元的长度大于第一预设长度的情况下，将所述大于第一预设长度的视频单元拆分为至少两个视频子单元，所述视频子单元的长度小于或等于第一预设长度；

第一视频封装单元，用于对所述视频子单元添加rtp报文头进行封装。

作为本申请的一种实现方式，为了完成对视频数据的封装，上述封装模块804还可以包括：

第二视频封装单元，用于在所述视频单元均小于或等于第一预设长度的情况下，对所述视频单元添加rtp报文头进行封装。

作为本申请的一种实现方式，为了完成对音频数据的封装，上述封装模块804还可以包括：

转换单元，用于将所述音频数据转换成预设格式；

音频封装单元，用于对所述音频数据添加rtp报文头进行封装。

本发明实施例提供的音视频处理装置能够实现上述的方法实施例中的各个步骤，为避免重复，这里不再赘述。

图5示出了本申请实施例提供的音视频处理设备的硬件结构示意图。

在音视频处理设备可以包括处理器1001以及存储有计算机程序指令的存储器1002。

具体地，上述处理器1001可以包括中央处理器(CPU)，或者特定集成电路(Application Specific Integrated Circuit，ASIC)，或者可以被配置成实施本申请实施例的一个或多个集成电路。

存储器1002可以包括用于数据或指令的大容量存储器。举例来说而非限制，存储器1002可包括硬盘驱动器(Hard Disk Drive，HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus， USB)驱动器或者两个或更多个以上这些的组合。在合适的情况下，存储器1002可包括可移除或不可移除(或固定)的介质。在合适的情况下，存储器1002可在综合网关容灾设备的内部或外部。在特定实施例中，存储器 1002是非易失性固态存储器。

存储器可包括只读存储器(ROM)，随机存取存储器(RAM)，磁盘存储介质设备，光存储介质设备，闪存设备，电气、光学或其他物理/有形的存储器存储设备。因此，通常，存储器包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如，存储器设备)，并且当该软件被执行(例如，由一个或多个处理器)时，其可操作来执行参考根据本公开的一方面的方法所描述的操作。

处理器1001通过读取并执行存储器1002中存储的计算机程序指令，以实现上述实施例中的任意一种音视频处理方法。

在一个示例中，音视频处理设备还可包括通信接口1003和总线 1010。其中，如图5所示，处理器1001、存储器1002、通信接口1003 通过总线1010连接并完成相互间的通信。

通信接口1003，主要用于实现本申请实施例中各模块、装置、单元和 /或设备之间的通信。

总线1010包括硬件、软件或两者，将音视频处理设备的部件彼此耦接在一起。举例来说而非限制，总线可包括加速图形端口(AGP)或其他图形总线、增强工业标准架构(EISA)总线、前端总线(freeswitchB)、超传输(HT)互连、工业标准架构(ISA)总线、无限带宽互连、低引脚数 (LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连 (PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA) 总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下，总线1010可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线，但本申请考虑任何合适的总线或互连。

该音视频处理设备可以基于上述实施例，从而实现结合上述的音视频处理方法和装置。

另外，结合上述实施例中的音视频处理方法，本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令；该计算机程序指令被处理器执行时实现上述实施例中的任意一种音视频处理方法，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，上述计算机可读存储介质可包括非暂态计算机可读存储介质，如只读存储器(Read-Only Memory，简称ROM)、随机存取存储器(Random Access Memory，简称RAM)、磁碟或者光盘等，在此并不限定。

另外，本申请实施例还提供了一种计算机程序产品，包括计算机程序指令，计算机程序指令被处理器执行时可实现前述方法实施例的步骤及相应内容。

需要明确的是，本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见，这里省略了对已知方法的详细描述。在上述实施例中，描述和示出了若干具体的步骤作为示例。但是，本申请的方法过程并不限于所描述和示出的具体步骤，本领域的技术人员可以在领会本申请的精神后，作出各种改变、修改和添加，或者改变步骤之间的顺序。

以上的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时，其可以例如是电子电路、专用集成电路 (ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时，本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中，或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频 (RF)链路，等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。

还需要说明的是，本申请中提及的示例性实施例，基于一系列的步骤或者装置描述一些方法或系统。但是，本申请不局限于上述步骤的顺序，也就是说，可以按照实施例中提及的顺序执行步骤，也可以不同于实施例中的顺序，或者若干步骤同时执行。

上面参考根据本公开的实施例的方法、装置和计算机程序产品的流程图和/或框图描述了本公开的各方面。应当理解，流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器，以产生一种机器，使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解，框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合，也可以由执行指定的功能或动作的专用硬件来实现，或可由专用硬件和计算机指令的组合来实现。

以上，仅为本申请的具体实施方式，所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。应理解，本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本申请的保护范围之内。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：中移在线服务有限公司;中国移动通信集团有限公司;

上一篇：一种汽车显示屏的防溢胶安装结构
下一篇：一种气象预测方法、装置、介质及电子装置