掌桥专利:专业的专利平台
掌桥专利
首页

语音数据处理方法、装置、电子设备和存储介质

文献发布时间:2023-06-19 16:08:01



技术领域

本申请涉及数据处理技术领域,尤其涉及语音数据处理方法、装置、电子设备和存储介质。

背景技术

语音唤醒技术通过在设备或软件中预置唤醒词,当用户发出该语音指令时,设备便从休眠状态中被唤醒,并作出指定响应,大大提升了人机交互的效率。为了保护用户隐私,在设备唤醒之前不能将语音数据上传,因此,语音唤醒往往要在本地设备实现。

在进行语音唤醒之前,需要经过多个语音信号的处理流程,包括语音获取、语音预处理、语音端点检测、唤醒词判断以及最终得到唤醒结果。在该流水线中,各个处理模块会对语音数据逐帧进行处理,不同模块之间会通过缓存进行语音数据的传输。

受到成本的限制,本地设备往往算力不足、内存有限,某些特殊情况下不能及时处理数据,出现数据堆积的现象,唤醒词判断模块不能及时处理实时数据,导致用户在说出唤醒词后要过数秒才能得到回应,造成实际使用体验变差。

因此,语音唤醒流程中,如何及时发现语音唤醒过程中的数据流阻塞情况,成为影响系统稳定性的关键。

发明内容

本申请旨在至少解决相关技术中存在的技术问题之一。为此,本申请提出一种语音数据处理方法,能够及时发现语音唤醒过程中的数据流阻塞情况。

本申请还提出一种语音数据处理装置。

本申请还提出一种电子设备。

本申请还提出一种存储介质。

本申请还提出一种计算机程序产品。

根据本申请第一方面实施例的语音数据处理方法,包括:

通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

提取语音处理模块中的目标语音数据帧的时间戳;

所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

根据本申请实施例的语音数据处理方法,通过提取语音处理模块中的语音数据帧对应的时间戳并计算时间戳与当前系统时间的时间差,根据时间差与设定阈值进行比较判断当前系统是否发生语音数据流的阻塞,从而能够及时检测语音数据处理的异常。

根据本申请的一个实施例,所述语音数据流的数据处理过程依次包括多个处理步骤,所述语音处理模块为多个,且多个所述处理步骤与多个所述语音处理模块为一一对应关系;

所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常,包括:

根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序,确定与所述语音处理模块对应的第一阈值;

所述时间戳与当前系统时间的时间差大于所述第一阈值,确定所述语音数据流的数据处理过程发生异常。

根据本申请实施例的语音数据处理方法,通过依次排列的多个语音处理模块分别对语音数据流的语音数据帧进行处理,由于语音数据帧流转到不同的语音处理模块具有不同的时延,因此通过语音处理模块在整个数据处理过程中所处的环节来确定相应的判断阈值,进而判断语音数据帧在各个语音处理模块中是否时延过大,能够提高语音数据帧传输或处理时延监测的准确性。

根据本申请的一个实施例,在所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常之后,还包括:

根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序确定资源调度策略;

执行所述资源调度策略,以使多个所述语音处理模块优先处理所述语音数据流的语音数据帧。

根据本申请实施例的语音数据处理方法,通过语音处理模块对应的步骤在整个处理过程中的次序有针对性地确定资源调度策略,能够快速地对当前处理的语音数据流进行紧急处理,从而能够及时发现并处理语音数据滞后的问题,增强了系统鲁棒性。

根据本申请的一个实施例,所述第一语音处理模块为与所述数据处理过程的起始步骤对应的语音处理模块。

根据本申请实施例的语音数据处理方法,通过采用数据处理过程的起始步骤对应的语音处理模块对语音数据流进行分帧处理,并对每一语音数据帧打时间戳标识,通过最接近语音数据获取的源头来确定数据帧的时间戳,能够进一步提高语音数据帧传输或处理时延监测的准确性。

根据本申请的一个实施例,所述提取语音处理模块中的目标语音数据帧的时间戳,包括:

确定所述语音处理模块未对所述目标语音数据帧进行数据处理,并提取所述语音处理模块中的目标语音数据帧的时间戳。

根据本申请实施例的语音数据处理方法,对于每一语音处理模块,在其进行语音数据帧的处理之前,即提取该语音数据帧的时间戳进行时延判断,从而能够更加及时地发现语音数据处理过程的数据滞后问题。

根据本申请的一个实施例,所述多个处理步骤依次包括语音获取步骤、语音预处理步骤、语音端点检测步骤和语音数据判断步骤。

根据本申请实施例的语音数据处理方法,分别通过语音获取步骤、语音预处理步骤、语音端点检测步骤和语音数据判断步骤来实现包括语音唤醒数据在内的语音数据的处理,进一步提高了语音数据处理的效率和准确性。

根据本申请的一个实施例,所述语音数据处理方法应用于与语音处理系统对应的边缘计算端。

根据本申请实施例的语音数据处理方法,通过边缘计算端来实现该方法,避免额外增加语音处理系统本地设备的计算开销,从而在对语音数据处理异常监测的同时不影响原语音处理系统的运行,提高语音处理系统的鲁棒性。

根据本申请第二方面实施例的语音数据处理装置,包括:

标记模块,用于通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

提取模块,用于提取语音处理模块中的目标语音数据帧的时间戳;

确定模块,用于所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

根据本申请第三方面实施例的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音数据处理方法。

根据本申请第四方面实施例的非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音数据处理方法。

根据本申请第五方面实施例的计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述语音数据处理方法。

本申请实施例中的上述一个或多个技术方案,至少具有如下技术效果之一:

通过提取语音处理模块中的语音数据帧对应的时间戳并计算时间戳与当前系统时间的时间差,根据时间差与设定阈值进行比较判断当前系统是否发生语音数据流的阻塞,从而能够及时检测语音数据处理的异常。

本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的语音数据处理方法的流程示意图;

图2是本申请实施例提供的语音唤醒结果获取流程示意图;

图3是本申请实施例提供的时间戳处理流程示意图;

图4是本申请实施例提供的语音数据处理装置的结构示意图;

图5是本申请实施例提供的电子设备的结构示意图。

具体实施方式

下面结合附图和实施例对本申请的实施方式作进一步详细描述。以下实施例用于说明本申请,但不能用来限制本申请的范围。

图1是本申请实施例提供的语音数据处理方法的流程示意图之一。参照图1,本申请实施例提供一种语音数据处理方法,可以包括步骤:

S1、通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记。

在本申请实施例中,语音数据流的处理过程可以由多个语音处理模块依次完成,步骤S1为通过第一语音处理模块根据当前系统时间对每一帧语音数据帧进行打时间戳;其中,第一语音处理模块可以是多个语音处理模块中较为靠近语音数据源头的其中一语音处理模块。

S2、提取语音处理模块中的目标语音数据帧的时间戳。其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

需要说明的是,语音信号具有很强的变化特性,人在说话的过程中,不同的口型、气息、发音的位置都会产生不同的语音信号,而且每种语音信号持续的时间非常短,因此,语音信号具有非常强的时变特性。根据语音的波形图可以从总体看出语音信号是随着时间迅速变化的。正如上文所说,语音信号的变化是依靠不同的口型、气息、发音的位置,而人的这些部位的变化相对于声音的震动速度是比较慢的。通过语音波形可以看到在20ms内的语音变化,相对于整体的语音变化而言是非常小的,因此对短时语音信号的分析处理可以采用平稳过程数据处理的方式进行。语音信号能够保持比较平稳的时间是10ms到30ms,因此,对语音信号的处理与分析通常采用短时分析法,即通常所说的分帧操作(分帧处理)。

在本申请实施例中,首先对需要处理的语音数据流进行分帧操作,以语音数据帧为单位进行数据的处理和传输。整体上,语音处理系统可以由一个或多个语音处理模块组成,对于每个语音处理模块,在获取到完整的一帧语音数据帧后进行处理,处理完成后进行输出。对于语音处理模块中的某一个语音数据帧,可以提取其携带的时间戳标识,其中,该时间戳可以是在通过该语音处理模块或该语音处理模块之前的处理模块按照系统时间进行标记。

S3、所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

需要说明的是,受到成本的限制,本地设备往往算力不足、内存有限,某些特殊情况下不能及时处理数据,出现数据堆积的现象,因此,探索如何及时识别数据流阻塞,检测系统异常,避免用户实际体验变差,成为影响系统稳定性的关键。

在本申请实施例中,在提取到目标语音数据帧的时间戳后,根据该时间戳与当前系统时间可以计算两者的时间差,再根据该时间差与预设阈值进行比较即可判断整个语音数据流的处理过程是否发生异常。例如,当判断该时间差大于预设阈值,则说明该语音数据帧从最开始的数据获取(打时间戳的时刻)距离当前时刻的时延较长,可以认为该语音数据帧对应的语音数据流的处理过程发生异常(说明系统出现数据堆积)。

根据本申请实施例的语音数据处理方法,通过提取语音处理模块所处理的语音数据帧对应的时间戳并计算时间戳与当前系统时间的时间差,根据时间差与设定阈值进行比较判断当前系统是否发生语音数据流的阻塞,从而能够及时检测语音数据处理的异常。

在一个实施例中,所述语音数据流的数据处理过程依次包括多个处理步骤,所述语音处理模块为多个,且多个所述处理步骤与多个所述语音处理模块为一一对应关系;

步骤S3可以包括步骤:

S31、根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序,确定与所述语音处理模块对应的第一阈值;

S32、所述时间戳与当前系统时间的时间差大于所述第一阈值,确定所述语音数据流的数据处理过程发生异常。

在本申请实施例中,分别通过多个语音处理模块依次对语音数据流进行处理,例如语音数据流的处理需经过五个步骤,则对于每一步骤对应采用一个语音处理模块进行处理。以语音唤醒数据为例,在对设备进行语音唤醒响应之前,需要先经过语音获取、语音预处理、语音端点检测、唤醒词判断以及最终得到唤醒结果等步骤。在该流水线中,各个处理模块会对语音数据逐帧进行处理,不同模块之间会通过缓存进行语音数据的传输。

可以理解的是,对于同一语音数据帧,其时间戳被标记后是固定不变的,而该语音数据帧到达不同的语音处理模块具有不同的时延,因此可以根据语音处理模块对应的处理步骤确定其在整个语音数据流处理过程所处的环节,确定相应的第一阈值,继而根据该第一阈值来判断语音数据帧经过该语音处理模块时是否时延过大,可以根据不同的语音处理模块有针对性地进行数据传输或处理时延的判断。具体地,时间戳与当前系统时间的时间差大于阈值,认为数据处理过程发生异常,时间戳与当前系统时间的时间差不大于阈值,认为数据处理过程正常。

根据本申请实施例的语音数据处理方法,通过依次排列的多个语音处理模块分别对语音数据流的语音数据帧进行处理,由于语音数据帧流转到不同的语音处理模块具有不同的时延,因此通过语音处理模块在整个数据处理过程中所处的环节来确定相应的判断阈值,进而判断语音数据帧在各个语音处理模块中是否时延过大,能够进一步提高语音数据帧传输或处理时延监测的准确性。

在一个实施例中,在步骤S3之后,还可以包括步骤:

S4、根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序确定资源调度策略;

S5、执行所述资源调度策略,以使多个所述语音处理模块优先处理所述语音数据流的语音数据帧。

需要说明的是,该语音数据处理的流水线中,各个语音处理模块会对语音数据逐帧进行处理,不同模块之间会通过缓存进行语音数据的传输。由于受到成本的限制,本地设备往往算力不足、内存有限,某些特殊情况下不能及时处理数据,出现数据堆积的现象,例如,唤醒词判断模块不能及时获取语音数据并处理,导致用户在说出唤醒词后要过数秒才能得到回应,造成实际使用体验变差。

在本申请实施例中,当判断语音数据流的数据处理过程发生异常后,基于此次判断出时间差大于阈值的语音处理模块,可以根据该语音处理模块对应的处理步骤在整个语音处理过程所处的环节,有针对性性地制定资源调度策略,例如把系统计算资源优先分配至该语音处理模块以及后续的语音处理模块,或暂停其他优先级更高的任务,将本次的语音数据流对应的任务调至较高优先级,以尽可能提高语音数据帧在该语音处理模块及后续模块的处理效率,克服该语音数据流的数据处理异常问题。

根据本申请实施例的语音数据处理方法,通过语音处理模块对应的步骤在整个处理过程中的次序有针对性地确定资源调度策略,能够快速地对当前处理的语音数据流进行紧急处理,从而能够及时发现并处理语音数据滞后的问题,增强了系统鲁棒性。

根据本申请的一个实施例,所述第一语音处理模块为与所述数据处理过程的起始步骤对应的语音处理模块。

在本申请实施例中,对于数据处理过程的起始步骤对应的第一语音处理模块,由于该第一语音处理模块最接近数据的源头,因此采用该第一语音处理模块进行语音分帧处理,并根据此时的系统时间对每一语音数据帧打上时间戳标识。

根据本申请实施例的语音数据处理方法,通过采用数据处理过程的起始步骤对应的语音处理模块对语音数据流进行分帧处理,并对每一语音数据帧打时间戳标识,通过最接近语音数据获取的源头来确定数据帧的时间戳,能够进一步提高语音数据帧传输或处理时延监测的准确性。

在一个实施例中,步骤S2可以包括步骤:

S21、确定所述语音处理模块未对所述目标语音数据帧进行数据处理,并提取所述语音处理模块中的目标语音数据帧的时间戳。

需要说明的是,对于提取语音处理模块中的目标语音数据帧的时间戳这一操作,可以是在目标语音数据帧处于语音处理模块中的任何时候进行。在本申请实施例中,进一步地,在语音处理模块开始对目标语音数据帧进行数据处理之前,即首先提取该目标语音数据帧的时间戳,并进行后续的数据时延判断,从而能够更加及时地发现该目标语音数据帧在上一语音处理模块流转到当前的语音处理模块的过程中是否时延过大,进而能够更加及时地发现语音数据处理过程的数据滞后问题。

根据本申请实施例的语音数据处理方法,对于每一语音处理模块,在其进行语音数据帧的处理之前,即提取该语音数据帧的时间戳进行时延判断,从而能够更加及时地发现语音数据处理过程的数据滞后问题,进一步提高数据时延判断的及时性和准确性。

在一个实施例中,所述多个处理步骤依次包括语音获取步骤、语音预处理步骤、语音端点检测步骤和语音数据判断步骤。

需要说明的是,对于语音唤醒数据等语音数据的处理,需要经过语音获取、语音预处理、语音端点检测、唤醒词判断等步骤。具体地,语音获取步骤对应的语音处理模块可以用于获取语音数据,并进行分帧操作和标记时间戳;语音预处理步骤对应的语音处理模块可以用于对语音数据进行滤波、降噪等处理;语音端点检测步骤对应的语音处理模块可以用于对语音数据进行端点检测;语音数据判断步骤对应的语音处理模块可以用于对语音数据进行语音识别、数据判断等操作。

根据本申请实施例的语音数据处理方法,分别通过语音获取步骤、语音预处理步骤、语音端点检测步骤和语音数据判断步骤来实现包括语音唤醒数据在内的语音数据的处理,实现了语音唤醒数据等的分工协作处理,进一步提高了语音数据处理的效率和准确性。

在一个实施例中,所述语音数据处理方法应用于与语音处理系统对应的边缘计算端;所述语音处理系统用于执行所述语音数据流的数据处理过程。

需要说明的是,由于受到成本的限制,本地设备往往算力不足、内存有限,某些特殊情况下不能及时处理数据,出现数据堆积的现象,唤醒词判断模块不能及时处理实时数据,导致用户在说出唤醒词后要过数秒才能得到回应,造成实际使用体验变差。

在本申请实施例中,所述语音数据流的数据处理过程包括语音获取、语音预处理、语音端点检测、唤醒词判断等步骤,该过程通过语音处理系统实现;另外,通过与语音处理系统对应的边缘计算端实现提取时间戳以及时间差判断等语音数据流的处理异常检测过程。

本申请实施例在实现语音数据处理异常监测的同时,通过利用边缘计算技术来实现监测的处理过程,无需语音处理系统本地设备承担监测过程的运算,从而避免了对本来就算力有限的本地设备增加算力负担,有效提高语音处理系统的鲁棒性。

请参见图2-3,基于上述方案,为便于更好的理解本申请实施例提供的语音数据处理方法,以下以对语音唤醒数据的处理为例进行详细说明:

需要说明的是,在进行语音唤醒之前,需要先对语音信号进行处理,包括语音获取、语音预处理、语音端点检测、唤醒词判断以及最终得到唤醒结果,其流程如图2所示。在该流水线中,各个语音处理模块会对语音数据逐帧进行处理,不同模块之间会通过缓存进行语音数据的传输。受到成本的限制,本地设备往往算力不足、内存有限,某些特殊情况下不能及时处理数据,出现数据堆积的现象,不能及时获取得到唤醒词判断结果,导致用户在说出唤醒词后要过数秒才能得到回应,造成实际使用体验变差。因此,语音唤醒流程中,探索如何及时识别数据流阻塞,检测系统异常,避免用户实际体验变差,成为影响系统稳定性的关键。

为了解决因系统异常或高优先级任务抢占CPU等系统资源导致语音数据无法及时处理,数据堆积情况下唤醒响应变慢的问题。通过本申请实施例的方案,能够及时识别语音数据传输过程中的异常,进而采用紧急措施对堆积的数据及时处理,使得系统尽快恢复正常状态,提升用户交互体验。

在本申请实施例中,通过对语音数据帧加入时间戳,不同模块、不同线程在进行语音数据帧处理的时候通过语音帧时间戳与系统当前时间进行比对,及时发现由于没有及时处理导致语音数据滞后的问题,增强系统鲁棒性,提升用户语音唤醒的交互体验。

如图2所示,对于语音唤醒的数据流,首先进行语音数据的获取,将该原始语音信号进行预处理、端点检测得到有效语音数据后,送至唤醒词判断模块进行判别获取唤醒词判别结果。

对语音数据流进行分帧操作,以语音数据帧为单位进行数据的处理与传输,并通过对语音数据帧打上时间戳,能够实现对语音数据帧在各模块传递过程的监测。具体过程如下:

第一语音处理模块(语音获取模块)获取到原始语音数据,整个数据处理系统中,该模块最接近数据源头,因此采用此时的系统时间对语音数据帧打时间戳。

因此,在获取第0帧语音时,会根据当前时刻的系统时间对第0帧语音打时间戳;在获取第1帧语音时,会根据当前时刻的系统时间对第1帧语音打时间戳,以此类推。

在进行后续步骤时,会应用该时间戳对语音帧是否延迟进行分析判断。

比如,在进行语音预处理过程中,获取到一帧完整的语音数据帧后,提取该语音数据帧的时间戳标识,结合当前系统时间与该语音数据帧的时间戳进行比较判断,对不同的结果采取不同的应对策略,如图3所示:

通过当前系统时间与语音数据帧的时间戳进行比较,如果时间差过大则意味着整个系统有数据堆积现象,数据不能得到及时的处理导致延迟现象严重。此时应采取紧急策略进行处理,使得系统及时恢复正常状态。

同理,在之后的端点检测、唤醒词判断模块都可以通过语音帧的时间戳获取到该语音数据帧输入的时刻,通过与系统时间的比对得到语音数据在传输过程中是否发生异常的结论,进而及时的采取应对策略。

需要说明的是,通过本申请实施例能够及时发现由于没有及时处理导致语音数据滞后的问题,通过系统时间与语音数据帧时间戳的时间差来判断数据是否延迟,出现延迟过大后及时采取应急策略,避免了用户进行唤醒后短时间内得不到回应,过了几秒钟后又突然回应的现象,从而增强系统鲁棒性,提升用户语音唤醒的交互体验。

参考图4,图4是本申请实施例提供的语音数据处理装置的模块示意图,本申请实施例提供的语音数据处理装置,包括:

标记模块1,用于通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

提取模块2,用于提取语音处理模块中的目标语音数据帧的时间戳;

确定模块3,用于所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

在一个实施例中,所述语音数据流的数据处理过程依次包括多个处理步骤,所述语音处理模块为多个,且多个所述处理步骤与多个所述语音处理模块为一一对应关系;

所述确定模块3具体用于:

根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序,确定与所述语音处理模块对应的第一阈值;

所述时间戳与当前系统时间的时间差大于所述第一阈值,确定所述语音数据流的数据处理过程发生异常。

在一个实施例中,所述语音数据处理装置还包括调度模块,其用于:

根据所述语音处理模块对应的处理步骤在所述数据处理过程中的次序确定资源调度策略;

执行所述资源调度策略,以使多个所述语音处理模块优先处理所述语音数据流的语音数据帧。

在一个实施例中,所述第一语音处理模块为与所述数据处理过程的起始步骤对应的语音处理模块。

在一个实施例中,所述提取模块2具体用于:

确定所述语音处理模块未对所述目标语音数据帧进行数据处理,并提取所述语音处理模块中的目标语音数据帧的时间戳。

在一个实施例中,所述多个处理步骤依次包括语音获取步骤、语音预处理步骤、语音端点检测步骤和语音数据判断步骤。

在一个实施例中,所述语音数据处理方法应用于与语音处理系统对应的边缘计算端。

图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和通信总线540,其中,处理器510,通信接口520,存储器530通过通信总线540完成相互间的通信。处理器310可以调用存储器530中的逻辑指令,以执行如下方法:

S1、通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

S2、提取语音处理模块中的目标语音数据帧的时间戳;

S3、所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面,本申请实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:

S1、通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

S2、提取语音处理模块中的目标语音数据帧的时间戳;

S3、所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

又一方面,本申请实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的传输方法,例如包括:

S1、通过第一语音处理模块对语音数据流进行分帧处理,并根据当前系统时间对分帧处理后得到的每一语音数据帧进行时间戳标记;

S2、提取语音处理模块中的目标语音数据帧的时间戳;

S3、所述时间戳与当前系统时间的时间差大于预设阈值,确定所述语音数据流的数据处理过程发生异常;

其中,所述目标语音数据帧为所述语音数据流被分帧处理后得到的其中一语音数据帧。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是,以上实施方式仅用于说明本申请,而非对本申请的限制。尽管参照实施例对本申请进行了详细说明,本领域的普通技术人员应当理解,对本申请的技术方案进行各种组合、修改或者等同替换,都不脱离本申请技术方案的精神和范围,均应涵盖在本申请的权利要求范围中。

技术分类

06120114715982