掌桥专利:专业的专利平台
掌桥专利
首页

音频播放方法、装置、电子设备及可读存储介质

文献发布时间:2024-04-18 19:48:15


音频播放方法、装置、电子设备及可读存储介质

技术领域

本申请属于音视频技术领域,具体涉及一种音频播放方法、装置、电子设备及可读存储介质。

背景技术

通常,在用户使用电子设备播放语音音频的过程中,若用户想要到某个地点,则用户可以触发电子设备开启导航功能,以使得电子设备可以先在确定要播放用于提示到该某个地点的路线的导航音频时,中断播放该语音音频并播放该导航音频,然后再在完成播放该导航音频的情况下,继续播放该语音音频,从而用户可以同时收听该语音音频对应的文字内容和该导航音频对应的文字内容。

但是,由于在用户使用电子设备播放语音音频的过程中,电子设备是在确定要播放导航音频时,直接中断播放该语音音频的,这样可能会出现用户收听到该语音音频对应的某段文字内容不完整的情况,此时,用户需要进行多次操作,以触发电子设备重新播放该语音音频,以完整收听该某段文字内容,因此,导致电子设备播放音频的效果较差。

发明内容

本申请实施例的目的是提供一种音频播放方法,能够解决电子设备播放音频的效果较差的问题。

第一方面,本申请实施例提供了一种音频播放方法,该方法包括:在播放第一音频的过程中,获取第一时间点;该第一时间点为待播放的第二音频的起始播放时间点;根据第一时间点,从第一音频对应的文本段中确定第一文本段;根据第一文本段的起始播放时间点,确定第二时间点;该第二时间点位于第一时间点之前;在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

第二方面,本申请实施例提供了一种音频播放装置,该音频播放装置:获取模块、确定模块以及播放模块。其中,获取模块,用于在播放第一音频的过程中,获取第一时间点;该第一时间点为待播放的第二音频的起始播放时间点。播放模块,用于根据获取模块获取的第一时间点,从第一音频对应的文本段中确定第一文本段;并根据第一文本段的起始播放时间点,确定第二时间点;该第二时间点位于第一时间点之前。播放模块,用于在确定模块确定的第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,所述存储器存储可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面所述的方法的步骤。

第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面所述的方法的步骤。

第五方面,本申请实施例提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现如第一方面所述的方法。

第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面所述的方法。

在本申请实施例中,由于在电子设备播放第一音频的过程中,电子设备在获取到待播放的第二音频的起始播放时间点(即第一时间点)之后,可以先根据该第一时间点,从第一音频对应的文本段中确定第一文本段,并根据该第一文本段的起始播放时间点,将该第一时间点之前的第二时间点,确定为中断播放第一音频的时间点,然后再在第一时间点开始播放第二音频,而不是直接在该第一时间点中断播放第一音频,并开始播放第二音频,因此,用户可以在收听到该第一文本段的完整文字内容的同时,及时地收听第二音频,而无需用户进行多次操作,如此,可以提高电子设备播放音频的效果。

附图说明

图1是本申请实施例提供的音频播放方法的流程示意图之一;

图2是本申请实施例提供的音频播放方法的流程示意图之二;

图3是本申请实施例提供的音频播放方法的流程示意图之三;

图4是本申请实施例提供的音频播放方法的流程示意图之四;

图5是本申请实施例提供的音频播放方法的流程示意图之五;

图6是本申请实施例提供的音频播放装置的结构示意图之一;

图7是本申请实施例提供的音频播放装置的结构示意图之二;

图8是本申请实施例提供的音频播放装置的结构示意图之三;

图9是本申请实施例提供的音频播放装置的结构示意图之四;

图10是本申请实施例提供的电子设备的硬件结构示意图之一;

图11是本申请实施例提供的电子设备的硬件结构示意图之二。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员获得的所有其他实施例,都属于本申请保护的范围。

本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的术语在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一音频可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。

下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的音频播放方法、装置、电子设备及可读存储介质进行详细地说明。

本申请实施例提供的操作执行方法可以应用于导航场景。

假设用户正在收听教学音频1,且用户想要从起点位置A移动至终点位置B,这样在用户使用电子设备播放该教学音频1的过程中,用户可以在导航应用程序的应用界面中输入该起点位置A和终点位置B,以使得电子设备可以开启该导航应用程序的导航功能,并接收该导航应用程序发送的播放请求,该播放请求中包括导航音频2和起始播放时间点,该导航音频2用于提示从起点位置A至终点位置B的路线,该起始播放时间点为该导航音频2的起始播放时间,从而电子设备可以先在该起始播放时间点中断播放该教学音频1,并播放该导航音频2,然后再在完成播放该导航音频2的情况下,继续播放该教学音频1,从而用户可以同时收听该教学音频1对应的文字内容和导航音频2对应的文字内容。但是,由于在用户使用电子设备播放教学音频1的过程中,电子设备是在起始播放时间点直接中断播放该教学音频1的,这样可能会出现用户收听到该教学音频1对应的某段文字内容不完整的情况,此时,用户需要进行多次操作,以触发电子设备重新播放该教学音频1,以完整收听该某段文字内容,因此,导致电子设备播放音频的效果较差。

然而,在本申请实施例中,在用户使用电子设备播放教学音频1的过程中,电子设备可以先根据起始播放时间点,从教学音频1对应的文本段中确定一个文本段,再根据该一个文本段的起始播放时间点确定新的起始播放时间点,该新的起始播放时间点位于该起始播放时间点之前,从而电子设备可以在该新的起始播放时间点中断播放教学音频1,并在该起始播放时间点播放导航音频2。可以理解,电子设备是先根据起始播放时间点,从教学音频1对应的文本段中确定一个文本段,并根据该一个文本段的起始播放时间点确定中断播放教学音频1的新的起始播放时间点,然后再在该起始播放时间点开始播放导航音频2,而不是直接在起始播放时间点中断播放教学音频1,因此,用户可以在收听该一个文本段的完整文字内容的同时,及时地收听导航音频2,而无需用户进行多次操作,如此,可以提高电子设备播放音频的效果。

本申请实施例提供的音频播放方法,执行主体可以为音频播放装置,或者电子设备,或者电子设备中的功能模块或实体。本申请实施例中以电子设备执行音频播放方法为例,说明本申请实施例提供的音频播放方法的。

图1示出了本申请实施例提供的一种音频播放方法的流程示意图。如图1所示,本申请实施例提供的一种音频播放方法可以包括下述的步骤101至步骤104。

步骤101、在播放第一音频的过程中,电子设备获取第一时间点。

本申请实施例中,上述第一时间点为待播放的第二音频的起始播放时间点。

本申请实施例中,上述第一时间点可以为电子设备的系统时间点。

在本申请的一些实施例中,第一音频具体可以为语音音频,例如教学音频等。其中,该第一音频可以为以下任一项:音频文件中的音频、视频中的音频等。

在本申请的一些实施例中,在显示第一应用程序的应用界面的情况下,电子设备可以根据用户对该应用界面中的目标标识的点击输入,开启该目标标识指示的目标多媒体文件,从而电子设备可以播放第一音频。

可选地,上述第一应用程序可以为以下任一项:视频类应用程序、网页类应用程序、聊天类应用程序、音乐类应用程序等。

可选地,上述目标多媒体文件可以为以下任一项:音频文件、视频文件等。其中,在目标多媒体文件为视频文件的情况下,上述第一音频可以为该视频文件中包括的音频文件,从而在电子设备开启该目标多媒体文件的情况下,电子设备可以播放第一音频。

可选地,上述目标标识为目标多媒体文件的标识,该目标标识可以包括以下至少一项:文件名称、文件链接、文件缩略图等。

在本申请的一些实施例中,在电子设备播放第一音频之后,电子设备可以根据用户在电子设备中的输入,开启第二应用程序,并根据用户在该第二应用程序的应用界面中输入起点位置和终点位置的文字输入,开启第二应用程序的导航功能,从而电子设备的操作系统可以接收第二应用程序发送的第一播放请求,该第一播放请求中包括至少两个导航音频和至少两个时间点,该至少两个导航音频和至少两个时间点一一对应,该至少两个导航音频用于提示从起点位置至终点位置的路线,每个时间点用于指示对应的导航音频的起始播放时间点,进而电子设备的操作系统可以根据将该至少两个导航音频中的第一个导航音频,确定为第二音频,并将该第一个导航音频对应的一个时间点,确定为第一时间点,以获取第一时间点。

可选地,上述第二应用程序可以为以下任一项:导航类应用、视频类应用、社交类应用、短视频交互类应用等。

可选地,上述第二音频具体可以为:上述至少两个导航音频中的第一个导航音频,或者,根据至少两个导航音频中的第一个导航音频确定的。可以理解,第二音频也可以为导航音频。

其中,电子设备的操作系统可以获取当前所处的导航场景,并对该导航场景对至少两个导航音频中的第一个导航音频进行简化处理,以得到第二音频;其中,该第二音频的播放时长小于该第一个导航音频的播放时长。

具体地,上述导航场景可以包括以下至少一项:高速公路场景、城市场景、交通拥堵场景、路线规划场景、白天场景、夜晚场景、雨天场景、雾天场景等。

示例性地,假设电子设备当前所处的场景为高速公路场景,至少两个导航音频中的第一个导航音频为“前方20公里路段畅通,请您在当前车道上保持直行行驶”导航音频,则电子设备可以对“前方20公里路段畅通,请您在当前车道上保持直行行驶”导航音频进行简化处理,以得到第二音频,例如“请保持在当前车道上行驶”音频,该“请保持在当前车道上行驶”音频的播放时长小于“前方20公里路段畅通,请您在当前车道上保持直行行驶”导航音频的播放时长。

又示例性地,假设电子设备当前所处的场景为城市场景,至少两个导航音频中的第一个导航音频为“距离下个路口1公里,请您提前行驶至最右侧车道,准备在下一个路口右转”导航音频,则电子设备可以对“距离下个路口1公里,请您提前行驶至最右侧车道,准备在下一个路口右转”导航音频进行简化处理,以得到第二音频,例如“请在下一个路口右转”音频,该“请在下一个路口右转”音频的播放时长小于“距离下个路口1公里,请您提前行驶至最右侧车道,准备在下一个路口右转”导航音频的播放时长。

又示例性地,假设电子设备当前所处的场景为交通拥堵场景,至少两个导航音频中的第一个导航音频为“前方2公里拥堵,请您耐心等待”导航音频,则电子设备可以对“前方2公里拥堵,请您耐心等待”导航音频进行简化处理,以得到第二音频,例如“请保持缓慢行驶”音频,该“请保持缓慢行驶”音频的播放时长小于“前方2公里拥堵,请您耐心等待”导航音频的播放时长。

具体地,电子设备可以将至少两个导航音频中的第一个导航音频和电子设备当前所处的导航场景的场景信息输入至第一神经网络模型中,以使得第一神经网络模型可以根据该场景信息,确定对应的简化算法,并采用该简化算法对该第一个导航音频进行简化处理,以得到第二音频。

这里,上述第一神经网络模型具体可以是:采用用户的历史使用数据进行训练得到的神经网络模型;该历史使用数据可以是通过目标传感器采集得到的数据,该目标传感器可以包括以下至少一项:车速传感器、转向传感器、加速度传感器、全球定位系统(GlobalPositioningSystem,GPS)传感器等。

这里,电子设备可以采用目标算法,对上述历史使用数据进行特征提取,得到至少两个特征数据,从而可以采用该至少两个特征数据对预设的神经网络模型进行训练,以得到第一神经网络模型。该目标算法可以为以下任一项:决策树算法、随机森林算法、支持向量机算法等。

步骤102、电子设备根据第一时间点,从第一音频对应的文本段中确定第一文本段。

需要说明的是,上述“第一音频对应的文本段”可以理解为:将第一音频进行语音识别后得到的文本段。

在本申请的一些实施例中,上述第一时间点位于第一文本段对应的播放时间段内。

在本申请的一些实施例中,上述第一音频对应Q个文本段,每个文本段分别对应一个播放时间戳范围,这样电子设备可以先根据电子设备播放第一音频的起始播放时间点和Q个播放时间戳范围,确定Q个时间点范围,每个时间点范围分别为一个文本段对应的系统时间点范围,然后再从该Q个时间点范围中,确定第一时间点所位于的一个时间点范围,从而电子设备可以将该一个时间点范围对应的一个文本段,确定为第一文本段;Q为正整数。

示例性地,假设第一音频对应3个文本段,例如“今天我们要讲解一下XXXX”文本段1,“XXXX是一门重要的学科”文本段2,“因此我们要认真学习XXXX”文本段3,该“今天我们要讲解一下XXXX”文本段1对应一个播放时间戳范围,例如播放时间戳范围0:01~0:06,该“XXXX是一门重要的学科”文本段2对应另一个播放时间戳范围,例如播放时间戳范围0:07~0:15,该“因此我们要认真学习XXXX”文本段3对应又一个播放时间戳,例如播放时间戳范围0:16~0:25,电子设备播放第一音频的起始播放时间点为8:00,第一时间点为8:09。这样,电子设备可以先根据电子设备播放第一音频的起始播放时间点8:00和播放时间戳范围0:01~0:06,确定该“今天我们要讲解一下XXXX”文本段1对应的一个时间点范围,即8:01~8:06,并根据该时间点8:00和播放时间戳范围0:07~0:15,确定“XXXX是一门重要的学科”文本段2对应的另一个时间点范围,即8:07~8:15,以及根据该时间点8:00和播放时间戳范围0:16~0:25,确定“因此我们要认真学习XXXX”文本段3对应的又一个时间点范围,即8:16~8:25;然后再确定第一时间点8:09所位于的时间点范围,即8:07~8:15,并将8:07~8:15对应的文本段确定为第一文本段,即将“XXXX是一门重要的学科”文本段2确定为第一文本段。

步骤103、电子设备根据第一文本段的起始播放时间点,确定第二时间点。

本申请实施例中,上述第二时间点位于第一时间点之前。

在本申请的一些实施例中,电子设备可以直接将第一文本段的起始播放时间点,确定为第二时间点;或者,电子设备可以将从第一文本段的起始播放时间点起的第一预设时长之前的时间点,确定为第二时间点。

在本申请的一些实施例中,电子设备可以先将第一文本段对应的时间点范围的最小极值点,确定为第一文本段的起始播放时间点,然后再将第一文本段的起始播放时间点,确定为第二时间点。

示例性地,假设第一文本段为“XXXX是一门重要的学科”文本段,该“XXXX是一门重要的学科”文本段对应的时间点范围为8:07~8:15,则电子设备可以先将8:07确定为第一文本段的起始播放时间点,然后再将该8:07确定为第二时间点。

步骤104、电子设备在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

在本申请的一些实施例中,在电子设备的系统时间与第二时间点相匹配的情况下,电子设备可以中断播放第一音频。

需要说明的是,上述“相匹配”可以理解为:相同,或之间的差值小于或等于预设差值。

可选地,在电子设备的系统时间与第五时间点相同的情况下,电子设备可以调低第一音频的播放音量,并在第二时间点中断播放第一音频。其中,该第五时间点为:该第二时间点起的第二预设时长之前的时间点。

下面将举例说明电子设备开始播放第二音频的具体方案。

在本申请的一些实施例中,结合图1,如图2所示,在上述步骤103之后,且在上述步骤104之前,本申请实施例提供的音频播放方法还可以包括下述的步骤201,且上述步骤104具体可以通过下述的步骤104a实现。

步骤201、电子设备在第一音频中添加第一音频标识。

本申请实施例中,上述第一音频标识用于指示第二音频,该第一音频标识与第二播放位置关联,该第二播放位置为:第一音频中对应第二时间点的播放位置。

在本申请的一些实施例中,电子设备在确定第二时间点之后,可以对第二音频进行特征提取,以得到第二音频特征,从而电子设备可以根据第二音频特征,生成第一音频标识,进而电子设备可以在第一音频中添加第一音频标识。

可选地,上述第二音频特征可以包括以下至少一项:起始播放时间点、播放时长、音频名称等。

在本申请的一些实施例中,上述第二播放位置具体可以为:第一音频中,第二时间点对应的播放时间戳的位置。

步骤104a、电子设备在第二时间点中断播放第一音频,并根据第一音频标识,确定第二音频,并在第一时间点开始播放第二音频。

在本申请的一些实施例中,电子设备可以根据第一音频标识,从上述至少两个导航音频中确定出第二音频;或者,从上述至少两个导航音频中确定出一个导航音频,并根据该一个导航音频确定第二音频。

如此可知,由于电子设备可以在第一音频中添加指示第二音频的第一音频标识,以在第二时间点根据该第一音频标识,确定并在第一时间点播放第二音频,而无需存储播放第二音频的时间点,因此,可以节省电子设备的存储空间。

在本申请的一些实施例中,结合图1,如图3所示,在上述步骤103之后,且在上述步骤104之前,本申请实施例提供的音频播放方法还可以包括下述的步骤301,且上述步骤104具体可以通过下述的步骤104b实现。

步骤301、电子设备在第一音频的第二播放位置插入第二音频,并将第二音频的起始播放位置调整为第三播放位置,以生成目标音频。

本申请实施例中,上述第二播放位置为:第一音频中对应第二时间点的播放位置;上述第三播放位置为:第一音频中对应第一时间点的播放位置。

在本申请的一些实施例中,在电子设备确定第二时间点之后,电子设备可以将第一音频和第二音频导入音频处理应用程序中,并通过该音频处理应用程序将第一音频和第二音频进行合成处理,以将第二音频插入第一音频的第二播放位置,以及,在第二播放位置处出入空白音频,以将该第二音频的起始播放位置调整为第三播放位置,以生成目标音频。

需要说明的是,针对音频处理应用程序将第一音频和第二音频进行合成处理的说明,可以参考相关技术中的具体描述,本申请实施例在此不予赘述。

可以理解,电子设备可以将第一音频和第二音频进行融合,以生成目标音频。

在本申请的一些实施例中,在电子设备将第二音频的起始播放位置调整为第三播放位置之后,电子设备可以通过音频处理应用程序对处理得到的音频进行混音处理,以生成目标音频。

需要说明的是,针对上述混音处理的说明,可以参考相关技术中的具体描述,本申请实施例在此不予赘述。

步骤104b、电子设备播放目标音频,以在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

在本申请的一些实施例中,在电子设备播放目标音频之后,电子设备还可以在电子设备的显示屏上显示目标音频的播放界面,该播放界面中可以包括第一音频的音频信息和第二音频对应的导航信息,从而用户可以在收听第一音频和第二音频的同时,查看该第一音频的音频信息和第二音频对应的导航信息。

本申请实施例中,由于电子设备是在第一音频的第二播放位置插入第二音频,并将第二音频的起始播放时间调整为第三播放位置的,即目标音频的第三播放位置对应的音频内容为第二音频的音频内容,因此,在电子设备的系统时间与第二时间点相匹配的情况下,电子设备会中断播放第一音频,并在第一时间点开始播放第二音频。

如此可知,由于电子设备可以直接将第一音频和第二音频进行融合,以生成目标音频,并开始播放该目标音频,以在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频,而无需电子设备将第一音频和第二音频之间来回切换播放,因此,可以避免因切换播放而导致的播放时延。

本申请实施例中,在电子设备播放第一音频的过程中,电子设备可以先获取待播放的第二音频的起始播放时间点,即第一时间点,然后再根据该第一时间点,从第一音频对应的文本段中确定第一文本段,并根据该第一文本段的起始播放时间点,确定第二时间点,该第二时间点位于第一时间点之前;从而电子设备可以在该第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

本申请实施例提供一种音频播放方法,由于在电子设备播放第一音频的过程中,电子设备在获取到待播放的第二音频的起始播放时间点(即第一时间点)之后,可以先根据该第一时间点,从第一音频对应的文本段中确定第一文本段,并根据该第一文本段的起始播放时间点,将该第一时间点之前的第二时间点,确定为中断播放第一音频的时间点,然后再在第一时间点开始播放第二音频,而不是直接在该第一时间点中断播放第一音频,并开始播放第二音频,因此,用户可以在收听到该第一文本段的完整文字内容的同时,及时地收听第二音频,而无需用户进行多次操作,如此,可以提高电子设备播放音频的效果。

需要说明的是,由于可能会出现从上述起点位置至终点位置之间的路况发生变化,或用户修改终点位置的情况,这样可能会导致第二音频的起始播放时间点发生变化的情况,因此,电子设备可以实时确定第二音频的起始播放时间点是否发生变化,并在确定第二音频的起始播放时间点发生变化的情况下,获取变化后的起始播放时间点,并根据变化后的起始播放时间点,再次执行上述步骤101至步骤104,以重新确定一个新的时间点,并在该新的时间点中断播放第一音频,并在第二音频的变化后的起始播放时间点开始播放第二音频。

在本申请的一些实施例中,电子设备可以在获取第一时间点时,开启第一计时器,并在该第一计时器超时的情况下,确定第二音频的起始播放时间点是否发生变化。

当然,为了保持电子设备播放第一音频和第二音频之间的连贯性,电子设备还可以在中断播放第一音频的时间点开始播放其他音频进行过渡,下面将举例说明。

在本申请的一些实施例中,结合图1,如图4所示,在上述步骤104中的“在第一时间点开始播放第二音频”之前,本申请实施例提供的音频播放方法还可以包括下述的步骤401,且上述步骤104具体可以通过下述的步骤104c实现。

步骤401、电子设备在第一时间段内播放第三音频。

本申请实施例中,上述第一时间段为:上述第二时间点和第一时间点之间的时间段。

在本申请的一些实施例中,上述第一时间段的起始时间点为第二时间点,该第一时间段的终止时间点为第一时间点。

可以理解,电子设备在中断播放第一音频的同时,直接开始播放第三音频,并在完成播放第三音频的同时,直接开始播放第二音频。

本申请实施例中,上述第三音频是根据以下至少一项确定的:第一音频、第二音频。

在本申请的一些实施例中,第三音频的全部音频内容可以是根据第一音频或第二音频确定的。

在本申请的一些实施例中,第三音频的一部分音频内容可以是根据第一音频确定的,另一部分音频内容可以是根据第二音频确定的。

在本申请的一些实施例中,在电子设备播放第三音频的过程中,电子设备可以逐渐调小播放第三音频的播放音量。其中,在第二时间点播放第三音频的播放音量,与第一音频的播放音量相匹配。

下面将以第三音频是根据第二音频确定的为例,举例说明电子设备确定第三音频的具体方案。

在本申请的一些实施例中,上述第三音频是根据第二音频确定的。具体地,在上述步骤401之前,本申请实施例提供的音频播放方法还可以包括下述的步骤501和步骤502,或步骤501和步骤503。

步骤501、电子设备获取第二音频对应的N个第一音频特征。

本申请实施例中,N为正整数。

在本申请的一些实施例中,上述N个第一音频特征可以包括以下至少一项:音频风格、音频类型、音频速率等。

在本申请的一些实施例中,电子设备可以先获取第二音频,再对该第二音频进行特征提取,以得到N个第一音频特征。

在本申请的一些实施例中,电子设备可以从第二应用程序对应的服务器获取目标历史导航数据,该目标历史导航数据包括:用户或其他用户从输入起点位置和终点位置的路线的历史导航音频,并对该历史导航音频进行特征提取,以得到N个第一音频特征。

步骤502、电子设备根据N个第一音频特征,生成第三音频。

在本申请的一些实施例中,电子设备可以先采用N个第一音频特征,生成第五音频,然后再根据第二时间点和第一时间点之间的时长,对该第五音频进行剪辑处理,以得到第三音频。

可选地,电子设备可以先获取一个预设音频,然后再分别采用每个第一音频特征,调整该一个预设音频对应的一个音频特征,从而可以得到第五音频。

需要说明的是,针对电子设备根据N个第一音频特征合成得到第六音频的说明,可以参考相关技术中的具体描述,本申请实施例在此不再赘述。

可以理解,第三音频的音频特征与第二音频的音频特征相匹配,即第三音频和第二音频的音频风格、音频类型以及音频速率均相匹配。

如此可知,由于电子设备可以根据获取的第二音频对应的N个第一音频特征,直接合成得到第三音频,而无需较长时间进行查找,因此,可以减少电子设备得到第三音频的耗时。

步骤503、电子设备根据N个第一音频特征,从预存的音频中确定第三音频。

在本申请的一些实施例中,电子设备可以先获取电子设备预先存储的每个音频的至少一个音频特征,然后再分别将每个音频的至少一个音频特征与N个第一音频特征进行对比,以从电子设备存储的音频中确定出第六音频,并根据第二时间点和第一时间点之间的时长,对该第六音频进行剪辑处理,以得到第三音频。

可选地,针对电子设备存储的每个音频,电子设备可以将一个音频的至少一个音频特征与N个第一音频特征进行对比,以确定该至少一个音频特征与该N个第一音频特征相匹配的音频特征数量,并在相匹配的音频特征数量大于或等于预设数量的情况下,将该一个音频确定为第六音频。

如此可知,由于电子设备可以根据获取的第二音频对应的N个第一音频特征,直接从电子设备存储的音频中确定出第三音频,而无需电子设备进行较多运算,以得到第三音频,因此,可以减少电子设备得到第三音频的运算量。

在本申请的一些实施例中,在电子设备得到第三音频之后,电子设备还可以对第一音频和第三音频进行平滑过渡处理,以进一步降低将播放的第一音频切换为第三音频时的不连贯感。

可选地,上述平滑过渡处理可以包括以下至少一项:可变帧率处理、噪声抑制处理、交叉淡入淡出处理。需要说明的是,针对可变帧率处理、噪声抑制处理以及交叉淡入淡出处理的说明,可以参考相关技术中的具体描述。

步骤104c、电子设备在第一时间点播放第二音频。

本申请实施例中,电子设备可以在中断播放第一音频的同时,播放第三音频,并在完成播放第三音频的同时,播放第二音频,以保持播放第一音频和第二音频之间的连贯性。

如此可知,由于电子设备可以在中断播放第一音频和播放第二音频之间的时间段内,播放第三音频作为过渡,因此,可以提高电子设备播放第一音频和第二音频的连贯性,如此,可以提高用户收听第一音频和第二音频的体验。

当然,在电子设备完成播放第二音频的情况下,电子设备还可以继续播放第一音频,并在完成播放第二音频的时间点和继续播放第一音频的时间点之间播放其他音频进行过渡,以保持电子设备播放第二音频和第一音频之间的连贯性。示例性地,结合图1,如图5所示,在上述步骤104之后,本申请实施例提供的音频播放方法还可以包括下述的步骤601和步骤602。

步骤601、在完成播放第二音频的情况下,电子设备在第二时间段内播放第四音频。

本申请实施例中,上述第二时间段为:第三时间点和第四时间点之间的时间段,该第三时间点为:完成播放第二音频的时间点,该第四时间点为:第三时间点起的预设时长之后的时间点。

在本申请的一些实施例中,上述第二时间段的起始时间点为第三时间点,该第二时间段的终止时间点为第四时间点。

可以理解,电子设备在完成播放第二音频的同时,直接开始播放第四音频,并在完成播放第四音频的同时,直接开始继续播放第一音频。

本申请实施例中,上述第四音频是根据以下至少一项确定的:第一音频、第二音频。

在本申请的一些实施例中,第四音频的全部音频内容可以是根据第一音频或第二音频确定的。

在本申请的一些实施例中,第四音频的一部分音频内容可以是根据第一音频确定的,另一部分音频内容可以是根据第二音频确定的。

示例性地,以上述第四音频是根据第二音频确定的为例。电子设备可以先获取第二音频对应的M个第三音频特征,M为正整数;然后再根据M个第三音频特征生成第四音频,或者,再根据M个第三音频特征,从预存的音频中确定第四音频。

需要说明的是,针对电子设备得到第四音频的说明,可以参考上述步骤501至步骤503中的具体描述,本申请实施例在此不再赘述。

在本申请的一些实施例中,在电子设备得到第四音频之后,电子设备还可以对第一音频和第四音频进行平滑过渡处理,以进一步降低将播放的第一音频切换为第四音频时的不连贯感。

需要说明的是,针对平滑过渡处理的说明,可以参考上述实施例中的具体描述,本申请实施例在此不再赘述。

在本申请的一些实施例中,在电子设备播放第四音频的音频内容的过程中,电子设备可以逐渐调小播放第四音频的播放音量。其中,在第四时间点播放第四音频的播放音量,与第一音频的播放音量相匹配。

步骤602、电子设备在第四时间点,从第一播放位置继续播放第一音频。

本申请实施例中,上述第一播放位置位于第二播放位置之前,上述第二播放位置为:第一音频中对应第二时间点的播放位置。

在本申请的一些实施例中,电子设备可以在完成播放第四音频的同时,从第一播放位置继续播放第一音频,以保持播放第一音频和第二音频之间的连贯性。

在本申请的一些实施例中,电子设备可以先确定第二播放位置起的第三预设时长之前的第三播放位置,然后再根据该第三播放位置,从第一音频对应的文本段中确定第二文本段,并将第二文本段的起始播放位置,确定为第一播放位置,从而电子设备可以从第一播放位置继续播放第一音频。

可以理解,由于可能会出现用户已忘记电子设备播放的第一音频,因此,电子设备可以先确定第二播放位置起的第三预设时长之前的第三播放位置,然后再确定该第三播放位置对应的第二文本段,并将第二文本段的起始播放位置,确定为第一播放位置,以及按照第一播放位置继续播放第一音频,以避免用户收听到该第二文本段不完整的情况。

需要说明的是,针对电子设备确定第二文本段的说明,可以参考上述实施例中电子设备确定第一文本段的具体描述,本申请实施例对此不再赘述。针对电子设备根据第二文本段确定第一播放位置的说明,可以参考上述实施例中,电子设备根据第一文本段确定第二时间点的具体描述,本申请实施例在此不再赘述。

如此可知,由于电子设备可以在完成播放第二音频和继续播放第一音频之间的时间段内,播放第四音频作为过渡,因此,可以提高电子设备播放第二音频和第一音频的连贯性;并且,由于电子设备可以从中断播放第一音频时的播放位置之前的第一播放位置,继续播放第一音频,以使得用户可以回忆第一音频,因此,可以提高用户收听第一音频的体验;如此,可以提高用户收听第一音频和第二音频的体验。

本申请实施例提供的音频播放方法,执行主体可以为音频播放装置。本申请实施例中以音频播放装置执行音频播放方法为例,说明本申请实施例提供的音频播放装置的。

图6示出了本申请实施例中涉及的音频播放装置的一种可能的结构示意图。如图6所示,本申请实施例提供的音频播放装置50可以包括:获取模块51、确定模块52以及播放模块53。获取模块51,用于在播放第一音频的过程中,获取第一时间点;该第一时间点为待播放的第二音频的起始播放时间点。播放模块52,用于根据获取模块51获取的第一时间点,从第一音频对应的文本段中确定第一文本段;并根据第一文本段的起始播放时间点,确定第二时间点;该第二时间点位于第一时间点之前。播放模块53,用于在确定模块52确定的第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

本申请实施例提供一种音频播放装置,由于在音频播放装置播放第一音频的过程中,音频播放装置在获取到待播放的第二音频的起始播放时间点(即第一时间点)之后,可以先根据该第一时间点,从第一音频对应的文本段中确定第一文本段,并根据该第一文本段的起始播放时间点,将该第一时间点之前的第二时间点,确定为中断播放第一音频的时间点,然后再在第一时间点开始播放第二音频,而不是直接在该第一时间点中断播放第一音频,并开始播放第二音频,因此,用户可以在收听到该第一文本段的完整文字内容的同时,及时地收听第二音频,而无需用户进行多次操作,如此,可以提高音频播放装置播放音频的效果。

在一种可能的实现方式中,上述播放模块53,还用于在第一时间段内播放第三音频;该第一时间段为:第二时间点和第一时间点之间的时间段。其中,上述第三音频是根据以下至少一项确定的:第一音频、第二音频。

在一种可能的实现方式中,上述第三音频是根据第二音频确定的。上述获取模块51,还用于获取第二音频对应的N个第一音频特征;N为正整数。结合图6,如图7所示,本申请实施例提供的音频播放装置50还可以包括:生成模块54。其中,生成模块54,用于根据获取模块51获取的N个第一音频特征,生成第三音频;或者,上述确定模块52,还用于根据获取模块51获取的N个第一音频特征,从预存的音频中确定第三音频。

在一种可能的实现方式中,上述播放模块53,还用于在完成播放第二音频的情况下,在第二时间段内播放第四音频;该第二时间段为:第三时间点和第四时间点之间的时间段,该第三时间点为:完成播放第二音频的时间点,该第四时间点为:该第三时间点起的预设时长之后的时间点;并在第四时间点,从第一播放位置继续播放第一音频。其中,上述第一播放位置位于第二播放位置之前,上述第二播放位置为:第一音频中对应第二时间点的播放位置;上述第四音频是根据以下至少一项确定的:第一音频、第二音频。

在一种可能的实现方式中,结合图6,如图8所示,本申请实施例提供的音频播放装置50还可以包括:添加模块55。其中,添加模块55,用于在第一音频中添加第一音频标识;该第一音频标识用于指示第二音频,该第一音频标识与第二播放位置关联,该第二播放位置为:第一音频中对应第二时间点的播放位置。上述播放模块53,具体用于根据添加模块55添加的第一音频标识,确定第二音频,并在第一时间点开始播放第二音频。

在一种可能的实现方式中,结合图6,如图9所示,本申请实施例提供的音频播放装置50还可以包括:生成模块56。生成模块56,用于在第一音频的第二播放位置插入第二音频,并将第二音频的起始播放位置调整为第三播放位置,以生成目标音频;该第二播放位置为:第一音频中对应第二时间点的播放位置;该第三播放位置为:第一音频中对应第一时间点的播放位置。上述播放模块53,具体用于播放生成模块56生成的目标音频,以在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

本申请实施例中的音频播放装置可以是电子设备,也可以是电子设备中的部件,例如集成电路或芯片。该电子设备可以是终端,也可以为除终端之外的其他设备。示例性地,电子设备可以为手机、平板电脑、笔记本电脑、掌上电脑、车载电子设备、移动上网装置(mobileinternetdevice,MID)、增强现实(augmentedreality,AR)/虚拟现实(virtualreality,VR)设备、机器人、可穿戴设备、超级移动个人计算机(ultra-mobilepersonalcomputer,UMPC)、上网本或者个人数字助理(personaldigitalassistant,PDA)等,还可以为服务器、网络附属存储器(networkattachedstorage,NAS)、个人计算机(personal computer,PC)、电视机(television,TV)、柜员机或者自助机等,本申请实施例不作具体限定。

本申请实施例中的音频播放装置可以为具有操作系统的装置。该操作系统可以为安卓(Android)操作系统,可以为iOS操作系统,还可以为其他可能的操作系统,本申请实施例不作具体限定。

本申请实施例提供的音频播放装置能够实现图1至图5的方法实施例实现的各个过程,为避免重复,这里不再赘述。

可选地,本申请实施例中,如图10所示,本申请实施例还提供一种电子设备60,包括处理器61和存储器62,存储器62上存储有可在所述处理器61上运行的程序或指令,该程序或指令被处理器61执行时实现上述音频播放方法实施例的各个过程步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。

需要说明的是,本申请实施例中的电子设备包括上述的移动电子设备和非移动电子设备。

图11为实现本申请实施例的一种电子设备的硬件结构示意图。

该电子设备100包括但不限于:射频单元101、网络模块102、音频输出单元103、输入单元104、传感器105、显示单元106、用户输入单元107、接口单元108、存储器109、以及处理器110等部件。

本领域技术人员可以理解,电子设备100还可以包括给各个部件供电的电源(比如电池),电源可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。图11中示出的电子设备结构并不构成对电子设备的限定,电子设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置,在此不再赘述。

其中,处理器110,在播放第一音频的过程中,获取第一时间点;该第一时间点为待播放的第二音频的起始播放时间点;并根据第一时间点,从第一音频对应的文本段中确定第一文本段;根据第一文本段的起始播放时间点,确定第二时间点;该第二时间点位于第一时间点之前。

音频输出单元103,在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

本申请实施例提供一种电子设备,由于在电子设备播放第一音频的过程中,电子设备在获取到待播放的第二音频的起始播放时间点(即第一时间点)之后,可以先根据该第一时间点,从第一音频对应的文本段中确定第一文本段,并根据该第一文本段的起始播放时间点,将该第一时间点之前的第二时间点,确定为中断播放第一音频的时间点,然后再在第一时间点开始播放第二音频,而不是直接在该第一时间点中断播放第一音频,并开始播放第二音频,因此,用户可以在收听到该第一文本段的完整文字内容的同时,及时地收听第二音频,而无需用户进行多次操作,如此,可以提高电子设备播放音频的效果。

在本申请的一些实施例中,音频输出单元103,还用于在第一时间段内播放第三音频;该第一时间段为:第二时间点和第一时间点之间的时间段。

其中,上述第三音频是根据以下至少一项确定的:第一音频、第二音频。

在本申请的一些实施例中,上述第三音频是根据第二音频确定的。

处理器110,还用于获取第二音频对应的N个第一音频特征;N为正整数。并根据N个第一音频特征,生成第三音频;或者,根据N个第一音频特征,从预存的音频中确定第三音频。

在本申请的一些实施例中,音频输出单元103,还用于在完成播放第二音频的情况下,在第二时间段内播放第四音频;该第二时间段为:第三时间点和第四时间点之间的时间段,该第三时间点为:完成播放第二音频的时间点,该第四时间点为:该第三时间点起的预设时长之后的时间点;并在第四时间点,从第一播放位置继续播放第一音频。

其中,上述第一播放位置位于第二播放位置之前,该第二播放位置为:第一音频中对应第二时间点的播放位置;上述第四音频是根据以下至少一项确定的:第一音频、第二音频。

在本申请的一些实施例中,处理器110,还用于在第一音频中添加第一音频标识;该第一音频标识用于指示第二音频,该第一音频标识与第二播放位置关联,该第二播放位置为:第一音频中对应第二时间点的播放位置。

音频输出单元103,具体用于根据第一音频标识,确定第二音频,并在第一时间点开始播放第二音频。

在本申请的一些实施例中,处理器110,还用于在第一音频的第二播放位置插入第二音频,并将第二音频的起始播放位置调整为第三播放位置,以生成目标音频;该第二播放位置为:第一音频中对应第二时间点的播放位置;该第三播放位置为:第一音频中对应第一时间点的播放位置。

音频输出单元103,具体用于播放目标音频,以在第二时间点中断播放第一音频,并在第一时间点开始播放第二音频。

应理解的是,本申请实施例中,输入单元104可以包括图形处理器(graphicsprocessingunit,GPU)1041和麦克风1042,图形处理器1041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。显示单元106可包括显示面板1061,可以采用液晶显示器、有机发光二极管等形式来配置显示面板1061。用户输入单元107包括触控面板1071以及其他输入设备1072中的至少一种。触控面板1071,也称为触摸屏。触控面板1071可包括触摸检测装置和触摸控制器两个部分。其他输入设备1072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆,在此不再赘述。

存储器109可用于存储软件程序以及各种数据。存储器109可主要包括存储程序或指令的第一存储区和存储数据的第二存储区,其中,第一存储区可存储操作系统、至少一个功能所需的应用程序或指令(比如声音播放功能、图像播放功能等)等。此外,存储器109可以包括易失性存储器或非易失性存储器,或者,存储器109可以包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-onlymemory,ROM)、可编程只读存储器(programmableROM,PROM)、可擦除可编程只读存储器(erasablePROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。易失性存储器可以是随机存取存储器(randomaccessmemory,RAM),静态随机存取存储器(staticRAM,SRAM)、动态随机存取存储器(dynamicRAM,DRAM)、同步动态随机存取存储器(synchronousDRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(doubledatarateSDRAM,DDRSDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synchlinkDRAM,SLDRAM)和直接内存总线随机存取存储器(directrambusRAM,DRRAM)。本申请实施例中的存储器109包括但不限于这些和任意其它适合类型的存储器。

处理器110可包括一个或多个处理单元;可选地,处理器110集成应用处理器和调制解调处理器,其中,应用处理器主要处理涉及操作系统、用户界面和应用程序等的操作,调制解调处理器主要处理无线通信信号,如基带处理器。可以理解的是,上述调制解调处理器也可以不集成到处理器110中。

本申请实施例还提供一种可读存储介质,所述可读存储介质上存储有程序或指令,该程序或指令被处理器执行时实现上述音频播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

其中,所述处理器为上述实施例中所述的电子设备中的处理器。所述可读存储介质,包括计算机可读存储介质,如计算机只读存储器ROM、随机存取存储器RAM、磁碟或者光盘等。

本申请实施例另提供了一种芯片,所述芯片包括处理器和通信接口,所述通信接口和所述处理器耦合,所述处理器用于运行程序或指令,实现上述音频播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

应理解,本申请实施例提到的芯片还可以称为系统级芯片、系统芯片、芯片系统或片上系统芯片等。

本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如上述音频播放方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。此外,需要指出的是,本申请实施方式中的方法和装置的范围不限按示出或讨论的顺序来执行功能,还可包括根据所涉及的功能按基本同时的方式或按相反的顺序来执行功能,例如,可以按不同于所描述的次序来执行所描述的方法,并且还可以添加、省去、或组合各种步骤。另外,参照某些示例所描述的特征可在其他示例中被组合。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以计算机软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。

上面结合附图对本申请的实施例进行了描述,但是本申请并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本申请的启示下,在不脱离本申请宗旨和权利要求所保护的范围情况下,还可做出很多形式,均属于本申请的保护之内。

技术分类

06120116308262