导航：首页> 计算；推算；计数>音频播放方法和音频播放装置

音频播放方法和音频播放装置

文献发布时间：2023-06-19 11:39:06

技术领域

本公开涉及音频播放管理，特别涉及一种音频播放方法和音频播放装置。

背景技术

随着人工智能的普及，设备处理的内容类型越来越多，同一设备播放多种音频的情况也越来越普遍。

例如，具有扬声器的同一个设备可能处于音乐播放、新闻播报、讲笑话、对话(TTS)、闹钟、倒计时等业务场景，所播放的内容数据分别是音乐、新闻、笑话、对话语音、闹铃声、提示音等。

这样，设备端应该支持多种音频播放和多种业务场景，相应地，需要具有不同的端侧处理能力。

不同业务场景下的音频内容有可能同时进入播放状态，或者说，在一个音频内容播放过程中，有可能收到另一个音频内容。需要对这些音频内容的播放进行控制。

在传统的语音切换管理系统中，针对用户选择音频输出的问题，常见的处理方法主要是强制打断当前播放的音频内容。

这种切换处理方法的缺点主要在于：无法适用于复杂音频通路的选择性输出；无优先级选择逻辑；在恢复逻辑方面无合理判定，用户体验较差。

因此，仍然需要一种能够合理控制多种类型的音频内容的方法。

发明内容

本公开要解决的一个技术问题是提供一种音频播放方案，其能够在存在多种类型的音频内容的情况下，控制音频播放，实现合理高效切换。

根据本公开的第一个方面，提供了一种音频播放方法，包括：播放第一音频数据；接收待播放的第二音频数据；根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略；以及根据控制策略，控制第一音频数据和第二音频数据的播放。

可选地，为音频数据的多个类型分别设置了优先级，控制策略包括：在第二音频数据的优先级高于第一音频数据的优先级的情况下，插播第二音频数据。

可选地，根据第一音频数据的类型和/或第二音频数据的类型，从下述至少一项中确定插播第二音频数据的控制策略：结束第一音频数据的播放；暂停第一音频数据的播放，并在第二音频数据播放结束之后恢复第一音频数据的播放；继续播放第一音频数据，同时插播第二音频数据，第二音频数据的播放音量高于第一音频数据的播放音量；将第二音频数据插入播放队列中优先级低于第二音频数据的音频数据之前。

可选地，根据控制策略控制第一音频数据和第二音频数据的播放的步骤包括：为第一音频数据和第二音频数据分别维护状态，根据控制策略控制第一音频数据和第二音频数据的状态切换。

可选地，状态包括下述至少一项：等待；播放；暂停；缓存不足；停止；结束。

可选地，根据第一音频数据的类型和/或第二音频数据的类型，从下述至少一项中确定状态切换的控制策略：维持第一音频数据处于播放状态，将第二音频数据放入播放队列，使其处于等待状态；将第一音频数据的播放状态切换为暂停，使第二音频数据进入播放状态；将第一音频数据的播放状态切换为结束，使第二音频数据进入播放状态；维持第一音频数据处于播放状态，使第二音频数据进入播放状态，从而同时播放第一音频数据和第二音频数据。

可选地，在第一音频数据为持续兴趣类型时，将第一音频数据的播放状态切换为暂停，使第二音频数据进入播放状态；在第一音频数据为短时兴趣类型时，将第一音频数据的播放状态切换为结束，使第二音频数据进入播放状态。

可选地，持续兴趣类型包括音频内容和/或音视频内容；并且/或者短时兴趣类型包括对话和/或提醒。

可选地，该方法还包括：获取用户针对一种或多种音频播放事件设置的音频播放优先级，其中，根据第一音频数据的类型和/或第二音频数据的类型确定控制策略的步骤包括：根据第一音频数据和第二音频数据所属音频播放事件的音频播放优先级，确定控制策略。

可选地，第二音频数据是响应于用户的请求而接收的。

可选地，分别使用不同的音频通道来实现不同类型的音频数据的播放。

根据本公开的第二个方面，提供了一种音频播放方法，包括：获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；播放与第一音频播放事件对应的第一音频数据；接收与第二音频播放事件对应的待播放的第二音频数据；根据播放控制参数控制第一音频数据和第二音频数据的播放。

根据本公开的第三个方面，提供了一种音频播放方法，包括：获取一个或多个既定时间段的音频播放规划信息，音频播放规划信息用于表征既定时间段内需要执行的音频播放事件；接收音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据；响应于当前时刻到达既定时间段，播放既定时间段的音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据。

可选地，该方法还包括：在当前时刻到达既定时间段之前，播放第一音频数据；以及响应于当前时刻到达既定时间段，停止播放第一音频数据。

根据本公开的第四个方面，提供了一种音频播放方法，包括：获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；根据播放控制参数，向音频播放装置下发符合播放控制参数所表征的播放顺序的第一音频数据和第二音频数据，第一音频数据为与第一音频播放事件对应的音频数据，第二音频数据为与第二音频播放事件对应的音频数据。

根据本公开的第五个方面，提供了一种音频播放方法，包括：播放第一音频数据；接收待播放的第二音频数据；接收服务器下发的根据第一音频数据的类型和/或第二音频数据的类型确定的控制策略；以及根据控制策略，控制第一音频数据和第二音频数据的播放。

根据本公开的第六个方面，提供了一种音频播放方法，包括：向音频播放装置下发第一音频数据；向音频播放装置下发待播放的第二音频数据；根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略；向音频播放装置下发控制策略。

根据本公开的第七个方面，提供了一种音频播放装置，包括：播放装置，用于播放音频数据；接收装置，在播放第一音频数据的同时，接收待播放的第二音频数据；决策装置，用于根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略；以及控制装置，用于根据控制策略，控制第一音频数据和第二音频数据的播放。

根据本公开的第八个方面，提供了一种音频播放装置，包括：获取装置，用于获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；播放装置，用于播放与第一音频播放事件对应的第一音频数据；接收装置，用于接收与第二音频播放事件对应的待播放的第二音频数据；控制装置，用于根据播放控制参数控制第一音频数据和第二音频数据的播放。

根据本公开的第九个方面，提供了一种音频播放装置，包括：获取装置，用于获取一个或多个既定时间段的音频播放规划信息，音频播放规划信息用于表征既定时间段内需要执行的音频播放事件；接收装置，用于接收音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据；播放装置，用于响应于当前时刻到达既定时间段，播放既定时间段的音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据。

根据本公开的第十个方面，提供了一种服务器，包括：获取装置，用于获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；下发装置，用于根据播放控制参数，向音频播放装置下发符合播放控制参数所表征的播放顺序的第一音频数据和第二音频数据，第一音频数据为与第一音频播放事件对应的音频数据，第二音频数据为与第二音频播放事件对应的音频数据。

根据本公开的第十一个方面，提供了一种音频播放装置，包括：播放装置，用于播放第一音频数据；第一接收装置，用于接收待播放的第二音频数据；第二接收装置，用于接收服务器下发的根据第一音频数据的类型和/或第二音频数据的类型确定的控制策略；以及控制装置，用于根据控制策略，控制第一音频数据和第二音频数据的播放。

根据本公开的第十二个方面，提供了一种服务器，包括：下发装置，用于向音频播放装置下发第一音频数据和待播放的第二音频数据；决策装置，用于根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略，其中，下发装置还向音频播放装置下发控制策略。

根据本公开的第十三个方面，提供了一种计算设备，包括：处理器；以及存储器，其上存储有可执行代码，当可执行代码被处理器执行时，使处理器执行如上述第一方面至第六方面中任一方面所述的方法。

根据本公开的第十二个方面，提供了一种非暂时性机器可读存储介质，其上存储有可执行代码，当可执行代码被电子设备的处理器执行时，使处理器执行如上述第一方面至第六方面中任一方面所述的方法。

由此，能够在存在多种类型的音频内容的情况下，控制音频播放，实现合理高效切换。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述，本公开的上述以及其它目的、特征和优势将变得更加明显，其中，在本公开示例性实施方式中，相同的参考标号通常代表相同部件。

图1示出了本公开的音频播放方案的示意图。

图2是本公开的音频播放方法的示意性流程图。

图3是可用于实施本公开的音频播放方案的音频播放装置的示意性框图。

图4是音频数据的状态间切换示意图。

图5示出了音频数据控制策略的多个示例。

图6示出了根据本公开另一实施例的音频播放装置的示意性框图。

图7示出了根据本公开一实施例的服务器的示意性框图。

图8示出了根据本公开另一实施例的音频播放装置的示意性框图。

图9示出了根据本公开另一实施例的服务器的示意性框图。

图10示出了根据本公开另一实施例的音频播放装置的示意性框图。

图11示出了根据本发明一实施例可用于实现上述音频播放方法的计算设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式，然而应该理解，可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本公开更加透彻和完整，并且能够将本公开的范围完整地传达给本领域的技术人员。

图1示出了本公开的音频播放方案的示意图。

用户可以对着麦克风说话。在设备被唤醒之后，对麦克风接收的语音进行处理，然后可以将其发送给服务器。这些语音可以包含一些语音请求，请求执行某个设备控制操作，或播放某个内容，或作出一些反馈如音频反馈等。

服务器对所接收到的语音进行处理，例如文本识别和自然语言理解。根据识别和理解的结果，确定用户的意图。

当用户的意图对应于某种音频数据的播放时，可以向设备下发相应的音频数据，或者指令用户获取相应的音频数据。

图1中示出了由服务器对语音进行文本识别和自然语言理解，并下发相应音频数据的情形。然而应当理解，也可以由设备本身、本地控制设备或其它设备来进行文本识别、自然语言理解、音频数据获取的操作。

服务器下发或来自其它音频来源的音频数据可以分为多个类型。

例如，音频数据可以分类为：对话(T：TTS)、提醒(P：PlayOnce)、音频内容(U：URL)、音视频内容或称为“屏显内容”(S：Screen)。

应当理解，还可以按其它方式来分类，或者也可以包含其它分类。

在一些实施例中，可以分别使用不同的通道来实现不同类型的音频数据的播放。或者，在一些实施例中，也可以基于所使用的通道来对音频数据进行分类。

例如，可以分别使用对话通道、提醒通道、音频通道、音视频通道来实现对话、提醒、音频内容、音视频内容的播放。

对话通道对应于语音输入(Voice Input)和语音输出(Voice Output)的端侧处理能力。响应于用户的语音请求，或者设备在执行语音指令进行播报时，对话通道进入活跃状态。

提醒通道对应于提醒(Alerts)端侧处理能力。提醒包括闹铃等定时提醒以及响应于特定事件发生而发出的提醒。在例如提醒闹铃响起时，提醒通道进入活跃状态。

音频通道对应于音频播放器(Audio Player)端侧处理能力。在例如播放音频(音乐、新闻、有声资源)时，音频通道进入活跃状态。

音视频通道，也可以称为屏显通道，对应于视频播放器(Video Player)、视频通话(IM)等独立应用的端侧处理能力。在例如进行带图像播放时，屏显通道进入活跃状态。

在有多个音频数据需要播放的情况下，可以使用播放队列来进行管理。

可以根据控制策略对播放队列进行播放控制，特别是可以对音频数据在播放队列中的排序进行控制。

可以对各种类型的音频数据分别制定相应的控制策略。该控制策略可以包括针对单个音频数据的控制策略，还可以包括针对多个音频数据的组合的控制策略。

可以是预先制定各种类型的音频数据所对应的控制策略。另外，还可以响应于来自服务器的策略设置指令来设定或修改控制策略。或者，也可以响应于本地用户的策略设置指令来设定或修改控制策略。

于是，可以对各种类型的音频数据执行相应的控制策略，通过喇叭播放相应的音频数据内容。由此，可以实现音频数据内容之间的无缝合理快速切换。

作为示例，可以获取用户针对一种或多种音频播放事件设置的音频播放有玄机，如此可以根据第一音频数据和第二音频数据所属音频播放事件的音频播放优先级，确定控制策略。其中音频播放事件可以包括但不限于对话事件、提醒事件、音频事件、屏显事件，分别对应于上文述及的对话通道、提醒通道、音频通道、屏显通道。

下面，通过描述在播放一个音频数据内容的时候，接收到另一个音频内容时，本公开的控制流程，来描述本公开的音频播放方法。

图2是本公开的音频播放方法的示意性流程图。

图3是可用于实施本公开的音频播放方案的音频播放装置的示意性框图。

如图3所示，音频播放装置300可以包括播放装置310、接收装置320、决策装置330以及控制装置340。

播放装置310用于播放音频数据。接收装置320用于接收音频数据。决策装置330用于确定当前要采用的控制策略。控制装置340用于执行所确定的控制策略。

如图2所示，在步骤S210，例如可以通过播放装置310，播放第一音频数据。

在播放第一音频数据的过程中，例如响应于用户的请求(例如询问或内容播放请求等)，或者响应于预定事件(例如预定需要发出提醒的事件等)，或响应于达到预定的条件(例如提醒事项的预定条件等)，在步骤S220，例如可以通过接收装置320，接收到新的待播放的第二音频数据。

应当理解，这里的“第一”和“第二”仅用于区分表述的目的。

此时，需要确定如何控制正在播放的第一音频数据和期望播放的第二音频数据的控制，以便更好地符合用户的期望，提供更好的用户体验。

于是，在步骤S230，例如可以通过决策装置330，根据第一音频数据的类型和/或第二音频数据的类型，确定当前要采用的控制策略。该控制策略是针对第一音频数据和第二音频数据确定的。其中第一音频数据、第二音频数据的控制策略，可以由用户设置，即可以获取用户针对第一音频数据、第二音频数据设置的控制策略，此时控制策略用于表征第一音频数据、第二音频数据的播放策略。

在确定控制策略之后，在步骤S240，例如可以通过控制装置340，根据该控制策略，控制第一音频数据和第二音频数据的播放。

作为控制策略的一个方面，可以为多个类型的音频数据分别设置优先级。相应地，各通道也具有各自对应的优先级。

如果同一时刻有多个播放通道同时处在活跃状态(如正在播放音乐时闹铃响起)，优先级最高的通道应该在前景(foreground)，其它低优先级通道应该移到背景(background)。

在最高优先级的播放通道播放完毕并退出活跃状态后，下一优先级的播放通道从背景移到前景。

移到背景的播放通道，可以暂停播放，也可以把声音减弱播放，在一些情况下也可以直接结束播放。

作为示例，同时播放的几个通道的优先级可以如下：

对话通道>提醒通道>音频通道<＝＝>屏显通道。

即，对话通道优先级最高，其次为提醒通道。音频通道和屏显通道优先级相当，且低于提醒通道的优先级。

具体说来，在新来的第二音频数据的优先级高于正在播放的第一音频数据的优先级的情况下，可以插播第二音频数据。

根据第一音频数据的类型和/或第二音频数据的类型，插播第二音频数据的操作的控制策略可以各有不同，例如可以有下述多种情况。

在第一音频数据属于短时兴趣类型时，可以结束第一音频数据的播放，而播放第二音频数据。

短时兴趣类型可以是指用户只在当下短时间内感兴趣，当前兴趣期结束后用户不在感兴趣的音频数据。例如，短时兴趣类型可以包括对话和提醒等。

例如，在第一音频数据为闹钟等提醒音频的情况下，当用户注意到该提醒之后，不再需要对其持续关注。

又例如，在用户与设备的对话过程中，第一音频数据为响应于用户问询而回复的音频数据，用户只在当前感兴趣，当用户发出新的指示之后，一般可以认为用户当前对话内容不再感兴趣。

而在第一音频数据属于持续兴趣类型时，则可以暂停第一音频数据的播放，并在第二音频数据播放结束之后恢复第一音频数据的播放。

持续兴趣类型可以是指用户一般对整个音频数据完整内容感兴趣的音频数据，用户对这种音频数据的兴趣一般不会因短时打断而结束。例如持续兴趣类型可以包括音频内容和音视频内容等。

例如，在第一音频数据为音乐时，正在播放音乐，用户与设备对话，询问天气预报，于是接收到关于天气预报的第二音频数据。此时，可以暂停音乐播放，而插播天气预报。在天气预报播报完毕后，可以恢复音乐的播放。

在一些情况下，还可以继续播放第一音频数据，同时插播第二音频数据。换言之，同时叠加播放第一音频数据和第二音频数据。

例如，可以使第二音频数据的播放音量高于第一音频数据的播放音量。例如，可以使第一音频数据的播放音量减弱。

在另外一些情况下，还可以继续播放第一音频数据，换言之不打断、不干扰第一音频数据的播放，而只是将第二音频数据插入播放队列中优先级低于第二音频数据的音频数据之前。

各音频数据的播放控制可以通过状态切换控制来实现。

换言之，可以为各音频数据，例如第一音频数据和第二音频数据，分别维护状态。于是，可以根据控制策略来控制第一音频数据和第二音频数据的状态切换。

状态可以包括等待、播放、暂停、缓存不足、停止、结束等。

状态切换的控制策略根据第一音频数据的类型和/或第二音频数据的类型来确定。

例如，在需要完整播放第一音频数据，而第二音频数据的播放并不非常紧急的情况下，或者，例如第二音频数据的优先级低于第一音频数据的优先级的情况下，可以维持第一音频数据处于播放状态，将第二音频数据放入播放队列，使其处于等待状态。

例如，在第一音频数据为上述持续兴趣类型时，可以将第一音频数据的播放状态切换为暂停，使第二音频数据进入播放状态。例如，当音箱设备正在播放音乐时，用户唤醒音箱，并询问“天气怎么样”。音箱在应答播放天气信息后，需要继续播放音乐。

例如，在第一音频数据为上述短时兴趣类型时，可以将第一音频数据的播放状态切换为结束，使第二音频数据进入播放状态。例如，当音箱设备正在播放天气信息时，用户唤醒音箱，并询问“刘德华是谁”。音箱应答播放刘德华的信息后，就不再继续播放之前的天气信息。又例如，当音箱设备正在播放闹钟时，用户唤醒音箱，并询问“我想听歌”。音箱应答播放音乐后，不再继续播放之前的闹钟。

又例如，在第一音频数据和第二音频数据的播放可以互相不影响的情况下，还可以维持第一音频数据处于播放状态，使第二音频数据进入播放状态，从而同时播放第一音频数据和第二音频数据。

图4是音频数据的状态间切换示意图。

对于处于等待状态的音频流(音频数据)，当接收到播放指令，切换到播放状态，开始播放。

另一方面，播放状态的音频流播放出现任何问题(播放失败)的情况下，切换为停止状态。

对于处于播放状态的音频流，当接收到停止指令，或者接收到清除队列指令CLEAR_ALL时，切换到停止状态。

另一方面，对于处于停止状态的音频流，当接收到播放指令，切换到播放状态，开始播放。

对于处于播放状态的音频流(第一音频数据)，当接收到对话/提醒等类型的第二音频数据，对话/提醒通道进入活跃状态时，第一音频数据临时切换到暂停状态，暂停播放。

另一方面，当插入的第二音频数据播放完成后，暂停状态的第一音频数据切换为播放状态，恢复播放。

对于处于播放状态的音频流，当缓存数据用完，播放开始卡顿时，切换到缓存不足状态。

另一方面，当完成必要的缓存后，停止播放卡顿，切换为播放状态，恢复播放。

对于处于暂停状态的音频流和处于缓存不足状态的音频流，当接收到清除队列指令CLEAR_ALL时，切换到停止状态。

对于处于播放状态的音频流，当音频流播放完成，切换到结束状态，播放结束。

另一方面，对于处于结束状态的音频流，当接收到播放指令，也可以切换为播放状态，重新开始播放。

另一方面，在一些情况下，对于处于播放状态的音频流(第一音频数据)，当接收到对话/提醒等类型的第二音频数据，对话/提醒通道进入活跃状态时，第一音频数据也可以直接切换到结束状态，结束播放。例如，第一音频数据本身也是短时兴趣类型的音频数据的情况下，被打断的第一音频数据不必再恢复播放。

对于在队列中的每个音频流都这样控制处理，即可实现对各种类型的音频数据的有效控制。

下面对音频数据的一些类型和相应的控制策略进行进一步的详细描述。

图5示出了音频数据控制策略的15个示例。

在第1个示例中，播放队列中依次为两个音频内容U1、U2，例如两首音乐。换言之，在播放音频内容U1时，接收到音频内容U2。此时，可以暂停或停止U1的播放，而开始播放U2，即U2打断U1，直接播放U2。

在第2个示例中，播放队列中依次为音频内容U和提醒内容P。音频内容U播放结束后开始播放提醒内容P。即，排队播放U和P。另外，也可以将控制策略设置为在U的播放过程中插播P。可以根据控制策略决定P插播结束后是否恢复U播放。

在第3个示例中，播放队列中依次为音频内容U和对话内容T。音频内容U播放结束后开始播放对话内容T。即，排队播放U和T。另外，也可以将控制策略设置为在U的播放过程中插播T。可以根据控制策略决定T插播结束后是否恢复U。

在第4个示例中，播放队列中依次为提醒内容P和音频内容U。提醒内容P播放结束后开始音频内容U。即，排队播放P和U。

在第5个示例中，播放队列中依次为两个提醒内容P1和P2。可以依次排队播放这两个提醒内容P1和P2。

在第6个示例中，播放队列中依次为提醒内容P和对话内容T。提醒内容P播放结束后播放对话内容T。即，排队播放P和T。

在第7个示例中，播放队列中依次为对话内容T和音频内容U。对话内容T播放结束后播放音频内容U。即，排队播放T和U。

在第8个示例中，播放队列中依次为对话内容T和提醒内容P。对话内容T播放结束后播放提醒内容P。即，排队播放T和P。

在第9个示例中，播放队列中依次为两个对话内容T1和T2。可以依次播放这两个对话内容T1和T2。即，排队播放T1和T2。

在第10个示例中，播放队列中依次为三个音频内容U1、U2和U3，例如三首音乐。换言之，在播放音频内容U1时，接收到音频内容U2。此时，可以暂停或停止U1的播放，而开始播放U2。在播放音频内容U2时，又接收到音频内容U3。此时，可以暂停或停止U2的播放，而开始播放U3。另外，控制策略也可以设置为通过使用队列来依次排队播放U1、U2、U3。

在第11个示例中，播放队列中依次为两个音频内容U1、U2和一个提醒内容P。换言之，在播放音频内容U1时，接收到音频内容U2。此时，可以暂停或停止U1的播放，而开始播放U2。即U2打断U1。在播放音频内容U2时，又接收到提醒内容P。可以在音频内容U2播放结束后播放提醒内容P。另外，也可以将控制策略设置为在U2的播放过程中插播P。可以根据控制策略决定P和U2插播结束后是否恢复U1、U2播放。

在第12个示例中，播放队列中依次为两个音频内容U1、U2和一个对话内容T。换言之，在播放音频内容U1时，接收到音频内容U2。此时，可以暂停或停止U1的播放，而开始播放U2。即U2打断U1。在播放音频内容U2时，又接收到对话内容T。可以在音频内容U2播放结束后播放对话内容T。另外，也可以将控制策略设置为在U2的播放过程中插播T。可以根据控制策略决定T和U2插播结束后是否恢复U1、U2播放。

在第13个示例中，播放队列中依次为音频内容U1、提醒内容P和音频内容U2。可以在音频内容U1播放结束后开始播放提醒内容P，而在提醒内容P播放结束后开始播放音频内容U2。另外，也可以将控制策略设置为在U1的播放过程中插播P，或者在P的播放过程中插播U2。

在第14个示例中，播放队列中依次为音频内容U、提醒内容P1和提醒内容P2。可以在音频内容U播放结束后开始播放提醒内容P1，而在提醒内容P1播放结束后开始播放提醒内容P2。另外，也可以将控制策略设置为在U的播放过程中插播P1，或者在P1的播放过程中插播P2。

在第15个示例中，播放队列中依次为音频内容U、提醒内容P和对话内容T。可以在音频内容U播放结束后开始播放提醒内容P，而在提醒内容P播放结束后开始播放对话内容T。另外，也可以将控制策略设置为在U的播放过程中插播P，或者在P的播放过程中插播T。

至此结合图1至图5就本公开的一种音频播放方案做了详细说明。

上文述及的控制策略也可以由服务器确定。服务器可以是但不限于本地服务器、边缘服务器、云端服务器，本地服务器又可以是但不限于小区服务器、家庭服务器，另外本地服务器还可以是本地具有处理能力的其他终端设备。

由此，本公开还提出了一种适用于音频播放装置执行的音频播放方法，方法包括：播放第一音频数据；接收待播放的第二音频数据；接收服务器下发的根据第一音频数据的类型和/或第二音频数据的类型确定的控制策略；以及根据控制策略，控制第一音频数据和第二音频数据的播放。关于方法涉及的细节可以参见上文相关描述，此处不再赘述。

图6示出了能够执行该音频播放方法的音频播放装置的示意性框图。

参见图6，音频播放装置600包括播放装置610、第一接收装置620、第二接收装置630以及控制装置640。

可以由播放装置610播放第一音频数据。可以由第一接收装置620接收待播放的第二音频数据。可以由第二接收装置630接收服务器下发的根据第一音频数据的类型和/或第二音频数据的类型确定的控制策略。关于控制策略及其确定过程可以参见上文相关描述，此处不再赘述。可以由控制装置640根据控制策略，控制第一音频数据和第二音频数据的播放。

本公开还提出了一种适用于服务器执行的音频播放方法，方法包括：向音频播放装置下发第一音频数据；向音频播放装置下发待播放的第二音频数据；根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略；向音频播放装置下发控制策略。

图7示出了能够执行该音频播放方法的服务器的示意性框图。

参见图7，服务器700包括下发装置710和决策装置720。

可以由下发装置710向音频播放装置下发第一音频数据和待播放的第二音频数据。其中第一音频数据和第二音频数据可以同步下发，也可以不同步下发。例如，第一音频数据可以是服务器根据用户在前的请求而下发的音频数据，音频播放装置在接收到第一音频数据后，播放第一音频数据；第二音频数据可以是服务器根据用户在后的请求而下发的音频数据，也即音频播放装置在播放第一音频数据的过程中可以接收服务器下发的第二音频数据。

可以由决策装置720根据第一音频数据的类型和/或第二音频数据的类型，确定控制策略。关于控制策略的确定过程可以参见上文相关描述，此处不再赘述。

在确定了控制策略后，下发装置710还可以向音频播放装置下发控制策略。其中控制策略和第二音频数据可以由下发装置710一同下发给音频播放装置，也可以不同步下发。

本公开还提出了一种适用于音频播放装置执行的音频播放方法，方法包括：获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；播放与第一音频播放事件对应的第一音频数据；接收与第二音频播放事件对应的待播放的第二音频数据；根据播放控制参数控制第一音频数据和第二音频数据的播放。

图8示出了能够执行该音频播放方法的音频播放装置的示意性框图。下面结合音频播放装置800就该方法的实现过程进行示例性说明。

参见图8，音频播放装置800包括获取装置810、播放装置820、接收装置830以及控制装置840。

可以由获取装置810获取用户设置的播放控制参数。其中，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置。第一音频播放事件不同于第二音频播放事件。作为示例，第一音频播放事件可以包括但不限于新闻播放事件、音视频播放事件，第二音频播放事件可以是指广告播放事件。以第二音频播放事件是指广告播放事件为例，可以由用户自定义内容播放过程中广告播放位置和/或播放时长。例如音频播放装置800在为用户提供内容播放服务的同时，可以为用户提供一个固定时长的需要插播的广告播放事件，用户可以将该固定时长拆分成一个或多个不连续的时间段，每个时间段可以视为一个广告插播位置。如此，服务器还可以根据用户定义的广告播放位置和/激活播放时长，向用户下发相应的广告(即第二音频数据)。

播放装置820用于播放与第一音频播放事件对应的第一音频数据。

接收装置830用于接收(服务器下发的)与第二音频播放事件对应的待播放的第二音频数据。

控制装置840用于根据播放控制参数控制第一音频数据和第二音频数据的播放。也即，控制装置840可以根据播放控制参数所表征的第二音频播放事件的播放时长和/或播放位置，确定在播放第一音频数据的过程中，在何时播放多长时间的第二音频数据。

举例来说，假设用户设置的播放控制参数为在第一音频数据播放中的第m秒播放时长Δt1的广告、第n秒播放时长Δt2的广告，那么可以在播放第一音频数据达到m秒时，插播时长为Δt1的广告，该广告插播结束后继续播放第一音频数据，并在第n秒再次插入播放时长为Δt2的广告。

本公开还提出了一种适用于服务器执行的音频播放方法，方法包括：获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置；根据播放控制参数，向音频播放装置下发符合播放控制参数所表征的播放顺序的第一音频数据和第二音频数据，第一音频数据为与第一音频播放事件对应的音频数据，第二音频数据为与第二音频播放事件对应的音频数据。

图9示出了能够执行该音频播放方法的服务器的示意性框图。下面结合服务器900就该方法的实现过程进行示例性说明。

参见图9，服务器900包括获取装置910和下发装置920。

可以由获取装置910获取用户设置的播放控制参数，播放控制参数用于表征第一音频播放事件播放过程中第二音频播放事件的播放时长和/或播放位置。

可以由下发装置920根据播放控制参数，向音频播放装置下发符合播放控制参数所表征的播放顺序的第一音频数据和第二音频数据，第一音频数据为与第一音频播放事件对应的音频数据，第二音频数据为与第二音频播放事件对应的音频数据。

举例来说，假设用户设置的播放控制参数为在第一音频数据播放中的第m秒播放时长Δt1的广告、第n秒播放时长Δt2的广告，那么下发装置920可以向音频播放装置下发“m秒第一音频数据+Δt1广告+(n-m)秒第一音频数据+Δt2广告+…”的这一符合用户设置的播放控制参数所表征的音频播放顺序的音频数据。

本公开还提出了一种音频播放方法，包括：获取一个或多个既定时间段的音频播放规划信息，音频播放规划信息用于表征既定时间段内需要执行的音频播放事件；接收音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据；响应于当前时刻到达既定时间段，播放既定时间段的音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据。

图10示出了能够执行该音频播放方法的音频播放装置的示意性框图。下面结合音频播放装置1000就该方法的实现过程进行示例性说明。

参见图10，音频播放装置1000包括获取装置1010、接收装置1020以及播放装置1030。

可以由获取装置1010获取一个或多个既定时间段的音频播放规划信息，音频播放规划信息用于表征既定时间段内需要执行的音频播放事件。其中音频播放规划信息可以是由第一用户(如家长)为第二用户(如孩童)制定的学习规划，如4点到4点半之间听课程或其他重要消息。由此，音频播放装置1000可以是第二用户使用的音频播放设备(如智能音箱)，音频播放装置1000可以从第一用户使用的终端设备获取第一用户设置的音频播放规划信息。

可以由接收装置1020接收音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据。接收装置1020可以在既定时间段到来之前获取该时间段要播放的第二音频播放数据。

可以由播放装置1030响应于当前时刻到达既定时间段，播放既定时间段的音频播放规划信息所表征的音频播放事件所对应的第二音频播放数据。其中，在当前时刻到达既定时间段之前，播放装置1030可以播放第一音频数据，响应于当前时刻到达既定时间段，如果当前播放装置1030正在播放第一音频数据，可以停止播放第一音频数据，转而播放第二音频数据。

图11示出了根据本发明一实施例可用于实现上述音频播放方法的计算设备的结构示意图。

参见图11，计算设备1100包括存储器1110和处理器1120。

处理器1120可以是一个多核的处理器，也可以包含多个处理器。在一些实施例中，处理器1120可以包含一个通用的主处理器以及一个或多个特殊的协处理器，例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中，处理器1120可以使用定制的电路实现，例如特定用途集成电路(ASIC，Application Specific Integrated Circuit)或者现场可编程逻辑门阵列(FPGA，Field Programmable Gate Arrays)。

存储器1110可以包括各种类型的存储单元，例如系统内存、只读存储器(ROM)，和永久存储装置。其中，ROM可以存储处理器1120或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器1110可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(DRAM，SRAM，SDRAM，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器1110可以包括可读和/或写的可移除的存储设备，例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM，双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

存储器1110上存储有可执行代码，当可执行代码被处理器1120处理时，可以使处理器1120执行上文述及的音频播放方法。

通过本公开的任务播放队列和优先任务抢占的机制能够解决现有方案中音频强制打断和恢复无合理判定的问题。另外，还可以通过云端管控，强化恢复逻辑及动态调配。

上文中已经参考附图详细描述了根据本发明的音频播放方案。

此外，根据本发明的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本发明的上述方法中限定的上述各步骤的计算机程序代码指令。

或者，本发明还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质)，其上存储有可执行代码(或计算机程序、或计算机指令代码)，当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时，使所述处理器执行根据本发明的上述方法的各个步骤。

本领域技术人员还将明白的是，结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。

附图中的流程图和框图显示了根据本发明的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分，所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如，两个连续的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这依所涉及的功能而定。也要注意的是，框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的系统来实现，或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：黄洽南;
专利申请人：阿里巴巴集团控股有限公司;