直播中的音频播放方法、装置、设备及存储介质

文献发布时间：2023-06-19 11:35:49

技术领域

本申请涉及计算机技术领域，尤其涉及一种直播中的音频播放方法、装置、设备及存储介质。

背景技术

随着互联网的发展和网络的普及，直播已经是非常流行的娱乐、学习方式。相关技术中，在直播过程中，通常是在直播界面中，通过数字显示在线观众数量，或者是显示观众发送的弹幕信息，通过弹幕信息的数量来体现发送弹幕信息的观众数量，但通过上述方式都是通过图像显示的方式来体现观众数量，存在浪费图像显示资源的问题，并且对观众数量的感知较弱。

发明内容

本申请实施例提供一种直播中的音频播放方法、装置及计算机可读存储介质，能够节省图像显示资源，并增强对执行目标互动操作的对象的数量信息的感知。

本申请实施例的技术方案是这样实现的：

本申请实施例提供一种直播中的音频播放方法，包括：

通过直播界面播放目标直播间的直播内容；

在播放所述直播内容的过程中，获取所述目标直播间内执行目标互动操作的对象的数量信息；

采用与所述对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

本申请实施例提供一种直播中的音频播放装置，包括：

第一播放模块，用于通过直播界面播放目标直播间的直播内容；

获取模块，用于在播放所述直播内容的过程中，获取所述目标直播间内执行目标互动操作的对象的数量信息；

第二播放模块，用于采用与所述对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

上述方案中，所述第二播放模块，还用于获取对应不同场景的多个音效；

根据所述对象的数量信息，确定与所述数量信息相适配的目标场景；

采用所述目标场景对应的音效，对所述直播内容中的音频数据进行处理，得到携带有所述目标场景的场景信息的音频数据；

播放携带有所述目标场景的场景信息的音频数据。

上述方案中，所述第二播放模块，还用于获取所述目标互动操作对应的音频素材；

采用与所述对象的数量信息相适配的音效，对所述目标互动操作对应的音频素材进行处理；

将处理得到的音频素材与所述直播内容中的音频数据进行叠加，并播放叠加有所述音频素材的音频数据。

上述方案中，所述目标互动操作包括观看操作和多个音频互动操作，每个所述音频互动操作对应一个音频素材；

所述第二播放模块，还用于获取各所述音频互动操作对应的音频素材；

分别采用与执行各所述音频互动操作的对象的数量信息相适配的音效，对相应音频素材进行处理，得到多个目标音频素材；

将多个目标音频素材及所述直播内容中的音频数据进行叠加，并

采用与执行所述观看操作的对象的数量信息相适配的音效，播放叠加有所述多个目标音频素材的音频数据。

上述方案中，所述获取模块，还用于在直播界面中，呈现多个音频选择项，每个音频选择项对应至少一个音频互动操作；

响应于针对所述多个音频选择项中目标音频选择项的选取操作，将所述目标音频选择项对应的至少一个音频互动操作作为目标互动操作。

上述方案中，所述第二播放模块，还用于当所述目标互动操作为播放目标音频素材的音频互动操作时，在直播界面中呈现用于触发所述音频互动操作的互动功能项；

响应于针对所述互动功能项的触发操作，播放所述目标音频素材。

上述方案中，所述第二播放模块，还用于获取所述触发操作所对应的操作类型，并确定与所述操作类型相匹配的播放时长；

根据所述播放时长，播放所述目标音频素材。

上述方案中，所述获取模块，还用于获取与当前用户对象存在社交关系的对象信息列表；

基于所述对象信息列表，确定所述目标直播间内执行目标互动操作的对象中，与当前对象存在社交关系的对象的数量信息；

所述第二播放模块，还用于采用与所述与当前对象存在社交关系的对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

上述方案中，所述第二播放模块，还用于当所述目标互动操作为播放目标音频素材的音频互动操作时，接收到用于指示采用目标音量播放所述目标音频素材的播放指示信息；

其中，所述目标音量与对象距离相对应，所述对象距离为，执行所述音频互动操作的对象所处地理位置与当前用户对象所处的地理位置之间的距离；

采用与所述目标音量播放所述目标音频素材。

上述方案中，所述第二播放模块，还用于当存在新加入所述目标直播间的对象时，获取所述对象的身份信息；

采用与所述身份信息相适配的音效，播放入场音频数据。

上述方案中，所述获取模块，还用于当所述数量信息为执行目标互动操作的对象的数量量级时，获取所述目标直播间内执行目标互动操作的对象的第一数量量级；

第二播放模块，还用于当所述数量量级从第一数量量级切换至第二数量量级时，将所述音频数据的音效，由与所述第一数量量级相适配的音效调整至与所述第二数量量级相适配的音效。

上述方案中，所述第二播放模块，还用于获取所述音效对应的目标场景；

在播放所述音频数据的过程中，播放与所述目标场景相适配的动画特效。

上述方案中，所述第二播放模块，还用于根据所述直播内容，确定与所述直播内容相关联的多个候选音效；

基于数量信息与候选音效之间的对应关系，确定与所述对象的数量信息相适配的音效。

上述方案中，所述第二播放模块，还用于当接收到目标直播事件时，获取与所述目标直播事件相关联的音频素材；

采用与所述对象的数量信息相适配的音效，播放与所述目标直播事件相关联的音频素材。

本申请实施例提供一种计算机设备，包括：

存储器，用于存储可执行指令；

处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的直播中的音频播放方法。

本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的直播中的音频播放方法。

本申请实施例具有以下有益效果：

应用上述实施例，通过在播放所述直播内容的过程中，获取所述目标直播间内执行目标互动操作的对象的数量信息；采用与所述对象的数量信息相适配的音效，播放所述直播内容中的音频数据；如此，通过不同的音效，实现了让用户感知到目标直播间内执行目标互动操作的对象的数量信息，相对于采用图像显示的方式体现目标直播间内执行目标互动操作的对象的数量信息，本申请能够节约图像显示资源，并增强对执行目标互动操作的对象的数量信息的感知。

附图说明

图1是相关技术提供的直播界面示意图；

图2是本申请实施例提供的直播中的音频播放系统的一个可选的架构示意图；

图3是本申请实施例提供的计算机设备500的结构示意图；

图4是本申请实施例提供的直播中的音频播放方法的一个可选的流程示意图；

图5是本申请实施例提供的直播界面示意图；

图6是本申请实施例提供的直播界面示意图；

图7是本申请实施例提供的设置界面示意图；

图8是本申请实施例提供的直播界面示意图；

图9是本申请实施例提供的直播中的音频数据播放系统的架构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请作进一步地详细描述，所描述的实施例不应视为对本申请的限制，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本申请保护的范围。

在以下的描述中，涉及到“一些实施例”，其描述了所有可能实施例的子集，但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集，并且可以在不冲突的情况下相互结合。

在以下的描述中，所涉及的术语“第一\第二\第三”仅仅是区别类似的对象，不代表针对对象的特定排序，可以理解地，“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序，以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

对本申请实施例进行进一步详细说明之前，对本申请实施例中涉及的名词和术语进行说明，本申请实施例中涉及的名词和术语适用于如下的解释。

1)直播，在现场随着事件的发生、发展进程同步制作和发布信息，具有双向流通过程的信息网络发布方式。

2)响应于，用于表示所执行的操作所依赖的条件或者状态，当满足所依赖的条件或状态时，所执行的一个或多个操作可以是实时的，也可以具有设定的延迟；在没有特别说明的情况下，所执行的多个操作不存在执行先后顺序的限制。

3)数量量级，用于对不同数量进行等级区分，如十万量级、百万量级等。

4)音效，用于对音频数据进行类似滤镜一般的音效加工。

相关技术中，为营造直播间的氛围感，让用户感知到直播间的其它用户，通常在直播间的直播界面中展示弹幕信息，通过展示的弹幕信息的数量来体现用户数量，如弹幕数量越多，说明直播间参与互动的人数越多。例如，图1是相关技术提供的直播界面示意图，参见图1，为了营造热闹感，直播界面中有三分之一的区域用于展示弹幕信息和商品信息，其中，弹幕信息与商品信息可同时出现，且优先展示商品信息。

申请人在实施本申请的过程中发现，相关技术中，需要缩小弹幕信息的子号，才能够在单位面积内展示更多弹幕信息，以体现出用户数量很多，如此，会导致弹幕信息被用户获取的效率变低，且会导致图像显示资源的浪费。

基于此，本申请实施例提供一种直播中的音频播放方法、装置、设备及计算机可读存储介质，能够丰富虚拟资源包的领取方式和发送方式，提升人机交互效率。

参见图2，图2是本申请实施例提供的直播中的音频播放系统的一个可选的架构示意图，为实现支撑一个示例性应用，终端(示例性示出了终端400-1和终端400-2)通过网络300连接服务器200，网络300可以是广域网或者局域网，又或者是二者的组合。在实际实施时，终端上设置有客户端，如直播客户端，主播可以通过客户端进行直播；观众可以通过客户端观看直播。这里，终端可以位于主播端，也可以位于观众端。

终端，用于通过直播界面播放目标直播间的直播内容。

在实际实施时，主播侧的终端采集直播内容(包括图像数据、音频数据)，通过直播界面播放采集到的直播内容，并将采集到的直播内容发送给服务器；服务器200将接收到的直播内容分发至目标直播间的观众侧终端，观众侧终端通过直播界面播放接收到的目标直播间的直播内容。

服务器200，用于统计目标直播间内执行目标互动操作的对象的数量信息；

终端，用于在播放所述直播内容的过程中，从服务器获取所述目标直播间内执行目标互动操作的对象的数量信息；采用与所述对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

在一些实施例中，服务器200可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN，ContentDelivery Network)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等，但并不局限于此。

参见图3，图3是本申请实施例提供的计算机设备500的结构示意图，在实际应用中，计算机设备500可以为图2中的终端或服务器200，以计算机设备为图2所示的终端为例，对实施本申请实施例的直播中的音频播放方法的计算机设备进行说明。图3所示的计算机设备500包括：至少一个处理器510、存储器550、至少一个网络接口520和用户接口530。计算机设备500中的各个组件通过总线系统540耦合在一起。可理解，总线系统540用于实现这些组件之间的连接通信。总线系统540除包括数据总线之外，还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见，在图3中将各种总线都标为总线系统540。

处理器510可以是一种集成电路芯片，具有信号的处理能力，例如通用处理器、数字信号处理器(DSP，Digital Signal Processor)，或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等，其中，通用处理器可以是微处理器或者任何常规的处理器等。

用户接口530包括使得能够呈现媒体内容的一个或多个输出装置531，包括一个或多个扬声器和/或一个或多个视觉显示屏。用户接口530还包括一个或多个输入装置532，包括有助于用户输入的用户接口部件，比如键盘、鼠标、麦克风、触屏显示屏、摄像头、其他输入按钮和控件。

存储器550可以是可移除的，不可移除的或其组合。示例性的硬件设备包括固态存储器，硬盘驱动器，光盘驱动器等。存储器550可选地包括在物理位置上远离处理器510的一个或多个存储设备。

存储器550包括易失性存储器或非易失性存储器，也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM，Read Only Memory)，易失性存储器可以是随机存取存储器(RAM，Random Access Memory)。本申请实施例描述的存储器550旨在包括任意适合类型的存储器。

在一些实施例中，存储器550能够存储数据以支持各种操作，这些数据的示例包括程序、模块和数据结构或者其子集或超集，下面示例性说明。

操作系统551，包括用于处理各种基本系统服务和执行硬件相关任务的系统程序，例如框架层、核心库层、驱动层等，用于实现各种基础业务以及处理基于硬件的任务；

网络通信模块552，用于经由一个或多个(有线或无线)网络接口520到达其他计算设备，示例性的网络接口520包括：蓝牙、无线相容性认证(WiFi)、和通用串行总线(USB，Universal Serial Bus)等；

呈现模块553，用于经由一个或多个与用户接口530相关联的输出装置531(例如，显示屏、扬声器等)使得能够呈现信息(例如，用于操作外围设备和显示内容和信息的用户接口)；

输入处理模块554，用于对一个或多个来自一个或多个输入装置532之一的一个或多个用户输入或互动进行检测以及翻译所检测的输入或互动。

在一些实施例中，本申请实施例提供的直播中的音频播放装置可以采用软件方式实现，图3示出了存储在存储器550中的直播中的音频播放装置555，其可以是程序和插件等形式的软件，包括以下软件模块：第一播放模块5551、获取模块5552及第二播放模块5553，这些模块是逻辑上的，因此根据所实现的功能可以进行任意的组合或进一步拆分。

将在下文中说明各个模块的功能。

在另一些实施例中，本申请实施例提供的直播中的音频播放装置可以采用硬件方式实现，作为示例，本申请实施例提供的直播中的音频播放装置可以是采用硬件译码处理器形式的处理器，其被编程以执行本申请实施例提供的直播中的音频播放方法，例如，硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC，ApplicationSpecific Integrated Circuit)、DSP、可编程逻辑器件(PLD，Programmable LogicDevice)、复杂可编程逻辑器件(CPLD，Complex Programmable Logic Device)、现场可编程门阵列(FPGA，Field-Programmable Gate Array)或其他电子元件。

将结合本申请实施例提供的终端的示例性应用和实施，说明本申请实施例提供的直播中的音频播放方法。

参见图4，图4是本申请实施例提供的直播中的音频播放方法的一个可选的流程示意图，将结合图4示出的步骤进行说明。

步骤401：终端通过直播界面播放目标直播间的直播内容。

在实际实施时，终端上设置有客户端，如直播客户端，用户可以通过直播客户端进行直播，或者通过直播客户端观看直播。这里的终端可以是位于直播侧的终端，也可以是位于观众侧的终端。

在实际应用中，主播侧的终端采集直播内容，直播内容包括图像数据和音频数据，然后通过直播客户端端，显示直播界面，在直播界面中播放采集到的直播内容，并将采集到的直播内容发送至服务器；服务器将该直播内容分发至该目标直播间的观众侧的终端；观众侧终端接收到该直播内容后，通过直播客户端展示直播界面，并通过直播界面播放目标直播间的直播内容。

步骤402：在播放直播内容的过程中，获取目标直播间内执行目标互动操作的对象的数量信息。

这里，数量信息可以是具体的数量，如数量为98人，也可以是数量量级，也即对具体的数量进行登记划分，如十万量级、百万量级等；目标互动操作可以是系统预先设置的，也可以是由用户手动设置的。

在实际实施时，对于任一终端，用户对象可以通过终端上直播客户端，在目标直播间内执行目标互动操作，当终端接收到该目标互动操作，发送对应该目标互动操作的操作信息至服务器；当服务器根据接收到的操作信息，对执行目标互动操作的对象的数量进行统计，这里，服务器统计的是具体的数量，在将统计结果发送给终端时，可以是发送具体的数量，也可以是将具体的数量转换为数量量级后，再发送给终端。

需要说明的是，这里统计的数量信息可以是人次，也即，若某一对象执行了多次目标互动操作，那么按照具体的次数对数量信息进行更新，如用户A执行了3次，用户B执行了2次，那么统计的数量信息为5；也可以是人数，也即当某一对象执行了多次目标互动操作，数量信息仅增加1，如用户A执行了3次，用户B执行了2次，那么统计的数量信息为2。

在一些实施例中，获取目标直播间内执行目标互动操作的对象的数量信息之前，还可以在直播界面中，呈现多个音频选择项，每个音频选择项对应至少一个音频互动操作；响应于针对多个音频选择项中目标音频选择项的选取操作，将目标音频选择项对应的至少一个音频互动操作作为目标互动操作。

在实际实施时，可以对目标互动操作进行设置，也即终端在直播界面中，呈现多个音频选择项，用户对象可以从多个音频选择项中选择一个或者多个目标音频选择项，然后将目标音频选择项对应的至少一个音频互动操作作为目标互动操作。

例如，图5是本申请实施例提供的直播界面示意图，参见图5，在直播界面中展示多个音频选择项501，如系统音效、铁粉特权等；通过点击音频选择选，便能够选取目标音频选择项，并将目标音频选择项对应的至少一个音频互动操作作为目标互动操作。

这里，对于每个目标音频选择项，可以是将该目标音频选择项对应的全部音频互动操作作为目标互动操作，也可以是将该目标音频选择项对应的部分音频互动操作作为目标互动操作。

在实际实施时，对于每个目标音频选择项，可以独立对该目标音频选择项对应的多个音频互动操作进行选取。例如，图6是本申请实施例提供的直播界面示意图，参见图6，展示多个音频选择项601，当接收到针对多个音频选择项中目标音频选择项的点击操作时，展示对应该目标音频选择项的多个音频互动操作，如当点击系统音效功能项时，展示系统音效功能项对应的多个音频互动操作602，如此，便可以实现对目标音频选择项对应的音频互动操作进行选取。

在一些实施例中，当当前终端为主播侧的终端时，所设置的目标互动操作可以是针对所有播放目标直播间的直播内容的终端的。例如，当当前终端将鼓掌操作和喝彩操作作为目标互动操作，那么，所有终端都将鼓掌操作和喝彩操作作为目标互动操作。

在一些实施例中，终端设置的目标互动操作可以是针对自身的，也即，每个终端都可以独立的为自身设置目标互动操作，如当前终端将鼓掌操作和喝彩操作作为目标互动操作，该目标直播间的其它观众侧的终端可以将欢呼操作作为目标互动操作。

步骤403：采用与对象的数量信息相适配的音效，播放直播内容中的音频数据。

在实际实施时，预先设置数量信息与音效之间的对应关系，在获取到数量信息后，根据数量信息与音效之间的对应关系，获取与该数量信息相适配的音效。这里，可以是多个数量信息对应一个音效，也可以是每个数量信息对应一个音效，或者可以是一个数量信息对应多个音效。

作为示例，当数量信息为数量量级时，如数量信息可以为十量级(即数量为0-99)、百量级(即数量为100-999)、千量级(即数量为1000-9999)，以此类推。例如，当数量信息为十量级时，采用浴室场景特效，播放直播内容中的音频数据；当数量信息为千量级时，采用演播厅场景特效，播放直播内容中的音频数据。

在一些实施例中，可以通过以下方式采用与对象的数量信息相适配的音效，播放直播内容中的音频数据：获取对应不同场景的多个音效；根据对象的数量信息，确定与数量信息相适配的目标场景；采用目标场景对应的音效，对直播内容中的音频数据进行处理，得到携带有目标场景的场景信息的音频数据；播放携带有目标场景的场景信息的音频数据。

这里，场景与音效之间的对应关系可以是一对一，也可以是一对多。即，一个场景可以仅对应一个音效，也可以是一个场景可以对应多个音效。

在实际实施时，不同的场景可以对应不同的面积，对于不同面积的场景所能容纳的人数也是不同，基于此，可以根据各场景对应的面积所能容纳的人数，构建场景与数量信息之间的对应关系，在确定与数量信息相适配的目标场景时，可以通过构建的场景与数量信息之间的对应关系来确定。这里，可以通过声音空间大小模拟，来生成对应不同面积的场景的音效。

在实际应用中，在通过音效对直播内容中的音频数据进行处理时，可以是对直播内容中的所有音频数据进行处理，也可以仅仅是对直播内容中的部分音频数据进行处理，如仅对背景音乐进行处理。

在一些实施例中，可以通过以下方式采用与对象的数量信息相适配的音效，播放直播内容中的音频数据：获取目标互动操作对应的音频素材；采用与对象的数量信息相适配的音效，对目标互动操作对应的音频素材进行处理；将处理得到的音频素材与直播内容中的音频数据进行叠加，并播放叠加有音频素材的音频数据。

这里，仅通过音效对目标互动操作对应的音频素材进行处理，然后将该音频素材叠加至音频数据；目标互动操作的数量可以为一个或者多个。

在实际实施时，在通过与对象的数量信息相适配的音效，对目标互动操作对应的音频素材进行处理后，使目标音频素材中携带有该数量信息，如此，当用户听到播放的目标音频素材时，能够感知到对象的数量信息。

在一些实施例中，当目标互动操作的数量为多个时，目标互动操作与音频素材一一对应；可以分别获取各目标互动操作对应的音频素材，分别采用与执行各目标互动操作的对应的数量信息相适配的音效，对相应的音频素材进行处理，得到多个目标音频素材；将多个目标音频素材与直播内容中的音频数据进行叠加，并播放叠加有音频素材的音频数据。

例如，当目标互动操作包括喝彩操作、鼓掌操作、喝倒彩操作时，分别获取执行喝彩操作、鼓掌操作、喝倒彩操作的对象的数量，如执行喝彩操作的对象为20万，执行鼓掌操作的对象的数量为50万，执行喝倒彩操作的对象的数量为30万；获取20万对应的音效A、50万对应的音效B和30万对应的音效C，那么，通过特效A对喝彩声进行处理，通过音效B对鼓掌声进行处理，通过特效C对喝倒彩声进行处理；再将处理得到的喝彩声、鼓掌声、喝倒彩声叠加至音频数据进行播放。

本申请通过分别通过采用与执行各目标互动操作的对象的数量信息相适配的音效，对相应的音频素材进行处理，使得用户可以根据播放的音频数据，获知执行各目标互动操作的对象的数量信息。

在一些实施例中，当目标互动操作的数量为多个时，可以获取执行所有目标互动操作的对象的总数量信息、以及执行各目标互动操作的对应的数量信息；然后，根据执行各目标互动操作的对应的数量信息，确定各目标互动操作对应的音频素材的播放音量，基于相应的播放音量，对各目标互动操作对应的音频素材进行叠加，得到叠加音频素材；接着，获取与总数量信息相匹配的音效，对叠加音频素材进行处理，并将处理得到的音频素材与直播内容中的音频数据进行叠加，并播放叠加有音频素材的音频数据。

例如，当目标互动操作包括喝彩操作、鼓掌操作、喝倒彩操作时，分别获取执行喝彩操作、鼓掌操作、喝倒彩操作的对象的数量，如执行喝彩操作的对象为20万，执行鼓掌操作的对象的数量为50万，执行喝倒彩操作的对象的数量为30万；那么，总数量为100万。将20％音量的喝彩声、50％音量的鼓掌声和30音量的喝倒彩声进行叠加，得到叠加音频素材；再通过与100万对应的音效，对叠加音频素材进行处理，并将处理得到的音频素材与直播内容中的音频数据进行叠加，并播放叠加有音频素材的音频数据。

如此，既能够体现执行每个目标互动操作的对象的数量信息，还能够体现执行目标互动操作的对象的总数量信息。

在一些实施例中，目标互动操作包括观看操作和多个音频互动操作，每个音频互动操作对应一个音频素材；采用与对象的数量信息相适配的音效，播放直播内容中的音频数据：获取各音频互动操作对应的音频素材；分别采用与执行各音频互动操作的对象的数量信息相适配的音效，对相应音频素材进行处理，得到多个目标音频素材；将多个目标音频素材及直播内容中的音频数据进行叠加，并采用与执行观看操作的对象的数量信息相适配的音效，播放叠加有多个目标音频素材的音频数据。

这里，观看操作指的是观看目标直播间的直播内容的操作；执行观看操作的对象的数量信息，指的是在线观看目标直播间的直播内容的对象的数量信息。

在实际实施时，目标互动操作包括两个类型的互动操作，也即观看操作和多个音频互动操作，其中，观看操作是只要终端通过播放界面播放目标直播间的直播内容，就会触发观看操作；而音频互动操作是用户对象在观看目标直播间的直播内容的过程中，通过播放界面触发的。

作为示例，当音频互动操作包括喝彩操作、鼓掌操作时，分别获取执行喝彩操作、鼓掌操作、喝倒彩操作的对象的数量，如执行喝彩操作的对象为20万，执行鼓掌操作的对象的数量为50万；并执行观看操作的对象的数量，如100万。获取20万对应的音效A、50万对应的音效B、100万对应的音效C，那么，通过特效A对喝彩声进行处理，通过音效B对鼓掌声进行处理，；再将处理得到的喝彩声、鼓掌声及直播内容中的音频数据进行叠加，再通过音效C对叠加有喝彩声和鼓掌声的音频数据进行处理，并在处理完成后，对处理得到的音频数据进行播放。

在一些实施例中，终端还可以当目标互动操作为播放目标音频素材的音频互动操作时，在直播界面中呈现用于触发音频互动操作的互动功能项；响应于针对互动功能项的触发操作，播放目标音频素材。

这里，音频互动操作的互动功能项可以为多个，分别对应不同的音频素材，当接收到针对某一互动功能项的触发操作时，获取该互动功能项对应的目标音频素材，并进行播放。

在一些实施例中，目标音频素材仅在本端播放，也即当用户对象触发互动功能项时，终端播放目标音频素材，并发送互动信息至服务器，以告知服务器该用户对象执行了目标互动操作，以使服务器能够对执行目标互动操作的对象的数量信息进行统计。

在一些实施例中，目标音频素材在所有终端播放，也即当用户对象触发互动功能项时，终端发送目标音频素材的播放指令至服务器，服务器将目标音频素材添加到直播内容的音频数据中，并分发至各个终端，以使各个终端播放添加有目标音频素材的音频数据。

在一些实施例中，响应于针对互动功能项的触发操作，播放目标音频素材，包括：获取触发操作所对应的操作类型，并确定与操作类型相匹配的播放时长；根据播放时长，播放目标音频素材。

这里的操作类型可以按照连续点击操作的次数进行划分，如操作类型可以为单击操作、双击操作等，不同的操作类型对应不同的播放时长，如当音效自身时长为2秒，单击操作对应的播放时长为2秒，双击操作对应的播放时长为4秒，以此类推。

在一些实施例中，终端可以通过以下方式获取目标直播间内执行目标互动操作的对象的数量信息：获取与当前用户对象存在社交关系的对象信息列表；基于对象信息列表，确定目标直播间内执行目标互动操作的对象中，与当前对象存在社交关系的对象的数量信息；终端可以通过以下方式采用与对象的数量信息相适配的音效，播放直播内容中的音频数据：采用与所述与当前对象存在社交关系的对象的数量信息相适配的音效，播放直播内容中的音频数据。

在实际实施时，终端从服务器获取与当前用户对象存在社交关系的对象信息列表，如好友列表，关注列表等，然后从服务器获取目标直播间内执行目标互动操作的对象，根据对象信息列表，从目标互动操作的对象中确定出与当前对象存在社交关系的对象，并进行数量信息统计，得到目标直播间内执行目标互动操作的对象中，与当前对象存在社交关系的对象的数量信息。在得到数量信息后，获取与该数量信息相适配的音效，并采用获取的音效对直播内容中的音频数据进行处理，并播放处理得到的音频数据。

由于用户对象可能仅对与其存在社交关系的对象感兴趣，如此，能够让用户对象感受到与好友一起看直播的感觉。

在一些实施例中，终端可以仅仅将当前用户对象的对象信息发送给服务器，由服务器查找该用户对象的对象信息列表，然后根据该对象信息列表，对目标直播间内执行目标互动操作、且与当前用户对象存在社交关系的对象的数量信息进行统计，并将统计得到的数量信息发送给终端，终端直接基于该数量信息，采用与该数量信息相适配的音效，播放直播内容中的音频数据。

在一些实施例中，终端还可以当目标互动操作为播放目标音频素材的音频互动操作时，接收到用于指示采用目标音量播放目标音频素材的播放指示信息；其中，目标音量与对象距离相对应，对象距离为，执行音频互动操作的对象所处地理位置与当前用户对象所处的地理位置之间的距离；采用与目标音量播放目标音频素材。

在实际实施时，当某一终端接收到目标互动操作时，将目标音频素材的播放指令发送至服务器，服务器分别计算各个终端所处位置和发送该播放指令的终端所处位置之间的距离，根据该距离计算各个终端播放目标音频素材的音量，这里，距离与播放音量成反比，也即距离越远，播放音量越小；在得到各个终端播放目标音频素材的音量后，生成对应各终端的播放指示信息，将播放指示信息发送给相应的终端，以使各终端依据播放指示信息，采用与播放指示信息对应的音量播放目标音频素材。

对于本终端而言，当终端接收到播放指示信息后，对播放指示信息进行解析，以确定目标音量，并判断终端是否缓存由目标音频素材，若有，采用目标音量播放该目标音频素材，若没有，则需要向服务器发送目标音频素材的获取请求，以从服务器获取目标音频素材，并在获取目标音频素材后，采用目标音量播放该目标音频素材。

在一些实施例中，还可以当存在新加入目标直播间的对象时，获取对象的身份信息；采用与身份信息相适配的音效，播放入场音频数据。

在实际实施时，可以在有新的对象进入目标直播间时，通过音频数据来提醒用户对象有信息对象进行目标直播间。这里，对于不同身份信息的对象，采用不同的音效播放入场音频数据，如此，能够通过入场音频数据，区分不同的对象。

这里，身份信息可以是进入直播间的对象与当前用户对象之间的亲密度，如好友进入目标直播间时，采用音效A播放入场音频数据；当陌生人进入目标直播间时，采用音效B播放入场音频数据；身份信息也可以是该对象的用户级别，如会员级别，对于不同的会员级别，采用不同的音效。

在一些实施例中，终端可以通过以下方式获取目标直播间内执行目标互动操作的对象的数量信息：当数量信息为执行目标互动操作的对象的数量量级时，获取目标直播间内执行目标互动操作的对象的第一数量量级；相应的，终端还可以当数量量级从第一数量量级切换至第二数量量级时，将音频数据的音效，由与第一数量量级相适配的音效调整至与第二数量量级相适配的音效。

在实际实施时，当数量信息为数量量级时，采用获取目标直播间内执行目标互动操作的对象的第一数量量级，并采用第一数量量级对应的音效，播放直播内容中的音频数据；并在播放过程中，持续对执行目标互动操作的对象的数量量级进行监测，当数量量级发生变化时，即数量量级从第一数量量级切换至第二数量量级时，对音频数据的音效进行切换。这里，数量量级可以是实时获取的，也可以是周期性获取的。

在一些实施例中，终端还可以获取音效对应的目标场景；在播放音频数据的过程中，播放与目标场景相适配的动画特效。

在实际实施时，当音效为对应场景的音效时，可以获取该音效所对应的目标场景，并从动画特效中查找与该目标场景对应的动画特效。例如，当音效为演播厅场景音效，在直播界面中展示演播厅场景的图像特效。

如此，能够同时从听觉和视觉上，让用户感知到执行目标互动操作的对应的数量信息，进一步增强对执行目标互动操作的对应的数量信息的感知。

这里的动画特效可以是以悬浮形式，展示在直播内容的图像数据之上的，也可以是将动画特效与直播内容的图像数据进行融合。

在一些实施例中，终端可以通过以下方式确定与对象的数量信息相适配的音效：根据直播内容，确定与直播内容相关联的多个候选音效；基于数量信息与各候选音效之间的对应关系，确定与对象的数量信息相适配的音效。

这里，对于不同的直播内容，可以设置不同的候选音效，如当直播内容为唱歌时，候选音效可以为KTV场景音效、演唱会场景音效等；当直播内容为购物时，候选音效可以为街道场景音效、商场场景音效等。

在实际实施时，终端可以根据直播内容中的图像数据和/或音频数据，对直播内容进行识别，以确定直播内容所属类别，然后再根据确定的类别，筛选出与该直播内容相关联的候选音效，这里，可以为每个候选音效设置一个或多个类别标签，然后将确定的类别与各候选音效的标签进行匹配，以得到与直播内容相关联的多个候选音效；进而基于数量信息与各候选音效之间的对应关系，确定与对象的数量信息相适配的音效。

在一些实施例中，终端可以采用与对象的数量信息相适配的音效，播放直播内容中的音频数据，包括：当接收到目标直播事件时，获取与目标直播事件相关联的音频素材；采用与对象的数量信息相适配的音效，播放与目标直播事件相关联的音频素材。

在实际实施时，目标直播事件、及与目标直播事件相关联的音频素材可以是预先设置的，在播放目标直播间的直播内容的过程中，对直播内容进行监测，以判断是否接收到目标直播事件；当检测到目标直播事件时，采用与对象的数量信息相适配的音效，播放与目标直播事件相关联的音频素材。

这里，对于不同类型的直播，可以设置不同的目标直播事件，例如，当直播类型为唱歌类直播时，可以将演唱至高音部分设置为目标直播事件，那么可以在确定主播演唱至高音部分，采用与对象的数量信息相适配的音效，播放喝彩声；当直播类型为游戏类直播时，可以将连续击杀五个敌人设置为目标直播事件，当确定主播连续击杀五个敌人时，采用与对象的数量信息相适配的音效，播放喝彩声。

下面，将说明本申请实施例在一个实际的应用场景中的示例性应用。在实际实施时，可以先在后台管理端预设多个音效，每个音效对应不同的面积，相应的，不同面积对应不同的数量量级，如10人直播间使用100平方室内无回音的音效，以此类推百人千人上万上亿的观众等。

客户端获取直播间观看总人数、音效与数量量级之间的对应关系、接收到的音频互动操作的类型和数量、用户位置信息、好友互动信息。然后，结合获取到的信息，采用与之对应的音效对直播间的音频数据进行处理，并播放处理得到的音频数据。

例如，当前100万人在目标直播间中观看时(观看总人数)，其中50万人执行鼓掌互动操作、30万执行倒喝彩互动操作、20万人无互动操作。根据音效与数量量级之间的对应关系，确定对应100万的音效，如音效B；然后获取各类型的音频互动操作的数量所占的比例，如鼓掌50％、喝彩30％，那么将这些音频互动操作对应的音频素材进行叠加，也即，将50％鼓掌声和30％喝彩声叠加，然后通过音效B对叠加得到的音频素材进行处理，在播放目标直播间的背景音乐的同时，播放处理得到的音频数据。这里，为避免主播和用户能够在不影响主播说话或表演时感受到该音频数据，当检测到主播说话时，可以将音频数据的音量调小，或者将主播说话的音量调大。

在一些实施例中，主播可以在开播前的设置界面，对可以接收到的音频互动操作进行设置，这里，可以是几类音效组合的模式，也可以是单独细分的逐项设置。

例如，图7是本申请实施例提供的设置界面示意图，参见图7，在设置界面中呈现音频互动控件701、多个音频互动选择项702和更多权限控件703，这里，音频互动控件用户开启或关闭音频互动功能，仅在音频互动功能开启时，观众端才能够触发音频互动操作；当音频互动功能开启时，还可以通过音频互动选择项，对可以接收到的音频互动操作的类型进行设置；这里，每个音频互动选择项对应一个或者多个音频互动操作。当接收针对更多权限控件703的触发操作时，呈现更多的音频互动选择项704；这里，还可以进一步对每个音频互动选择项对应的音频互动操作进行设置，也即可以选择接收该音频互动选择项对应的全部音频互动操作，也可以仅选择接收该音频互动选择项对应的部分音频互动操作。如，当点击系统音效功能项时，展示系统音效功能项对应的多个音频互动操作对应的声音素材705，这里的声音素材可以是较为简短的拟声词(音效)，也可以是复杂的词语或句子(语音)。

这里，对于观众端，观众可控制音效时长：假设音效有其自身时长(N)s，单击一次则播放(N)s，连续3次单击则播放(N*3)s，以此类推。例如，图8是本申请实施例提供的直播界面示意图，参见图8，在直播界面中展示音频互动功能项，当用户点击该音频互动功能项801时，播放与该音频互动功能项对应的音频素材，根据用户的点击次数确定所要播放的时长，并在音频互动功能项801所处位置显示剩余时长。

需要说明的是，互动反馈包括但不限于：互动音效、互动动效、手机震动反馈等。

在一些实施例中，观众有主态声源，也即，对于自身触发的音频互动操作对应的音频素材，采用较大的音量进行播放；或者，根据好友亲密度高低，采用与亲密度相对应的音量，播放相应用户触发的音频互动操作对应的音频素材，如对于与当前用户的亲密度较高的用户所触发的音频互动操作对应的音频素材，采用较大的音量进行播放；或者，根据地理位置来控制音频素材的播放音量，如距离当前用户较近的用户所触发的音频互动操作对应的音频素材，采用较大的音量进行播放。

图9是本申请实施例提供的直播中的音频数据播放系统的架构示意图，参见图9，该音频数据播放系统包括客户端、CDN、业务服务器。

在实际实施时，客户端实时收集用户的互动信息、IP地址和好友列表信息；每60秒客户端向CDN更新一次，这里，通过在线时钟触发客户端传输；业务服务器对数据进行逻辑运算，其中，对于主播端，计算各互动类型在总观看人数的比例和互动强度，对于观众端计算各互动类型在总观看人数的比例和相近IP地址互动人数和好友互动人数；根据逻辑运算结果确定各终端对应的场景音效，以采用相应的场景音效输出音频数据。

由于大脑需要约0.25秒来处理视觉信息，但处理听觉信息仅需要0.05秒，且声音更能带来其它形式无法比拟的情感陪伴，应用上述实施例，能够提升对直播间的观看人数的感知，增加直播的热闹感和参与感。

下面继续说明本申请实施例提供的直播中的音频播放装置555的实施为软件模块的示例性结构，在一些实施例中，如图3所示，存储在存储器550的直播中的音频播放装置555中的软件模块可以包括：

第一播放模块5551，用于通过直播界面播放目标直播间的直播内容；

获取模块5552，用于在播放所述直播内容的过程中，获取所述目标直播间内执行目标互动操作的对象的数量信息；

第二播放模块5553，用于采用与所述对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

在一些实施例中，所述第二播放模块，还用于获取对应不同场景的多个音效；

根据所述对象的数量信息，确定与所述数量信息相适配的目标场景；

采用所述目标场景对应的音效，对所述直播内容中的音频数据进行处理，得到携带有所述目标场景的场景信息的音频数据；

播放携带有所述目标场景的场景信息的音频数据。

在一些实施例中，所述第二播放模块，还用于获取所述目标互动操作对应的音频素材；

采用与所述对象的数量信息相适配的音效，对所述目标互动操作对应的音频素材进行处理；

将处理得到的音频素材与所述直播内容中的音频数据进行叠加，并播放叠加有所述音频素材的音频数据。

在一些实施例中，所述目标互动操作包括观看操作和多个音频互动操作，每个所述音频互动操作对应一个音频素材；

所述第二播放模块，还用于获取各所述音频互动操作对应的音频素材；

分别采用与执行各所述音频互动操作的对象的数量信息相适配的音效，对相应音频素材进行处理，得到多个目标音频素材；

将多个目标音频素材及所述直播内容中的音频数据进行叠加，并

采用与执行所述观看操作的对象的数量信息相适配的音效，播放叠加有所述多个目标音频素材的音频数据。

在一些实施例中，所述获取模块，还用于在直播界面中，呈现多个音频选择项，每个音频选择项对应至少一个音频互动操作；

响应于针对所述多个音频选择项中目标音频选择项的选取操作，将所述目标音频选择项对应的至少一个音频互动操作作为目标互动操作。

在一些实施例中，所述第二播放模块，还用于当所述目标互动操作为播放目标音频素材的音频互动操作时，在直播界面中呈现用于触发所述音频互动操作的互动功能项；

响应于针对所述互动功能项的触发操作，播放所述目标音频素材。

在一些实施例中，所述第二播放模块，还用于获取所述触发操作所对应的操作类型，并确定与所述操作类型相匹配的播放时长；

根据所述播放时长，播放所述目标音频素材。

在一些实施例中，所述获取模块，还用于获取与当前用户对象存在社交关系的对象信息列表；

基于所述对象信息列表，确定所述目标直播间内执行目标互动操作的对象中，与当前对象存在社交关系的对象的数量信息；

所述第二播放模块，还用于采用与所述与当前对象存在社交关系的对象的数量信息相适配的音效，播放所述直播内容中的音频数据。

在一些实施例中，所述第二播放模块，还用于当所述目标互动操作为播放目标音频素材的音频互动操作时，接收到用于指示采用目标音量播放所述目标音频素材的播放指示信息；

其中，所述目标音量与对象距离相对应，所述对象距离为，执行所述音频互动操作的对象所处地理位置与当前用户对象所处的地理位置之间的距离；

采用与所述目标音量播放所述目标音频素材。

在一些实施例中，所述第二播放模块，还用于当存在新加入所述目标直播间的对象时，获取所述对象的身份信息；

采用与所述身份信息相适配的音效，播放入场音频数据。

在一些实施例中，所述获取模块，还用于当所述数量信息为执行目标互动操作的对象的数量量级时，获取所述目标直播间内执行目标互动操作的对象的第一数量量级；

在一些实施例中，所述第二播放模块，还用于获取所述音效对应的目标场景；

在播放所述音频数据的过程中，播放与所述目标场景相适配的动画特效。

在一些实施例中，所述第二播放模块，还用于基于数量信息与候选音效之间的对应关系，确定与所述对象的数量信息相适配的音效；

将所述对象的数量信息与各候选音效对应的数量信息进行匹配，得到与所述对象的数量信息相适配的音效。

在一些实施例中，所述第二播放模块，还用于当接收到目标直播事件时，获取与所述目标直播事件相关联的音频素材；

采用与所述对象的数量信息相适配的音效，播放与所述目标直播事件相关联的音频素材。

本申请实施例提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行本申请实施例上述的直播中的音频播放方法。

本申请实施例提供一种存储有可执行指令的计算机可读存储介质，其中存储有可执行指令，当可执行指令被处理器执行时，将引起处理器执行本申请实施例提供的方法，例如，如图4示出的方法。

在一些实施例中，计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEPROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器；也可以是包括上述存储器之一或任意组合的各种设备。

在一些实施例中，可执行指令可以采用程序、软件、软件模块、脚本或代码的形式，按任意形式的编程语言(包括编译或解释语言，或者声明性或过程性语言)来编写，并且其可按任意形式部署，包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。

作为示例，可执行指令可以但不一定对应于文件系统中的文件，可以可被存储在保存其它程序或数据的文件的一部分，例如，存储在超文本标记语言(HTML，Hyper TextMarkup Language)文档中的一个或多个脚本中，存储在专用于所讨论的程序的单个文件中，或者，存储在多个协同文件(例如，存储一个或多个模块、子程序或代码部分的文件)中。

作为示例，可执行指令可被部署为在一个计算设备上执行，或者在位于一个地点的多个计算设备上执行，又或者，在分布在多个地点且通过通信网络互连的多个计算设备上执行。

以上所述，仅为本申请的实施例而已，并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等，均包含在本申请的保护范围之内。

完整全部详细技术资料下载