即时通讯软件的语音播放方法和系统

文献发布时间：2023-06-19 10:14:56

技术领域

本发明涉及一种语音播放方法和系统，具体涉及一种即时通讯软件的语音播放方法和系统。

背景技术

随着移动互联网技术的迅速发展，用户越来越多地使用即时通讯软件进行交流。即时通讯软件支持语音发送，但是一些人发送的语音过长，从而影响用户获取语音内的信息的效率。比如有的用户在发送多条时长达到或接近60秒的语音，这样的话要理解用户表达的信息，需要把这些语音全部听完，比较耗时。一种解决方案是利用即时通讯软件内部的语音转文字技术，从而把音频转化为文字，提高浏览速度。但这种方案的缺点也很明显，主要是音频转文字的时候，会有一些信息的丢失和错位。

现有技术中还存在一些播放软件，这些播放软件能够把视频播放速度提高。比如提高为原来的1.25倍、1.5倍等。通过提高播放速度，能够使得用户快速的了解音频内的信息，如图1所示。然而，这种播放软件只能播放固定的倍速，不能根据语音时长进行自适应调节，用户不能在短时间内获取较多的信息，用户体验不佳。

发明内容

本发明一方面提供一种即时通讯软件的语音播放方法，对于即时通讯软件内时间比较长的语音，能够以与语音时长相匹配的倍速进行播放，加快播放速度，从而使得用户能够短时间内获取较多的信息。本发明另一方面还提供一种即时通讯软件的语音播放系统。

本发明采用的技术方案为：

本发明一方面提供一种即时通讯软件的语音播放方法，包括以下步骤：

S101，获取即时通讯软件聊天内的未播放的语音数据X，所述语音数据X包括语音时长Z和对应的用户ID；

S102，如果获取的语音时长Z大于预设的时间阈值Z0，则以预设的倍速Q播放对应的语音数据，Q＞1，基于所述语音时长确定。

可选地，进一步地包括：

S201，按顺序依次获取即时通讯软件聊天内的未播放的语音数据；

S202，如果获取的某条语音数据的语音时长大于所述预设的时间阈值，则以预设的倍速Q播放该语音数据对应的语音数据。

可选地，进一步包括：

S301，获取即时通讯软件聊天内的第一个未播放的语音数据；

S302，获取即时通讯软件聊天内的下一个未播放的语音数据；

S303，如果步骤302获取的语音数据对应的用户ID与之前获取的语音数据对应的用户ID相同，则执行S304；

S304，重复执行步骤S302和S304，直到获取的语音数据与之前获取的语音数据对应的用户ID不一致；执行S305；

S305，将经过步骤S301至S303获取的语音时长进行累加，得到总语音时长；执行S306；

S306，如果得到的总语音时长Z大于所述预设的时间阈值Z0，则以预设的倍速Q播放经过步骤301至S304获取的具有相同用户ID的语音数据，例如，按顺序依次播放语音数据X1，X2，…，Xn。

可选地，所述预设的倍速

可选地，f(Q

可选地，Z0＝max(预设阈值，k*即时通讯软件允许的单条最大语音时长)，k为小于的系数。

可选地，Q

本发明另一方面提供一种即时通讯软件的语音播放系统，包括：处理器和存储介质，所述存储介质有存储有计算机程序，处理器执行计算机程序，当获取语音播放指令时，实现前述的方法。

本发明实施例提供的即时通讯软件的语音播放方法和系统，对应未播放的语音数据，使用一个时间域值Z0，对时间较长的语音进行倍速播放，能够加快播放速度，同时尽量的减少额外的处理。

附图说明

图1为现有的播放软件示意图；

图2为本发明一实施例提供的即时通讯软件的语音播放方法的流程示意图；

图3为本发明另一实施例提供的即时通讯软件的语音播放方法的流程示意图；

图4为本发明另一实施例提供的即时通讯软件的语音播放方法的流程示意图；

图5为示出一组具有相同用户ID但语音时长不同的语音数据；

图6为本发明另一实施例提供的即时通讯软件的语音播放方法的流程示意图；

图7示出一组在不同时间发送的语音数据。

具体实施方式

为使本发明要解决的技术问题、技术方案和优点更加清楚，下面将结合附图及具体实施例进行详细描述。

在本发明的说明书和权利要求书及上述附图中的描述的一些流程中，包含了按照特定顺序出现的多个操作，但是应该清楚了解，这些操作可以不按照其在本文中出现的顺序来执行或并行执行，操作的序号如101、102等，仅仅是用于区分开各个不同的操作，序号本身不代表任何的执行顺序。另外，这些流程可以包括更多或更少的操作，并且这些操作可以按顺序执行或并行执行。

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

图2是本发明一个实施例提供的即时通讯软件的语音播放方法。如图2所示，本发明实施例提供的即时通讯软件的语音播放方法，包括以下步骤：

S101，获取即时通讯软件聊天内的未播放的语音数据X，所述语音数据X包括语音时长Z和对应的用户ID。

S102，如果获取的语音时长Z大于预设的时间阈值Z0，则以预设的倍速Q播放对应的语音数据，Q＞1，基于所述获取的语音时长确定。

显然，在实际中，即时通讯软件里面的聊天，发送语音的时长是可以变化的，倍速播放需要对音频进行额外的处理。如果语音的时长比较短，那么做倍速播放，也不会节约太多的时间。如果语音时长比较长，那么倍速播放能够节约较多的时间。因此本发明实施例使用一个时间域值Z0，对时间较长的语音进行倍速播放，能够加快播放速度，同时尽量的减少额外的处理。

进一步地，在本发明实施例中，预设的时间阈值Z0可为例如10～30秒。优选地，Z0＝max(预设阈值，k*即时通讯软件允许的单条最大语音时长)，k为小于的系数，即k＜1，例如，k＝0.5。该预设阈值可为10～30秒。

进一步地，在本发明一实施例中，预设的倍速Q可等于1.25或者1.5。在另一实施例中，预设的倍速Q可位于预设的最小倍速Q

进一步地，所述预设的倍速Q可通过下式(1)确定：

其中，f(Q

在一个实施例中，f(Q

使用以上实施例的原因是，一般情况下，音频倍速播放不会超过2倍，也不会低于1.1倍，否则彻底听不清楚或者没有加速意义。基于此，补偿函数f(Q

在另一个实施例中，

此外，Q

图3是本发明另一个实施例提供的即时通讯软件的语音播放方法。

如图3所示，在一个实施例中，优选地，上述步骤S101包括：

S201，按顺序依次获取即时通讯软件聊天内的未播放的语音数据。

优选地，上述步骤S102包括：

S202，如果获取的某条语音数据的语音时长大于所述预设的时间阈值，则以预设的倍速Q播放该语音数据对应的语音数据。

在该实施例中，可以按照顺序逐条获取未播放的语音数据，只有在某条语音数据的语音时长Z大于预设的时间阈值Z0时，则以预设的倍速Q播放该语音数据对应的语音数据，能够加快播放速度，同时尽量的减少额外的处理。该实施例中的预设的时间阈值Z0和预设的倍速Q与前述实施例定义一致，在此，为避免赘述，省略对它们的详细介绍。

图4是本发明另一个实施例提供的即时通讯软件的语音播放方法。

如图4所示，在一个实施例中，优选地，上述步骤S101和S102可进一步地包括：

S301，获取即时通讯软件聊天内的第一个未播放的语音数据；

S302，获取即时通讯软件聊天内的下一个未播放的语音数据；

S303，如果步骤302获取的语音数据对应的用户ID与之前获取的语音数据对应的用户ID相同，即后一步骤获取的语音数据对应的用户ID与前一步骤获取的语音数据对应的用户ID相同，则执行S304；

S304，重复执行步骤S302和S304，直到获取的语音数据与之前获取的语音数据对应的用户ID不一致；执行S305；

S305，将获取的具有相同用户ID的语音数据的语音时长进行累加，得到总语音时长，例如，共获取n个用户ID相同的语音数据X1，X2，…，Xn，对应的语音时长为Z1，Z2，…，Zn，则总语音时长Z＝Z1+Z2+…+Zn；执行S306；

S306，如果得到的总语音时长Z大于所述预设的时间阈值Z0，则以预设的倍速Q播放获取的具有相同用户ID的语音数据，例如，按顺序依次播放语音数据X1，X2，…，Xn。如果得到的总语音时长Z不大于预设的时间阈值Z0，则不进行倍速播放。

在该实施例中，以未播放的一组语音数据为基础，能够有效区分短语音和长语音的情况。短语音不需要倍速，长语音需要倍速。以Z0为30秒为例，图5中的19秒和17秒两段音频，如果不使用S302至S304，是不倍速播放的，使用S302至S304是倍速播放的。显然这4段话是同时说的，如果仅简单的使用时间预值Z0进行判断，则会出现语速上的变化，从而影响用户体验。这种连续的时间不同的语音数据是因为即时通讯软件聊天记录中的用户使用习惯决定的，所以要给予充分考虑和尊重。该实施例中的预设的时间阈值Z0和预设的倍速Q与前述实施例定义一致，在此，为避免赘述，省略对它们的详细介绍。

图6是本发明另一个实施例提供的即时通讯软件的语音播放方法。

如图6所示，在一个实施例中，优选地，上述步骤S101和S102可进一步地包括：

S401，获取即时通讯软件聊天内的第一个未播放的语音数据，所述语音数据包括语音时长和对应的用户ID；

S402，获取即时通讯软件聊天内的下一个未播放的语音数据；

S403，如果步骤S402获取的语音数据对应的用户ID与之前获取的语音数据对应的用户ID相同，并且获取的语音数据与之前获取的语音数据之间的时间间隔低于预设间隔阈值P，则执行S404；如果不同，则执行S405；

即，后一步骤获取的语音数据对应的用户ID与前一步骤获取的语音数据对应的用户ID相同，并且后一步骤获取的语音数据与前一步骤获取的语音数据之间的时间间隔Ts2-Te1低于预设间隔阈值P，Ts2为后一步骤获取的语音数据的开始时间，Ts1为前一步骤获取的语音数据的结束时间，则执行S404；

S404，重复执行步骤S402和S403，直到获取的语音数据与之前获取的语音数据对应的用户ID不一致或者获取的语音数据与之前获取的语音数据之间的时间间隔大于所述预设间隔阈值；执行S405；

S405，将获取的具有相同用户ID的语音数据的语音时长进行累加，得到总语音时长Z，例如，共获取n个用户ID相同的语音数据X1，X2，…，Xn，对应的语音时长为Z1，Z2，…，Zn，则总语音时长Z＝Z1+Z2+…+Zn；执行步骤S406；

S406，如果得到的总语音时长Z大于预设的时间阈值Z0，则以预设的倍速Q播放获取的具有相同用户ID的语音数据，例如，按顺序依次播放语音数据X1，X2，…，Xn Q＞1，基于所述总语音时长Z确定。如果得到的总语音时长Z不大于预设的时间阈值Z0，则不进行倍速播放。

在该实施例中，所述预设间隔阈值P可例如为3～5秒。此外，该实施例中的预设的时间阈值Z0和预设的倍速Q与前述实施例定义一致，在此，为避免赘述，省略对它们的详细介绍。

该实施例中，对于一组未播放的语音数据，只有对满足属于相同用户ID的语音数据并且相邻两个语音数据之间的时间间隔不超过预设间隔阈值的语音数据的语音时长进行叠加，在叠加后的语音时长大于预设的时间阈值时，进行倍速播放，例如，如图7所示，位于右边上端的时间为11秒的语音数据和时间为4秒的语音数据的语音时长可以叠加进行连续倍速播放，而位于左边的时间为11秒和5秒的语音数据不能进行连续播放，如此能够提高播放效率和信息提取的准确性。

本发明实施例还提供了一种即时通讯软件的语音播放系统，包括：处理器和存储介质，所述存储介质有存储有计算机程序，处理器执行计算机程序，当获取语音播放指令时，实现上述即时通讯软件的语音播放方法的步骤。本发明实施例提供的即时通讯软件的语音播放系统可设置在移动终端上。

具体地，上述存储器和处理器能够为通用的存储器和处理器，这里不做具体限定，当处理器运行存储器存储的计算机程序时，能够执行上述即时通讯软件的语音播放方法，从而解决相关技术中对无法自适应对语音进行倍速播放的问题。

以上所述实施例，仅为本发明的具体实施方式，用以说明本发明的技术方案，而非对其限制，本发明的保护范围并不局限于此，尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：王中龙;刘建;史琳;王安洋;李鲁燕;耿建;
专利申请人：国网山东省电力公司泰安供电公司;国家电网有限公司;