音频信号处理、播放方法和系统、电子设备

文献发布时间：2024-04-18 20:01:55

技术领域

本申请涉及信号处理技术领域，具体涉及一种音频信号处理、播放方法和系统、电子设备。

背景技术

音频播放功能是大部分电子设备的重要功能，例如手机等便携式电子设备可以播放音视频，车载播放器等多媒体终端可以播放音乐等等。音频信号处理过程是高质量播放对应音频的重要保障，发明人对日常工作生活使用的手机、智能音箱、车载播放器等电子设备的音频信号处理过程进行研究，发现这些电子设备通常采用微型扬声器，微型扬声器在音频信号处理过程中容易产生信息损失，例如复现音乐信号时容易会损失部分音乐信息，其中包括声场信息；又例如自然声音经过录音再播放的过程也会损失部分空间信息。上述各种情况下的音频信息损失容易导致这类电子设备的音效空间感不好，如人声与伴奏声混在一个较小的空间等等，因此需要通过立体声声场优化算法来调节声场大小，提高声音的空间感、临场感。传统的声场优化方案往往局限在平面上，存在拓宽效果差的问题。

发明内容

鉴于此，本申请提供一种音频信号处理、播放方法和系统、电子设备，以解决传统声场优化方案往往局限在平面上，存在拓宽效果差的技术问题。

本申请第一方面提供一种音频信号处理方法，包括：

提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号；

增强所述第一初始信号的至少一个信号参数，得到第一目标信号；

拓宽所述第二初始信号的声场，得到第二目标信号；

叠加所述第一目标信号和所述第二目标信号，得到待播音频。

可选地，所述提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号包括：根据所述待处理音频对应的至少一个声道信号提取目标音频；获取所述待处理音频的目标程度系数，所述目标程度系数用于描述所述待处理音频中所述目标音频的程度；采用所述目标程度系数对所述目标音频进行加权处理，得到所述第一初始信号；将至少一个声道信号分别减去所述第一初始信号，得到对应声道的第二初始信号。

可选地，所述根据所述待处理音频对应的至少一个声道信号提取目标音频包括：将所述待处理音频对应的各个声道信号相加后，除以声道数，得到初始音频；对所述初始音频进行带通滤波，得到所述目标音频。

可选地，所述获取所述待处理音频的目标程度系数包括：获取所述待处理音频的线谱对系数、声门激励脉冲谱和峰值偏度；将所述线谱对系数、所述声门激励脉冲谱和所述峰值偏度输入预设的程度系数获取模型，得到所述目标程度系数。

可选地，所述程度系数获取模型的获取过程包括：获取多个样本音频，确定各个所述样本音频的线谱对系数、声门激励脉冲谱、峰值偏度和目标程度系数；以各个所述样本音频的线谱对系数、声门激励脉冲谱、峰值偏度为输入，以对应的所述目标程度系数为样本标签训练初始网络模型，得到所述程度系数获取模型。

可选地，所述拓宽所述第二初始信号的声场，得到第二目标信号包括：从各个声道对应的第二初始信号中分别提取共模信号和差模信号；减小所述各个声道对应的共模信号，增大所述各个声道对应的差模信号，得到所述各个声道对应的第二目标信号。

可选地，所述叠加所述第一目标信号和所述第二目标信号，得到待播音频包括：将所述第一目标信号分别叠加至所述各个声道对应的第二目标信号，得到所述各个声道分别对应的待播音频。

可选地，所述待处理音频包括乐器演奏曲；所述第一初始信号包括主旋律信号；所述第二初始信号包括伴奏信号。

可选地，所述待处理音频包括歌曲；所述第一初始信号包括人声信号；所述第二初始信号包括伴奏信号。

本申请还提供一种音频播放方法，包括：

采用上述任一种音频信号处理方法获取待播音频，播放所述待播音频。

本申请还提供一种音频信号处理系统，包括：

提取模块，用于提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号；

增强模块，用于增强所述第一初始信号的至少一个信号参数，得到第一目标信号；

拓宽模块，用于拓宽所述第二初始信号的声场，得到第二目标信号；

叠加模块，用于叠加所述第一目标信号和所述第二目标信号，得到待播音频。

本申请还提供一种音频播放系统，包括：

播放模块，用于上述任一种音频信号处理系统获取待播音频，播放所述待播音频。

本申请还提供一种电子设备，包括处理器和存储介质；所述存储介质上存储有程序代码；所述处理器用于调用所述存储介质存储的程序代码，以执行上述任一种音频信号处理方法。

本申请提供的音频信号处理、播放方法和系统、电子设备，通过提取待处理音频的第一初始信号和衬托第一初始信号的第二初始信号，增强第一初始信号的至少一个信号参数，得到更为厚实的第一目标信号，拓宽第二初始信号的声场，得到声场更宽的第二目标信号，这样第一目标信号和第二目标信号分别处于不同的平面，相互叠加得到的待播音频在声场得到有效拓宽的基础上，具有更强的空间感。

本申请还可以分别针对各个声道信号提取第一初始信号和第二初始信号，能够保证第一初始信号和第二初始信号提取过程中的稳定性，还能分别依据各个声道对应的第二初始信号获取对应的第二目标信号，将第一目标信号分别叠加至各个声道对应的第二目标信号，得到各个声道分别对应的待播音频，以使各个声道内的待播音频中，第一目标信号的强度均得到增强，第二目标信号的声场均得到拓宽，播放各个声道对应的待播音频，将具有更强的空间感，能够有效提高待处理音频的播放效果，有效提升用户的听觉体验。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本申请一实施例的音频信号处理方法流程示意图；

图2是本申请另一实施例的音频信号处理过程示意图；

图3是本申请一实施例的音频信号处理系统结构示意图；

图4是本申请一实施例的电子设备结构示意图。

具体实施方式

发明人对相关声场优化方案进行研究，发现有方案首先将左右声道的音频信号相减再经过中频带带通滤波，获得中频背景声信号；然后将左右声道的音频信号相加再经过低频段低通滤波，获得低频背景声信号；最后将中频背景信号和低频背景声信号经过延时叠在到左右声道。该方案能够在一定程度上拓宽声场，但是由于中低频的背景声混入比例固定，对于人声部分的信号会导致人声出现浴室空灵感，影响听感。

针对上述问题，本申请通过提取待处理音频的第一初始信号和衬托第一初始信号的第二初始信号，增强第一初始信号的至少一个信号参数，得到更为厚实的第一目标信号，拓宽第二初始信号的声场，得到声场更宽的第二目标信号，这样第一目标信号和第二目标信号分别处于不同的平面，相互叠加得到的待播音频在声场得到有效拓宽的基础上，具有更强的空间感。

下面结合附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅是本申请一部分实施例，而非全部实施例。基于本申请中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。在不冲突的情况下，下述各个实施例及其技术特征可以相互组合。

本申请第一方面提供一种音频信号处理方法，参考图1所示，上述音频信号处理方法包括S110至S140。

S110，提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号。

上述待处理音频可以包括手机等小型电子设备需要播放的音频，可以包括歌曲、戏曲、各类乐器演奏曲等供人鉴赏的音频数据。第一初始信号可以包括传达主体信息的信号，如人声或者主体乐器演奏音等等；第二初始信号可以包括衬托上述第一初始信号的其他信号，如伴奏和/或相关背景音等等。

S120，增强所述第一初始信号的至少一个信号参数，得到第一目标信号。

上述步骤可以通过增强第一初始信号的大小、幅值和/或强度等信号参数实现第一初始信号的增强，以提高第一目标信号的厚实度。

S130，拓宽所述第二初始信号的声场，得到第二目标信号。

上述步骤可以通过提取第二初始信号的多个分量，分别处理各部分分量，以拓宽第二初始信号的声场，得到更宽声场的第二目标信号。例如可以提取第二初始信号的共模信号和差模信号，减小共模信号，增大差模信号，以拓宽第二初始信号等等。

S140，叠加所述第一目标信号和所述第二目标信号，得到待播音频。

上述第一目标信号的强度得到增强，第二目标信号的声场得到拓宽，两者分别处于不同的平面，相互叠加得到的待播音频纵深感度大，更具空间感。

上述音频信号处理方法，通过提取待处理音频的第一初始信号和衬托第一初始信号的第二初始信号，增强第一初始信号的至少一个信号参数，得到第一目标信号，拓宽第二初始信号的声场，得到第二目标信号，这样第一目标信号和第二目标信号分别处于不同的平面，相互叠加得到的待播音频在有效拓宽声场的基础上，第一目标信号更为厚实，对应的待播音频更具空间感。

考虑到手机等大多数电子设备通常采用双声道或者更多声道播放音频，在一个实施例中，对应至上述步骤S110，所述提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号包括：

根据所述待处理音频对应的至少一个声道信号提取目标音频；

获取所述待处理音频的目标程度系数，所述目标程度系数用于描述所述待处理音频中所述目标音频的程度；

采用所述目标程度系数对所述目标音频进行加权处理，得到所述第一初始信号；

将至少一个声道信号分别减去所述第一初始信号，得到对应声道的第二初始信号。

上述目标音频为表征第一初始信号的基础音频，包括歌曲中的人声或者乐器演奏曲中的主体乐器演奏音等等；可以通过音频检测等方式从对应的声道信号中提取。上述目标程度系数可以预先设定，如相关工作人员以后待处理音频的特征设定，也可以根据待处理音频的至少一个音频参数计算得到。

可选地，上述采用所述目标程度系数对所述目标音频进行加权处理，得到所述第一初始信号包括：X＝α*X1，其中，α表示目标程度系数，X1表示目标音频，X表示第一初始信号。

本实施例分别针对各个声道信号提取第一初始信号和第二初始信号，能够保证第一初始信号和第二初始信号提取过程中的稳定性。

在一个示例中，可以先对待处理音频进行分帧处理，确定待处理音频包括的各帧音频单元，各帧音频单元具有相同的帧长和/或帧移等参数，以使后续分别针对各帧音频单元进行处理，可以提升各个处理过程中的有序性。例如将待处理音频分割为时序上连续的多帧音频单元；针对各帧音频单元提取第一初始信号和第二初始信号，这样第一初始信号、第二初始信号、后续得到的第一目标信号、第二目标信号和待播音频均包括时序上连续的各帧音频单元，在这一基础上针对各帧音频单元进行增强和/或拓宽处理，使处理过程更为有序，保证音频处理过程中的稳定性。

在一个示例中，所述根据所述待处理音频对应的至少一个声道信号提取目标音频包括：将所述待处理音频对应的各个声道信号相加后，除以声道数，得到初始音频；对所述初始音频进行带通滤波，得到所述目标音频。其中带通滤波对应的滤波参数可以依据目标音频所处的频段特征设定。本示例将待处理音频对应的各个声道信号相加再除以声道数，使得到的初始音频以各个声道信号为依据，有效性高；对初始音频进行带通滤波，能够尽可能保留初始音频中的目标音频，滤除初始音频中的其他分量，以保证所得目标音频的有效性。

可选地，本示例可以依次针对各帧待处理音频对应的各声道信号提取目标音频。若某电子设备的待处理音频包括左声道和右声道，上述目标音频点的获取过程可以包括：将当前帧待处理音频对应的左声道信号和右声道信号相加后除以2，得到初始音频；对初始音频进行带通滤波，得到目标音频。

在一个示例中，所述获取所述待处理音频的目标程度系数包括：获取所述待处理音频的线谱对系数、声门激励脉冲谱和峰值偏度；将所述线谱对系数、所述声门激励脉冲谱和所述峰值偏度输入预设的程度系数获取模型，得到所述目标程度系数。本示例采用程度系数获取模型依据待处理音频的线谱对系数、声门激励脉冲谱和峰值偏度实时获取目标程度系数，能够提高所得到的目标程度系数的准确性，从而提高后续所得第一初始信号的准确性。

具体地，所述程度系数获取模型的获取过程包括：获取多个样本音频，确定各个所述样本音频的线谱对系数、声门激励脉冲谱、峰值偏度和目标程度系数；以各个所述样本音频的线谱对系数、声门激励脉冲谱、峰值偏度为输入，以对应的所述目标程度系数为样本标签训练初始网络模型，得到所述程度系数获取模型，使上述程度系数获取模型能够依据任一音频的线谱对系数、声门激励脉冲谱、峰值偏度快速准确地获得目标程度系数。其中样本音频可以包括手机等小型电子设备播放的各类音频，以使其类型更为全面；也可以包括对应待处理音频所处的一类音频，以使其类型与待处理音频一致，提高后续训练效率，使得到的程度系数获取模型与待处理音频的匹配度更高。

在一个示例中，对应至上述步骤S130，所述拓宽所述第二初始信号的声场，得到第二目标信号包括：从各个声道对应的第二初始信号中分别提取共模信号和差模信号；减小所述各个声道对应的共模信号，增大所述各个声道对应的差模信号，得到所述各个声道对应的第二目标信号，以使各个声道对应的第二目标信号的声场得到有效拓宽。若第二目标信号包括伴奏信号，以左右声道分别对应的伴奏信号对本示例进行说明，若左声道的伴奏信号为XL，右声道对应的伴奏信号为XR，首先可以提取XL和XR的共模信号，剩下的即为差模信号，再减小共模信号，增大差模信号，即可实现各伴奏信号的拓宽。其中共模信号的减小幅度和差模信号的增大幅度分别可以依据对应的拓宽效果设置。

具体地，对应至上述步骤S140，所述叠加所述第一目标信号和所述第二目标信号，得到待播音频包括：将所述第一目标信号分别叠加至所述各个声道对应的第二目标信号，得到所述各个声道分别对应的待播音频，以使各个声道内的待播音频中，第一目标信号的强度均得到增强，第二目标信号的声场均得到拓宽，播放各个声道内的待播音频，具有更强的空间感，能够有效提高对应的听感。

在一个实施例中，上述待处理音频包括各类供人鉴赏的音频数据，以分别针对各类音频数据进行音频信号处理，提高其处理效果，从而提高后续播放效果。

在一个示例中，上述待处理音频包括乐器演奏曲，如钢琴演凑曲或者唢呐演凑曲等等；所述第一初始信号包括主旋律信号，如钢琴演凑曲中的钢琴音或者唢呐演凑曲中的唢呐音等等；所述第二初始信号包括伴奏信号，如乐器演奏曲中的乐队伴奏音等等。本示例能够针对乐器演奏曲进行音频信号处理，以在拓宽乐器演奏曲声场的基础上，增强主旋律信号，使处理后的乐器演奏曲在播放时更加空间感，能够有效提升乐器演奏曲的播放效果。

在另一个示例中，上述待处理音频包括歌曲；第一初始信号包括人声信号；第二初始信号包括伴奏信号。本示例能够针对歌曲进行人声检测，以提取人声信号和伴奏信号，根据人耳的听感需求对人声信号进行增强处理，保证所得第一目标信号中人声信号的厚实度，对伴奏信号进行拓宽处理，以使第二目标信号的声场得到有效拓宽，这样第一目标信号和第二目标信号处于不同的平面，叠加第一目标信号和第二目标信号，得到的待播音频在播放时将具有更强的空间感。

以上音频信号处理方法，通过增强第一初始信号的至少一个信号参数，可以得到更为厚实的第一目标信号，拓宽第二初始信号的声场，可以得到声场更宽的第二目标信号，这样第一目标信号和第二目标信号分别处于不同的平面，相互叠加得到的待播音频在声场得到有效拓宽的基础上，具有更强的空间感；其还可以分别针对各个声道信号提取第一初始信号和第二初始信号，能够保证第一初始信号和第二初始信号提取过程中的稳定性，将第一目标信号分别叠加至各个声道对应的第二目标信号，得到各个声道分别对应的待播音频，这样各个声道内的待播音频中，第一目标信号的强度均得到增强，第二目标信号的声场均得到拓宽，播放各个声道对应的待播音频，将具有更强的空间感，能够有效提高待处理音频的播放效果。

本申请在第二方面提供一种音频播放方法，包括：

采用上述任一实施例所述的音频信号处理方法获取待播音频，播放所述待播音频。

具体地，上述音频播放方法可以采用上述任一实施例所述的音频信号处理方法获取电子设备中各声道分别对应的待播音频，将各待播音频分别返回至对应声道，再播放各声道的待播音频，以实现音频播放，保证播放效果。

在一个示例中，以包括左声道和右声道的电子设备播放歌曲为例对上述音频播放方法进行说明，此时第一初始信号包括人声信号；第二初始信号包括伴奏信号。参考图2所示，电子设备可以首先从左声道输入端(InputL)获取左声道对应的第一待处理音频，从右声道输入端(InputR)获取右声道对应的第二待处理音频，依据第一待处理音频和第二待处理音频提取人声信号和伴奏信号，再分别进行人声加强和伴奏拓宽，分别得到第一目标信号和第二目标信号，叠加第一目标信号和第二目标信号，分别得到左声道对应的第一待播音频和右声道对应的第二待播音频，将第一待播音频返回到左声道输出端(OutputL)，将第二待播音频返回到右声道输出端(OutputR)，以播放左声道和右声道分别对应的待播音频。

上述音频播放方法，采用上述任一实施例所述的音频信号处理方法获取待播音频，能够拓宽待播音频的声场，增强待播音频的空间感，提升待播音频的播放效果。

本申请在第三方面提供一种音频信号处理系统，参考图3所示，包括：

提取模块210，用于提取待处理音频的第一初始信号和衬托所述第一初始信号的第二初始信号；

增强模块220，用于增强所述第一初始信号的至少一个信号参数，得到第一目标信号；

拓宽模块230，用于拓宽所述第二初始信号的声场，得到第二目标信号；

叠加模块240，用于叠加所述第一目标信号和所述第二目标信号，得到待播音频。

关于音频信号处理系统的具体限定可以参见上文中对于音频信号处理方法的限定，在此不再赘述。上述音频信号处理系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的运算模组中，也可以以软件形式存储于计算机设备中的存储器中，以便于计算机设备的运算模组调用执行以上各个模块对应的操作。

本申请在第四方面提供一种音频播放系统，包括：

播放模块，用于采用上述任一实施例所述的音频信号处理系统获取待播音频，播放所述待播音频。

关于音频播放系统的具体限定可以参见上文中对于音频播放方法的限定，在此不再赘述。上述音频播放系统中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的运算模组中，也可以以软件形式存储于计算机设备中的存储器中，以便于计算机设备的运算模组调用执行以上各个模块对应的操作。

本申请在第五方面提供一种电子设备，上述电子设备可以包括手机和/或平板电脑等便携式电子设备，也可以包括智能音响等用于采集音频和/或播放音频的智能终端，还可以包括车载播放器等人们日常工作生活中使用相对频繁的多媒体终端。参考图4所示，该电子设备包括处理器620和存储介质630；所述存储介质630上存储有程序代码；所述处理器620用于调用所述存储介质630存储的程序代码，以执行上述任一实施例提供的音频信号处理方法或者上述任一实施例提供的音频播放方法。

上述电子设备能够有效拓宽待处理音频的声场，增强待处理音频的空间感，提升对应的播放效果，具有较高的播放性能。

尽管已经相对于一个或多个实现方式示出并描述了本申请，但是本领域技术人员基于对本说明书和附图的阅读和理解将会想到等价变型和修改。本申请包括所有这样的修改和变型，并且仅由所附权利要求的范围限制。特别地关于由上述组件执行的各种功能，用于描述这样的组件的术语旨在对应于执行所述组件的指定功能(例如其在功能上是等价的)的任意组件(除非另外指示)，即使在结构上与执行本文所示的本说明书的示范性实现方式中的功能的公开结构不等同。

即，以上所述仅为本申请的实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，例如各实施例之间技术特征的相互结合，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

另外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

为了使本领域任何技术人员能够实现和使用本申请，本申请给出了以上描述。在以上描述中，为了解释的目的而列出了各个细节。应当明白的是，本领域普通技术人员可以认识到，在不使用这些特定细节的情况下也可以实现本申请。在其它实施例中，不会对公知的过程进行详细阐述，以避免不必要的细节使本申请的描述变得晦涩。因此，本申请并非旨在限于所示的实施例，而是与符合本申请所公开的原理和特征的最广范围相一致。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：
专利申请人：上海艾为电子技术股份有限公司;