一种音频信号处理装置、方法及可存储介质

文献发布时间：2023-06-19 16:06:26

技术领域

本申请涉及音频信号处理技术领域，尤其是涉及一种音频信号处理装置、方法及可存储介质。

背景技术

现有的智能设备通常具备与用户进行交互的语音交互功能。在智能设备与用户交互过程中，以用户的语音信号作为目标信号进行采集时，智能设备通过麦克风采集用户的语音信号，用户的语音信号通过麦克风转换成模拟信号后传输至扬声器。扬声器可以将模拟信号转换成音频信号后播放声音，但扬声器播放的声音经过反射会产生回声，而回声会被麦克风再次采集，这会干扰麦克风采集用户的语音。虽然现有的具有语音交互功能的智能设备都配置可用于对模拟信号进行处理的音频信号处理芯片，音频信号处理芯片包括电源产生模块、时钟信号产生模块、模拟信号检测模块、模拟信号处理模块、硬件加速模块、存储模块以及接口模块等，但仍不足以帮助智能设备准确采集用户的语音。

发明内容

针对上述技术问题，本申请提供了一种音频信号处理装置、方法及可存储介质，可以过滤回声，并准确获取到用户的语音。

本申请实施例提供了一种音频信号处理装置，包括拾音器、扬声器以及音频信号处理芯片，所述音频信号处理芯片包括声纹识别模块、比较模块以及存储模块；

所述拾音器，用于获取音频信号并将所述音频信号转换成模拟信号后传输至所述声纹识别模块；

所述声纹识别模块，用于检测所述模拟信号是否包含人声，若是，则将所述模拟信号作为目标模拟信号传输至所述比较模块，否则，删除所述模拟信号；

所述存储模块，用于存储样本信号，所述样本信号为用户语音信号；

所述比较模块，用于比较所述目标模拟信号与存储在所述存储模块中的样本信号是否相同，若相同，则将所述目标模拟信号删除；若不相同，则将所述目标模拟信号作为样本信号传输至所述存储模块进行存储；以及用于当所述存储模块未存储所述样本信号时，将所述目标模拟信号作为样本信号传输至所述存储模块进行存储；

所述比较模块包括多个比较单元，每个所述比较单元均按照预设比较方式将所述目标模拟信号与所述样本信号进行比较；若每个所述比较单元均判定所述模拟信号与所述样本信号不相同，则所述比较模块判定所述目标模拟信号与所述样本信号不相同，否则，所述比较模块判定所述目标模拟信号与所述样本信号相同；

所述扬声器，用于从所述存储模块获取最新存储的样本信号，并将所述最新存储的样本信号转换成对应的音频信号后输出。

可选地，所述多个比较单元中至少包括一个时间比较单元；

所述比较单元按照预设比较方式将所述目标模拟信号与所述样本信号进行比较，包括：

所述时间比较单元将所述目标模拟信号的起始点与所述样本信号的起始点进行比较；

若所述目标模拟信号的起始点与所述样本信号的起始点不同，则所述时间比较单元判定所述目标模拟信号与所述样本信号不同；否则，

所述时间比较单元将所述模拟信号的终止点与所述样本信号的终止点进行比较；

若所述目标模拟信号的终止点与所述样本信号的终止点不同，则所述时间比较单元判定所述目标模拟信号与所述样本信号不同，否则，判定所述目标模拟信号与所述样本信号相同。

可选地，所述多个比较单元中至少包括一个波形比较单元；

所述比较单元按照预设比较方式将所述目标模拟信号与所述样本信号进行比较，包括：

所述波形比较单元将所述目标模拟信号的波形与所述样本信号的波形进行比较；

若所述目标模拟信号的波形与所述样本信号的波形的相似度达到预设阈值，则所述波形比较单元判定所述目标模拟信号与所述样本信号相同，否则，判定所述目标模拟信号与所述样本信号不相同。

可选地，所述音频信号处理芯片还包括调节模块；

所述调节模块，用于当所述时间比较单元判定所述目标模拟信号与所述样本信号相同时，将所述目标模拟信号的振幅与所述样本信号的振幅进行比较；

若所述目标模拟信号的振幅大于所述样本信号的振幅，则减小所述目标模拟信号的振幅；若所述目标模拟信号的振幅小于所述样本信号的振幅，则增加所述目标模拟信号的振幅；

将调节后的目标模拟信号传输至所述波形比较单元。

可选地，所述存储模块包括多个存储单元，每个所述存储单元存储对应的样本信号，每个存储单元按照顺序进行编号，每个所述编号记录于映射表，其中，所述映射表存储于所述存储模块的其中一个存储单元；

所述存储模块将样本信号传输至所述比较模块，包括：

所述存储模块按照所述映射表记录的编号查找对应的存储单元；

所述存储模块从查找到的存储单元获取对应的样本信号，并将对应的样本信号传输至所述比较模块。

可选地，所述存储模块为易失性存储器，每一次断电重启所述音频信号处理芯片后，所述存储模块内的数据均会被清空。

本申请实施例提供了一种音频信号处理方法，用于音频信号处理装置，所述音频信号处理装置包括拾音器、扬声器以及音频信号处理芯片，所述音频信号处理芯片包括声纹识别模块、比较模块以及存储模块，且所述音频信号处理方法包括如下步骤：

所述拾音器获取音频信号并将所述音频信号转换成模拟信号后传输至所述声纹识别模块；

所述声纹识别模块检测所述模拟信号是否包含人声，若是，则将所述模拟信号作为目标模拟信号传输至所述比较模块，否则，删除所述模拟信号；

所述比较模块比较所述目标模拟信号与存储在所述存储模块中的样本信号是否相同，若相同，则将所述目标模拟信号删除；若不相同，则将所述目标模拟信号作为样本信号传输至所述存储模块进行存储；以及用于当所述存储模块未存储所述样本信号时，将所述目标模拟信号作为样本信号传输至所述存储模块进行存储；

其中，所述存储模块用于存储样本信号，所述样本信号为用户语音信号；

所述扬声器从所述存储模块获取最新存储的样本信号，并将所述最新存储的样本信号转换成对应的音频信号后输出。

可选地，所述多个比较单元中至少包括一个时间比较单元；

所述比较单元按照预设比较方式将所述目标模拟信号与所述样本信号进行比较，包括：

所述时间比较单元将所述目标模拟信号的起始点与所述样本信号的起始点进行比较；

若所述目标模拟信号的起始点与所述样本信号的起始点不同，则所述时间比较单元判定所述目标模拟信号与所述样本信号不同；否则，

所述时间比较单元将所述模拟信号的终止点与所述样本信号的终止点进行比较；

可选地，所述多个比较单元中至少包括一个波形比较单元；

所述比较单元按照预设比较方式将所述目标模拟信号与所述样本信号进行比较，包括：

所述波形比较单元将所述目标模拟信号的波形与所述样本信号的波形进行比较；

本申请实施例提供了一种可存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如上任一项所述的音频信号处理方法的步骤。

相比于现有技术，本申请实施例具有如下有益效果：

本申请实施例提供的音频信号处理装置，通过拾音器对拾取的音频信号进行筛选，以获取包含人声的目标模拟信号。存储模块中存储的样本信号为上一次输入的用户语音信号，将存储于存储模块的样本信号与目标模拟信号通过比较模块进行比较，当目标模拟信号与样本信号相同时，说明目标模拟信号为回声，删除目标模拟信号；当目标模拟信号不同于样本信号时，说明目标模拟信号不是回声，将目标模拟信号作为样本信号存储到存储模块，以保证存储模块获取到的样本信号是真实的用户语音信号而不是回声，另外，通过多个比较单元可以实现多重比较，进一步提高比较模块的判断准确率。扬声器可以从存储模块获取最新存储的样本信号，并将转换成对应的音频信号后输出，避免将回声再次通过扬声器播放，从而实现过滤回声，并准确获取到用户的语音。

附图说明

图1是本申请实施例提供的音频处理装置的第一结构示意图；

图2是本申请实施例提供的音频处理装置的第二结构示意图；

图3是本申请实施例提供的比较模块的第一结构示意图；

图4是本申请实施例提供的比较模块的第二结构示意图；

图5是本申请实施例提供的音频处理装置的第三结构示意图；

图6是本申请实施例提供的存储模块的结构示意图；

图7是本申请实施例提供的音频信号处理方法的流程示意图；

其中，1、拾音器；2、音频信号处理芯片；3、扬声器；21、声纹识别模块；22、比较模块；23、存储模块；24、中央处理模块；25、调节模块；220、比较单元；221、时间比较单元；222、波形比较单元；230、存储单元。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

请参阅图1，图1是本申请实施例提供的音频处理装置的第一结构示意图。

本申请提供一种音频信号处理装置包括拾音器1、扬声器3以及音频信号处理芯片2，其中，拾音器1用于获取音频信号并将音频信号转换成模拟信号后传输至声纹识别模块21；扬声器3用于从存储模块23获取最新存储的，并将最新存储的样本信号转换成对应的音频信号后输出。

在一个应用场景中，拾音器1为麦克风，扬声器3为音箱，为了尽量避免扬声器3输出的音频信号被拾音器1获取，拾音器1设置在扬声器3的背面，拾音器1获取音频信号的方向与扬声器3输出音频信号的方向相反。在另一个应用场景中，为了尽量避免扬声器3输出的音频信号被拾音器1拾取，拾音器1设置于近端，扬声器3设置于远端，即拾音器1所在位置远离于扬声器3所在位置。

音频信号处理芯片2包括声纹识别模块21、比较模块22、存储模块23以及中央处理模块24，其中，中央处理模块24与拾音器1、声纹识别模块21、比较模块22、存储模块23以及扬声器3电连接，用于向拾音器1、声纹识别模块21、比较模块22、存储模块23以及扬声器3传输指令，以使拾音器1、声纹识别模块21、比较模块22、存储模块23以及扬声器3处理对应的任务。

在本实施例中，拾音器1将模拟信号传输至声纹识别模块21时，中央处理模块24向声纹识别模拟模块21发出指令以使声纹识别模块21接收该模拟信号并对该模拟信号进行识别；当声纹识别模块21判定模拟信号包含人声时，中央处理模块24发送指令至声纹识别模块21以使声纹识别模块21将目标模拟信号发送给比较模块22，并且中央处理模块24发送指令给存储模块23，以使存储模块23将样本信号传输至比较模块22，以及中央处理模块24发送指令给比较模块22，以使比较模块22接收目标模拟信号，并将目标模拟信号与样本信号进行比较；当比较模块22判定目标模拟信号不同于样本信号时，中央处理模块24发送指令给比较模块22以使比较模块22将目标模拟信号发送给存储模块23作为样本信号进行存储，完成存储后，中央处理模块24调用存储模块23中最新存储的样本至扬声器3；扬声器3将存储模块23中最新存储的模拟信号转换成对应的音频信号后输出。

声纹识别模块21用于判断模拟信号是否包含人声，若是，则将模拟信号作为目标模拟信号传输至比较模块22，否则，删除模拟信号。

在本实施例中，声纹识别模块21利用模型库内完成训练的声纹识别模型识别从拾音器1获取到的模拟信号是否包含人声，若不包含人声，则删除该模拟信号，从而实现自动排除人声以外的音频信号，进而有利于避免噪声干扰。

存储模块23用于存储样本信号，样本信号为用户语音信号。

在一个应用场景中，将样本信号存储到存储模块23的方式为技术人员预先通过其他输入设备将用户语音信号存储到存储模块23；在另一个应用场景中，将样本信号存储到存储模块23的方式为比较模块22将目标模拟信号与样本信号进行比较，且得出目标模拟信号不同于样本信号的判定结果后，将目标模拟信号作为样本信号传输到存储模块23进行存储。

比较模块22用于比较目标模拟信号与存储在存储模块23中的样本信号是否相同，若相同，则将目标模拟信号删除；若不相同，则将目标模拟信号作为样本信号传输至存储模块23进行存储。

在一个应用场景中，虽然目标模拟信号包含人声，但是目标模拟信号也可能是从扬声器3输出音频信号而产生的回声。为了甄别目标模拟信号是来源于用户的语音还是来自于扬声器3输出的音频信号，通过比较模块22将存储于存储模块23的样本信号与目标模拟信号进行比较，当目标模拟信号与样本信号相同时，说明目标模拟信号为回声，删除该目标模拟信号，从而有效去除从扬声器3输出音频信号而产生的回声；当目标模拟信号不同于样本信号时，说明目标模拟信号不是回声，比较模块22将目标模拟信号作为样本信号传输至存储模块23进行存储，如此可以保证存储模块23获取到的目标模拟信号是真实的用户语音信号而不是回声。本实施例通过声纹识别模块21与比较模块22，可有效地获取到用户语音信号，并摒弃除用户语音信号以外的噪声。

可以理解的是，本实施例通过声纹识别模块21与比较模块22对模拟信号进行两重筛选，可以保证存储模块23获取到的模拟信号是真实的用户语音信号而不是回声。扬声器3从存储模块23获取最新存储的样本信号，并将最新存储的样本信号转换成对应的音频信号后输出，避免将回声再次通过扬声器1播放，从而实现过滤回声。在一个优选实施例中，存储模块23为易失性存储器。每一次断电重启音频信号处理芯片2后存储模块23内的数据均会被清空。通过及时清理音频信号处理芯片2的存储模块23的存储空间，可以减轻音频信号处理芯片2的负荷，提高音频信号处理芯片2的资源利用率，增强音频信号处理芯片2的性能。

然而，由于每一次断电重启音频信号处理芯片2后存储模块23内的数据均会被清空，本申请提供一种实施例以解决存储模块23内的数据被清空后如何快速重新利用存储模块23内存储空间的问题。

在本实施例中，比较模块22还用于当存储模块23未存储样本信号时，将目标模拟信号作为样本信号传输至存储模块23进行存储。

在一种应用场景中，首次启动音频信号处理装置时，音频信号处理芯片2的存储模块23清空存储空间。用户第一次通过拾音器1输入用户的语音，拾音器1将用户的语音转换成模拟信号后传输至声纹识别模块21；声纹识别模块21从该模拟信号中识别到人声，并将该模拟信号作为目标模拟信号传输至比较模块22。由于此时存储模块23内没有存储任何样本信号，则该目标模拟信号属于新的样本信号，比较模块22将该目标模拟信号作为样本信号传输至存储模块23存储模块23存储该样本信号。然后，扬声器3从存储模块23获取新存储的目标模拟信号，并将目标模拟信号转换成对应的音频信号后输出。扬声器3输出音频信号所产生的回声再次被拾音器1获取，拾音器1将回声转换成模拟信号后传输至声纹识别模块21；声纹识别模块21仍然能从该模拟信号中识别到人声，并将该模拟信号作为目标模拟信号传输至比较模块22。此时由于存储模块23中已存有样本信号，并且比较模块22将样本信号与该目标模拟信号进行比较判定样本信号与该目标模拟信号相同(因为该目标模拟信号是回声，所以样本信号与该目标模拟信号相同)，比较模块22删除该目标模拟信号。

相比起通过人工重新向存储模块23传输样本信号进行存储的方式，本实施例更快速地通过比较模块22将目标模拟信号作为样本信号传输至存储模块23进行存储，有利于加快将样本信号存入存储模块23的效率。

为了提高比较模块22的甄别能力，本申请提供一个实施例如下：

请参阅图2，图2是本申请实施例提供的音频处理装置的第二结构示意图。

音频信号处理装置包括拾音器1、扬声器3以及音频信号处理芯片2，音频信号处理芯片2包括声纹识别模块21、比较模块22以及存储模块23。

在此基础上，比较模块22包括多个比较单元220；每个比较单元220均按照预设比较方式将目标模拟信号与样本信号进行比较；若每个比较单元220均判定目标模拟信号不同于样本信号，则比较模块22判定目标模拟信号不同于样本信号，否则，比较模块22判定目标模拟信号与样本信号相同。

在本实施例中，比较模块22通过多个比较单元220可以实现模拟信号与样本信号的多重判断，相比起单个比较单元220判断模拟信号与样本信号是否相同所做出的比较结果，多个比较单元220协同判断模拟信号与样本信号是否相同所做出的比较结果的精度更高、准确率更高。

需要说明的是，本申请研究人员发现，干扰音频信号处理装置获取到用户语音信号的常见状况是拾音器1经常获取到音频信号是扬声器3输出的音频信号的回声，并将扬声器3输出的音频信号的回声转换成模拟信号。为了准确将这种模拟信号识别为噪音，本申请提供一个实施例如下：

请参阅图3，图3是本申请实施例提供的比较模块22的第一结构示意图。

多个比较单元220中至少包括一个时间比较单元221。

时间比较单元221将目标模拟信号的起始点与样本信号的起始点进行比较；若目标模拟信号的起始点与样本信号的起始点不同，则时间比较单元221判定目标模拟信号与样本信号不同；否则，时间比较单元221将目标模拟信号的终止点与样本信号的终止点进行比较；若目标模拟信号的终止点与样本信号的终止点不同，则时间比较单元221判定目标模拟信号与样本信号不同，否则时间比较单元221判定目标模拟信号与样本信号相同。

在本实施例中，通过拾音器1转换得到的模拟信号，可能是由用户的语音转换而成的，也可能是扬声器3输出的音频信号所产生的回声。

在一种应用场景中，拾音器1获取到用户的语音，并将用户的语音转换成模拟信号。声纹识别模块21识别该模拟信号，并判定该模拟信号包含人声并作为目标模拟信号传输至比较模块22。随后，比较模块22获取该目标模拟信号以及从存储模块23获取样本信号，将该目标模拟信号与样本信号进行比较。通过比较模块22中的时间比较单元221，将目标模拟信号的起始点与样本信号的起始点进行比较。由于该目标模拟信号是由用户的语音转换而成的，因此该目标模拟信号是当前产生的，与之前的任意样本信号都不相同，该目标模拟信号的起始点和终止点都与样本信号的起始点和终止点不同，因此时间比较单元221很容易判断出目标模拟信号与样本信号的起始点和终止点都不同，从而判定目标模拟信号与样本信号不同。

在另一种应用场景中，拾音器1获取到扬声器3输出的音频信号所产生的回声，并将该回声转换成模拟信号。由于扬声器3也可以还原播放出人声，因此声纹识别模块21也会从该模拟信号识别到人声，并将该模拟信号作为目标模拟信号传输给比较模块22进行进一步的判断。通过比较模块22的时间比较单元221，将该目标模拟信号的起始点与样本信号的起始点进行比较，以及将该目标模拟信号的终止点与样本信号的终止点进行比较。由于该样本信号来源于用户上一次通过拾音器1输入用户的语音，该目标模拟信号是来源于用户第一次通过拾音器1输入用户的语音的回声，即该样本信号和该目标模拟信号来源于相同的音频信号，因此目标模拟信号与样本信号的起始点相同，目标模拟信号与样本信号的终止点也相同，由此时间比较单元221可以判定目标模拟信号与样本信号相同。

可以理解的是，本实施例通过时间比较模块22可以快速而准确地判断样本信号与目标模拟信号是否来源于同一音频信号，由此可以提高比较模块22甄别用户的语音与回声的能力。

需要说明的是，本申请研究人员发现，在某些情况下由用户的语音转换而成的模拟信号的起始点与样本信号的起始点相同，且模拟信号的终止点与样本信号的终止点也相同。为了准确识别用户的语音，本申请提供另一个实施例如下：

请参阅图4，图4是本申请实施例提供的比较模块22的第二结构示意图。

多个比较单元220中至少有一个是波形比较单元222。

波形比较单元222将目标模拟信号的波形与样本信号的波形进行比较；若目标模拟信号的波形与样本信号的波形的相似度达到预设阈值，则波形比较单元222判定目标模拟信号与样本信号相同，否则波形比较单元判定目标模拟信号与样本信号不相同。

可以理解的是，一般情况下扬声器3远离麦克风(拾音器1)，扬声器3输出的音频信号不断反射并传输至麦克风，即回声被麦克风采集。此时麦克风收集到扬声器3输出的音频信号的振幅与扬声器3刚输出的音频信号的振幅相比会出现减弱的情况。根据此原理，本实施例通过比较模块22的波形比较单元222，将由扬声器3输出音频信号转换而成的模拟信号的波形与样本信号的波形进行比较，能够有效识别出模拟信号的波形与样本信号的波形之间的差异。

但是，由于从扬声器3输出音频信号的振幅衰减程度变化很大，因此判断由扬声器3输出音频信号转换而成的模拟信号的波形与样本信号的波形之间的误差也会很大，基于此，在本实施例中，波形比较单元222判断目标模拟信号与样本信号是否相同时，只需要判断目标模拟信号的波形与样本信号的波形的相似度是否达到预设阈值，若是，则判定目标模拟信号与样本信号相同，否则，判定目标模拟信号与样本信号不相同。由此通过波形比较单元222判断目标模拟信号的波形与样本信号的波形的相似度是否达到预设阈值，可以提高波形比较单元222判断目标模拟信号与样本信号是否相同的容错率。并且，即使在某些情况下由用户的语音转换而成的模拟信号的起始点与样本信号的起始点相同，且模拟信号的终止点与样本信号的终止点也相同，通过波形比较单元222可以识别出目标模拟信号的波形与样本信号的波形的差异，从而判定该目标模拟信号与样本信号不同，进而有效提高比较模块22判断该目标模拟信号与样本信号的准确率。

研究人员发现，波形比较单元222将模拟信号的波形与样本信号的波形进行比较，但是用于判断相似度的预设阈值是固定的，在一些应用场景中，拾音器1获取到的音频信号是经过放大器进行放大的，当拾音器1将经过放大的音频信号转换成放大的模拟信号后，拾音器1将这种放大的模拟信号传输至波形比较单元222。波形比较单元222判断放大的模拟信号的波形与样本信号的波形的相似度是否达到的预设阈值，由于这种放大的模拟信号的波形与样本信号的波形差异巨大，影响到波形比较单元222判断相似度是否达到的预设阈值的准确率，从而导致波形比较单元222判断出错。

为了解决上述技术问题，本申请提供又一个实施例如下：

请参阅图5，图5是本申请实施例提供的音频处理装置的第三结构示意图。

在本实施例中，音频信号处理芯片2还包括调节模块25。

其中，调节模块25，用于当时间比较单元221判定目标模拟信号与样本信号相同时，从存储模块230获取样本信号，将目标模拟信号的振幅与样本信号的振幅进行比较；若目标模拟信号的振幅大于样本信号的振幅，则减小目标模拟信号的振幅；若目标模拟信号的振幅小于样本信号的振幅，则增加目标模拟信号的振幅；将调节后的目标模拟信号传输至波形比较单元。

在一种应用场景中，拾音器1获取到的音频信号是经过放大器进行放大的回声，在拾音器1将振幅经过放大的回声转换成振幅经过放大的模拟信号后，即使声纹识别模块21将该模拟信号作为目标模拟信号传输至波形比较单元222，由于振幅经过放大的模拟信号的波形与样本信号的波形差异巨大，影响到波形比较单元222判断振幅经过放大的模拟信号的波形与样本信号的波形的相似度是否达到的预设阈值的准确率，从而导致波形比较单元222判断容易出错。针对这种情况，本实施例通过拾音器1获取振幅经过放大的音频信号并转换成振幅经过放大模拟信号后，拾音器1将该模拟信号传输至声纹识别模块21进行识别，并判定为目标模拟信号后传输给时间比较单元221进行比较，时间比较单元221通过比较该目标模拟信号的起始点与样本信号的起始点以及该目标模拟信号的终止点与样本信号的终止点，得出该目标模拟信号与样本信号相同的结果后，将该目标模拟信号传输至调节模块25。调节模块25获取到该目标模拟信号后，将该目标模拟信号的振幅与样本信号的振幅进行比较；通过比较可得，该目标模拟信号的振幅大于样本信号的振幅，基于此，调节模块25对该目标模拟信号进行调节，即减小该目标模拟信号的振幅，从而有利于缩小该目标模拟信号的波形与样本信号的波形差异，然后调节模块25将调节后的目标模拟信号传输至波形比较单元222。波形比较单元222将该调节后的目标模拟信号与样本信号进行比较，当该调节后的目标模拟信号的波形与样本信号的波形的相似度达到预设阈值时，波形比较单元222判定该调节后的目标模拟信号与样本信号相同。

在另一种应用场景中，回声由于经过反射，回声的振幅会大幅减小，若拾音器1将由这种回声转换成振幅经过减小的模拟信号传输至波形比较单元222，同样会影响波形比较单元222判断相似度是否达到的预设阈值的准确率。针对这种情况，本实施例通过拾音器1获取振幅减小的回声并转换振幅减小的模拟信号后，拾音器1将该模拟信号传输至声纹识别模块21进行识别，并判定为目标模拟信号后传输给时间比较单元221进行比较，时间比较单元221通过比较该目标模拟信号的起始点与样本信号的起始点以及该目标模拟信号的终止点与样本信号的终止点，得出该目标模拟信号与样本信号相同的结果后，将该目标模拟信号传输至调节模块25。

调节模块25获取到该目标模拟信号后，将该目标模拟信号的振幅与样本信号的振幅进行比较；通过比较可得，该目标模拟信号的振幅小于样本信号的振幅，基于此，调节模块25对该目标模拟信号进行调节，增加该目标模拟信号的振幅，从而有利于缩小该目标模拟信号的波形与样本信号的波形差异，然后调节模块25将调节后的目标模拟信号传输至波形比较单元222。波形比较单元222将该调节后的目标模拟信号与样本信号进行比较，当该调节后的目标模拟信号的波形与样本信号的波形的相似度达到预设阈值时，波形比较单元222判定该调节后的目标模拟信号与样本信号相同。

可以理解的是，在一些应用场景中，调节模块25获取到的目标模拟信号的振幅与样本信号的振幅是相同的。针对这种情况，调节模块25不需对该目标模拟信号进行调节，并将该目标模拟信号传输至波形比较单元。

由此可见，本实施例通过调节模块25对目标模拟信号进行调节，从而有利于缩小目标模拟信号的波形与样本信号的波形之间的巨大差异，进而避免波形比较单元222将目标模拟信号的波形与样本信号的波形进行比较时受到影响，提高波形比较单元222的判断准确率。

需要说明的是，研究人员发现，从存储模块23找到样本信号的速度会影响到比较模块22将目标模拟信号与样本信号进行比较的效率，为了提高从存储模块23找到样本信号的速度，本申请提供以下实施例：

请参阅图6，图6是本申请实施例提供的存储模块23的结构示意图。

在本实施例中，存储模块23包括多个存储单元230，每个存储单元230存储对应的样本信号。每个存储单元230按照顺序进行编号，每个编号记录于映射表，其中，映射表存储于存储模块23的其中一个存储单元230。

存储模块23按照映射表记录的编号查找对应的存储单元230；存储模块23从查找到的存储单元230获取对应的样本信号，并将对应的样本信号传输至比较模块22。

可以理解的是，当存储模块23储存多个样本信号时，对多个样本信号逐一提取会减慢样本信号的提取速度，并降低比较模块22的处理效率。对此，本实施例的存储模块23通过多个存储单元230存储多个不同的样本信号，每个存储单元230按照顺序进行编号，每个编号记录于映射表，其中，映射表存储于存储模块23的其中一个存储单元230，例如，编号为1的存储单元230存储第一个样本信号，编号为2的存储单元230存储第二个样本信号，编号为3的存储单元230存储第三个样本信号，……当需要提取样本信号时，存储模块23按照映射表记录的编号查找对应的存储单元230，并从查找到的存储单元230获取对应的样本信号。

在一种应用场景中，用户刚输出的语音通过拾音器1转换成新的模拟信号，并在新的模拟信号被声纹识别模块21识别到包含人声后传输到比较模块22进行比较。比较模块22需要将新的模拟信号与样本信号进行比较，因此存储模块23根据映射表快速找最新编号的存储单元230并从该存储单元230提取最新存储的样本信号(新的模拟信号与最新存储的样本信号最有可能是相同的)，从而使比较模块22将新的模拟信号与最新存储的样本信号进行比较。由此可见，本实施例有效加快提取样本信号的速度，同时有利于提高比较模块22的比较效率。

在一个实施例中，存储模块23用于当比较模块22判定模拟信号与样本信号相同时，存储模块23将样本信号删除。

可以理解的是，在比较模块22将由回声转换而成的模拟信号与样本信号进行比较并得出比较结果后，若由回声转换而成的模拟信号与样本信号相同，则表明与该回声相同的音频信号曾被音频信号处理装置获取，未来音频信号处理装置再次获取到该回声或者与该回声相同的音频信号的机会很小，比较模块22不再需要该样本信号进行比较，因此为了节省存储空间，存储模块23可以将与由回声转换而成的模拟信号相同的样本信号删除，如此可以节省存储模块23的存储空间，同时由于删除样本信号使存储于存储模块23的样本信号的总量减少，存储模块23查找并提取样本信号的速度也加快。

本申请提供一种音频信号处理方法，请参阅图7，图7是本申请实施例提供的音频信号处理方法的流程示意图。

该音频信号处理方法用于音频信号处理装置，音频信号处理装置包括拾音器1、扬声器3以及音频信号处理芯片2，音频信号处理芯片2包括声纹识别模块21、比较模块22以及存储模块23，且音频信号处理方法包括如下步骤：

S101、拾音器1获取音频信号并将音频信号转换成模拟信号后传输至声纹识别模块。

S102、声纹识别模块检测模拟信号是否包含人声，若是，则将模拟信号作为目标模拟信号传输至比较模块，否则，删除模拟信号。

S103、比较模块比较目标模拟信号与存储在存储模块中的样本信号是否相同，若相同，则将目标模拟信号删除；若不相同，则将目标模拟信号作为样本信号传输至存储模块进行存储。

其中，存储模块用于存储样本信号，样本信号为用户语音信号。

S104、扬声器从存储模块获取最新存储的样本信号，并将最新存储的样本信号转换成对应的音频信号后输出。

在一个实施例中，比较模块22包括多个比较单元220。

比较模块将样本信号与目标模拟信号进行比较，包括：每个比较单元按照预设比较方式将目标模拟信号与样本信号进行比较；若每个比较单元均判定目标模拟信号不同于样本信号，则比较模块判定目标模拟信号不同于样本信号，否则比较模块判定目标模拟信号与样本信号相同。

在一个实施例中，当存储模块23未存储样本信号时，比较模块22将目标模拟信号作为样本信号传输至存储模块23进行存储。

在一个实施例中，多个比较单元220中至少包括一个时间比较单元221。

比较单元按照预设比较方式将目标模拟信号与样本信号进行比较，包括：时间比较单元获取目标模拟信号的起始点和样本信号的起始点并进行比较；若目标模拟信号的起始点与样本信号的起始点不同，则时间比较单元判定目标模拟信号与样本信号不同；否则，时间比较单元获取目标模拟信号的终止点和样本信号的终止点并进行比较；若目标模拟信号的终止点与样本信号的终止点不同，则时间比较单元判定目标模拟信号与样本信号不同，否则时间比较单元判定目标模拟信号与样本信号相同。

在一个实施例中，多个比较单元220中至少包括一个波形比较单元222。

比较单元按照预设比较方式将目标模拟信号与样本信号进行比较，包括：波形比较单元将目标模拟信号的波形与样本信号的波形进行比较；若目标模拟信号的波形与样本信号的波形的相似度达到预设阈值，则波形比较单元判定目标模拟信号与样本信号相同，否则波形比较单元判定目标模拟信号与样本信号不相同。

在一个实施例中，音频信号处理芯片2还包括调节模块25；该音频信号处理方法还包括：当时间比较单元判定目标模拟信号与样本信号相同时，调节模块从存储模块获取样本信号，将目标模拟信号的振幅与样本信号的振幅进行比较；若目标模拟信号的振幅大于样本信号的振幅，则减小目标模拟信号的振幅；若目标模拟信号的振幅小于样本信号的振幅，则增加目标模拟信号的振幅；将调节后的目标模拟信号传输至波形比较单元。

在一个实施例中，存储模块23包括多个存储单元230，每个存储单元230存储对应的样本信号。

存储模块将样本信号传输至比较模块，包括：存储模块对每个存储对应的样本信号的存储单元按照顺序进行编号，将每个编号记录于映射表，其中，映射表存储于存储模块的其中一个存储单元；存储模块按照映射表记录的编号查找对应的存储单元；存储模块按照映射表记录的编号查找对应的存储单元；存储模块从查找到的存储单元获取对应的样本信号，并将对应的样本信号传输至比较模块。

在一个实施例中，音频信号处理方法还包括如下步骤：

当比较模块判定目标模拟信号与样本信号相同时，存储模块将样本信号删除。

在一个优选实施例中，存储模块23为易失性存储器。每一次断电重启音频信号处理芯片2后存储模块23内的数据均会被清空。

本申请实施例提供了一种可存储介质，其上存储有计算机程序。

在本实施例中，存储于可存储介质的计算机程序被处理器执行时实现如上任一实施例的音频信号处理方法的步骤。

本申请实施例提供的音频信号处理装置、方法及可存储介质，其中该音频信号处理方法用于音频信号处理装置，音频信号处理装置包括拾音器1、扬声器3以及音频信号处理芯片2，音频信号处理芯片2包括声纹识别模块21、比较模块22、存储模块23以及比较模块22，且音频信号处理方法包括如下步骤：拾音器获取音频信号并将音频信号转换成模拟信号后传输至声纹识别模块；声纹识别模块判断模拟信号是否包含人声，若是，则将模拟信号作为目标模拟信号传输至比较模块，否则删除模拟信号，从而摒除人声以外的噪音，初步筛选出人声，有利于准确地采集用户语音信号；比较模块22将目标模拟信号与存储在存储模块中的样本信号进行比较，若比较模块22判定目标模拟信号不同于样本信号，则将目标模拟信号作为样本信号传输至存储模块23进行存储，否则，删除目标模拟信号。

可以理解的是，由于存储模块中存储的样本信号为上一次输入的用户语音信号，若目标模拟信号是回声，则目标模型信号必然与样本信号相同，相反，若目标模拟信号是新输入的用户语音信号，则目标模拟信号与样本信号不相同。因此，通过比较模块22将存储于存储模块23的样本信号与目标模拟信号进行比较，当目标模拟信号与样本信号相同时，说明该目标模拟信号为回声，比较模块22删除该目标模拟信号；当目标模拟信号不同于样本信号时，说明该目标模拟信号不是回声，比较模块22将目标模拟信号作为样本信号传输至存储模块23进行存储，如此可以保证存储模块23获取到的目标模拟信号是真实的用户语音信号而不是回声。扬声器3从存储模块23获取最新存储的样本信号，并将最新存储的样本信号转换成对应的音频信号后输出，避免将回声再次通过扬声器播放，从而实现过滤回声。

应当理解，本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(PGA)，现场可编程门阵列(FPGA)等。

此外，在本申请各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。存储介质可以是只读存储器，磁盘或光盘等。

以上所述是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本申请的保护范围。

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
专利发明人：赖振楠;刘清水;
专利申请人：深圳宏芯宇电子股份有限公司;