掌桥专利:专业的专利平台
掌桥专利
首页

交互时的声源定位方法、设备和计算机可读存储介质

文献发布时间:2023-06-19 11:19:16


交互时的声源定位方法、设备和计算机可读存储介质

技术领域

本发明涉及机器人领域,特别涉及一种交互时的声源定位方法、设备和计算机可读存储介质。

背景技术

机器人技术的飞速发展,使得机器人在各种场景得到广泛应用。人们希望这些应用场景下的机器人能够与用户进行交互,尤其是一些特定应用场景下的机器人,例如,陪伴老年人、独居者等的机器人,能否与用户进行良好交互作为能否给用户带来良好体验的重要标准。

用户与机器人交互的一种方式是语音交互,例如,唤醒机器人、在唤醒机器人后与机器人的对话,等等。和人与人之间交互类似,机器人能够正对发出声音(无论是指令还是具有情感的对话)的用户,是形成良好的交互体验的前提,而机器人不是每时每刻都正面对着用户,因此,这种交互方式下对声源的定位尤为重要。

然而,现有交互时的声源定位方法中,由于不能使机器人准确地定位声源方向,导致用户发出声音时,机器人不能正对用户,让用户的体验下降。

发明内容

本申请提供一种交互时的声源定位方法、设备和计算机可读存储介质,以准确定位声源方向,提升交互时的效率和体验。

一方面,本申请提供了一种交互时的声源定位方法,包括:

拾音器阵列拾取机器人周边的目标声音信息;

根据所述拾音器阵列拾取的目标声音信息,确定所述目标声音信息的声源的方位信息;

将所述目标声音信息的声源的方位信息发送至所述机器人的伺服机构,以使所述伺服机构转动所述机器人的拟人头部正对发出所述目标声音信息的声源。

另一方面,本申请提供了一种交互时的声源定位装置,包括:

拾音器阵列模块,用于通过拾音器阵列拾取机器人周边的目标声音信息;

方位信息确定模块,用于根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息;

驱动模块,用于将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。

第三方面,本申请提供了一种设备,所述设备包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述交互时的声源定位方法的技术方案的步骤。

第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述交互时的声源定位方法的技术方案的步骤。

从上述本申请提供的技术方案可知,由于拾取机器人周边的目标声音信息是拾音器阵列,可从多个方向拾取目标声音信息,因而根据这些拾音器阵列拾取的目标声音信息确定目标声音信息的声源的方位信息,其定位结果相对比较准确,能够使得伺服机构转动机器人的拟人头部,准确正对发出目标声音信息的声源,提高机器人与用户的交互效率,也能提升用户的使用体验。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的交互时的声源定位方法的流程图;

图2是本申请实施例提供的交互时的声源定位装置的结构示意图;

图3是本申请另一实施例提供的交互时的声源定位装置的结构示意图;

图4是本申请实施例提供的设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

在本说明书中,诸如第一和第二这样的形容词仅可以用于将一个元素或动作与另一元素或动作进行区分,而不必要求或暗示任何实际的这种关系或顺序。在环境允许的情况下,参照元素或部件或步骤(等)不应解释为局限于仅元素、部件、或步骤中的一个,而可以是元素、部件、或步骤中的一个或多个等。

在本说明书中,为了便于描述,附图中所示的各个部分的尺寸并不是按照实际的比例关系绘制的。

本申请提出了一种交互时的声源定位方法,可应用于机器人,该机器人可以是在餐厅作业的机器人,例如,传菜机器人,也可以是在医疗场所,例如医院作业的送药机器人,还可以是家用机器人,例如,陪伴老年人或独居者的情感机器人,等等。如附图1所示,交互时的声源定位方法主要包括步骤S101至S103,详述如下:

步骤S101:拾音器阵列拾取机器人周边的目标声音信息。

所谓拾音器阵列,是指按照一定规则排列的多个拾音器的组合,拾音器阵列中的每个拾音器均具有独立获取声音信号或声音信息的功能。在本申请实施例中,拾音器阵列可以是由4至6个拾音器组成的阵列,其可以设置在机器人拟人头部的前、后、左、右、上和下等6个位置,拾音器可以是麦克风(包括其内部的音频放大电路)等常见声音信号获取设备。

在本申请实施例中,目标声音信息可以是具有特定含义的语音内容,包括用于唤醒机器人的唤醒词、对机器人亲昵的称呼以及与机器人交互时的常用语,例如“小艾小艾,请醒一醒”、“小艾,请转过头来”以及“小艾,请帮我将水杯拿过来一下”等等。由于用户可能处于机器人的任何一个方位,因此,拾音器阵列需要拾取机器人的周边声音,以期拾取到目标声音信息。由于对于特定的语音信息,其必然包含特定的声学特征,例如语音的响度、音调、频率、音色甚至特定人员的声纹等,因此,作为本申请一个实施例,拾音器阵列拾取机器人周边的目标声音信息可以是:通过对拾音器阵列拾取的周边声音进行声学特征提取,得到包含声学特征的声源信息,将该声源信息的声学特征与预存声学特征进行比较,若匹配,则确定该声源信息为目标声音信息。考虑到机器人周边的声音信号复杂,除了目标声音信息,还包括一些噪声等干扰信息,在上述拾音器阵列拾取机器人周边的目标声音信息的实施例中,在对拾音器阵列拾取的周边声音进行声学特征提取时,还可以对周边声音进行除干扰的处理,包括消除或降低噪声干扰。具体地,消除或降低噪声干扰的一种方法可以是:确定拾音器阵列中各个拾音器采集到的周边声音的音量,计算出音量差值小于预定差值阈值的声音信号,将这些声音信号中频率高于第一频率阈值或低于第二频率阈值和/或持续时长高于第一持续时长或低于第二持续时长的声音信号确定为噪声信号,其中,上述计算出音量差值小于预定差值阈值的声音信号可以是:对于一组拾音器,将其中任意一个拾音器视为主拾音器,其他拾音器视为次拾音器,对该组拾音器采集到的频段相同的声音信号,计算各个次拾音器所采集到的声音信号的音量平均值,计算音量平均值与主拾音器采集到的声音信号的音量的差值,当差值小于预定差值阈值时,将对应的声音信号确定为音量差值小于预定差值阈值的声音信号。

步骤S102:根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息。

上述步骤S102对拾音器阵列拾取的周边声音进行声学特征提取过程包括对拾音器阵列拾取的周边声音进行音强即声音强度的提取,即得到声源信息的音强,因此,拾音器阵列拾取到的目标声音信息还包含其音强。作为本申请的一个实施例,根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息可以是:计算目标声音信息到达拾音器阵列中每个拾音器的时间,确定拾音器阵列采集目标声音信息的延迟时间,根据该延迟时间和目标声音信息的音强,确定目标声音信息的声源的方位信息。上述定位原理实际上是模拟了人体听觉系统听音辨位的思想并结合几何知识得到,此处不做赘述。

在本申请另一实施例中,根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息可以是:将机器人所在空间划分成若干个空域;判断第一个接收到目标声音信息的拾音器和第二个接收到目标声音信息的拾音器,以确定目标声音信息的声源所在空域;根据第一个和第二个接收到目标声音信息的两个时刻以及目标声音信息的声源所在空域,计算得出目标声音信息的声源的方位信息。上述判断第一个接收到目标声音信息的拾音器和第二个接收到目标声音信息的拾音器可以是设置判断阈值,该阈值为前期从目标声音信息中提取的一段语音的平均音强值,若拾音器阵列中有两个拾音器先后接收到的目标声音信息的音强高于该平均音强值,则确定该两个拾音器为第一个接收到目标声音信息的拾音器和第二个接收到目标声音信息的拾音器。上述目标声音信息的声源所在空域实际是该声源处于一对拾音器之间的角度决定,因此,根据第一个和第二个接收到目标声音信息的两个时刻以及目标声音信息的声源所在空域,计算得出目标声音信息的声源的方位信息可以是:将任意两个拾音器视为一组拾音器,对于每一组拾音器分别计算目标声音信息的声源处于该组拾音器中两个拾音器之间的方位角度β,根据该方位角度β估算目标声音信息的声源与一组拾音器之间距离D,根据该距离D确定目标声音信息的声源所在空域中一假定声源的位置,在假定声源的位置正交分解每一组拾音器确定的假定声源,计算该假定声源的水平角和高度角,定位目标声音信息的声源的方位信息。

在本申请另一实施例中,上述方法还可以包括:按照拾音器阵列拾取的目标声音信息的至少一个声源方位进行图像采集,从采集的图像中,识别发声部位的形态学特征。由于拾音器阵列中每个拾音器都可以拾取目标声音信息,因此,拾音器阵列拾取的目标声音信息包括多个声源方位,可以按照拾音器阵列拾取的目标声音信息的至少一个声源方位进行图像采集,并识别这些采集的图像中发声部位的形态学特征,例如,发声时的口型等。

结合上述按照拾音器阵列拾取的目标声音信息的至少一个声源方位进行图像采集,从采集的图像中,识别发声部位的形态学特征这一技术手段,在本申请一个实施例中,根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息可以是:根据采集的图像中发声部位的形态学特征与目标声音信息之间的匹配度,从拾音器阵列拾取的目标声音信息的至少一个声源方位中,确定目标声音信息的声源的最终方位信息。具体而言,根据采集的图像中发声部位的形态学特征与目标声音信息之间的匹配度,从拾音器阵列拾取的目标声音信息的至少一个声源方位中,确定目标声音信息的声源的最终方位信息可以是:获取拾音器阵列拾取的目标声音信息的至少一个声源方位中各声源方位的预测方位概率值;根据预测方位概率值和语音表达部位的形态学特征与目标声音信息之间的匹配度,确定声源方位所对应的声源方位值;选取对应于最大声源方位值的声源方位作为目标声音信息的声源的最终方位信息,其中,声源方位值用于表征获取的声源方位为目标声音信息的最终方位信息的概率。上述实施例,实际上是将听觉和视觉的定位方法结合,即通过图像中发声部位的形态学特征进行辅助定位声源方向,因此,相较于仅根据声音确定声源方位而言,可提高对声源定位的准确性。

步骤S103:将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。

本申请实施例中,伺服机构是指经由闭回路控制方式达到一个机械系统位置、速度、或加速度控制的系统,通常包含受控体、致动器、传感器和控制器等几个部分,其中,控制器部分与机器人中的中央处理单元连接。当经步骤S102确定了目标声音信息的声源的方位信息后,中央处理单元将目标声音信息的声源的方位信息发送至伺服机构的控制器,控制器驱动致动器(通常是一个马达)转动机器人的拟人头部正对发出目标声音信息的声源。

具体地,可以在机器人上设置一定位传感器(例如陀螺仪),该定位传感器用于感知机器人当前所正对的方向,伺服机构根据目标声音信息的声源的方位信息以及机器人当前所正对的方向,计算出机器人需要转动的方向和角度,然后使机器人的拟人头部向需要转动的方向转动对应的角度,最终正对发出目标声音信息的声源。可以理解的是,由于前述确定的目标声音信息的声源的方位信息是三维空间的方位信息,因此,机器人的拟人头部转动的方向分为两种情形,即,声源与机器人的拟人头部等高以及声源与机器人的拟人头部不等高;相应地,将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源亦分为两种情形,即,当声源与机器人的拟人头部等高时,将目标声音信息的声源相对机器人的拟人头部的第一平面夹角发送至机器人的伺服机构,以使伺服机构按照第一平面夹角向左或向右转动机器人的拟人头部正对发出目标声音信息的声源;当目标声音信息的声源与机器人的拟人头部不等高时,将机器人的拟人头部相对目标声音信息的声源的俯仰角或机器人的拟人头部相对目标声音信息的声源的俯仰角和目标声音信息的声源相对机器人的拟人头部的第二平面夹角发送至机器人的伺服机构,以使伺服机构按照俯仰角上下转动机器人的拟人头部或按照俯仰角上下转动机器人的拟人头部之后再按照第二平面夹角向左或向右转动机器人的拟人头部正对发出目标声音信息的声源。上述实施例中,第一平面夹角或第二平面夹角是指声源与机器人的拟人头部处于同一平面时的夹角,俯仰角包括机器人的拟人头部相对声源的俯视角度和仰视角度。

需要进一步说明的是,上述本申请实施例中,无论是根据拾音器阵列拾取的目标声音信息确定声源的方位信息,还是结合采集的图像和拾音器阵列拾取的目标声音信息确定声源的方位信息,使机器人的伺服机构转动机器人的拟人头部正对发出目标声音信息的声源,并非严格意义上的实时定位,这是因为,从确定目标声音信息的声源的方位信息,到转动机器人的拟人头部正对发出目标声音信息的声源具有一个时间差或者先后顺序(尽管这个过程比较短)。为了增强实时性,在本申请一个实施例中,可以在确定目标声音信息的声源的方位信息后,结合图像识别算法,持续跟踪发出目标声音信息的声源,具体可以是在声源的发声范围内,利用人像识别技术检测其中是否存在人脸,或者利用人脸识别技术检测在声源的发声范围是否存在脸部特征与预存的人脸模板相同的用户,或者,利用唇部运动检测技术,检测在声源的发声范围是否存在唇部发生运动的用户,若是,则锁定发出目标声音信息的声源以对其进行持续跟踪。

从上述附图1示例的交互时的声源定位方法可知,由于拾取机器人周边的目标声音信息是拾音器阵列,可从多个方向拾取目标声音信息,因而根据这些拾音器阵列拾取的目标声音信息确定目标声音信息的声源的方位信息,其定位结果相对比较准确,能够使得伺服机构转动机器人的拟人头部,准确正对发出目标声音信息的声源,提高机器人与用户的交互效率,也能提升用户的使用体验。

请参阅附图2,是本申请实施例提供的一种交互时的声源定位装置,可以包括拾音器阵列模块201、方位信息确定模块202和驱动模块203,详述如下:

拾音器阵列模块201,用于拾取机器人周边的目标声音信息;

方位信息确定模块202,用于根据拾音器阵列201拾取的目标声音信息,确定目标声音信息的声源的方位信息;

驱动模块203,用于将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。

可选地,附图2示例的拾音器阵列模块201可以包括特征提取单元和目标信息确定单元,其中:

特征提取单元,用于通过对拾音器阵列拾取的周边声音进行声学特征提取,得到包含声学特征的声源信息;

采集单元,用于将声源信息的声学特征与预存声学特征进行比较,若匹配,则确定声源信息为目标声音信息。

可选地,附图2示例的装置中,声学特征包括声源信息的音强,方位信息确定模块202可以包括计算单元和第一方位信息确定单元,其中:

计算单元,用于计算目标声音信息到达拾音器阵列中每个拾音器的时间,确定拾音器阵列采集目标声音信息的延迟时间;

第一方位信息确定单元,用于根据目标声音信息的延迟时间和目标声音信息的音强,确定目标声音信息的声源的方位信息。

可选地,附图2示例的方位信息确定模块202可以包括空域划分单元、判断单元和第二方位信息确定单元,其中:

空域划分单元,用于将机器人所在空间划分成若干个空域;

判断单元,用于判断第一个接收到目标声音信息的拾音器和第二个接收到目标声音信息的拾音器,以确定目标声音信息的声源所在的空域;

第二方位信息确定单元,用于根据第一个和第二个接收到目标声音信息的两个时刻以及目标声音信息所在的空域,计算得出目标声音信息的声源的方位信息。

可选地,附图2示例的装置还可以包括图像采集模块301和识别模块302,如附图3示例的交互时的声源定位装置,其中:

图像采集模块301,用于按照拾音器阵列拾取的目标声音信息的至少一个声源方位进行图像采集;

识别模块302,用于从图像采集模块301采集的图像中,识别发声部位的形态学特征。

可选地,附图3示例的方位信息确定模块202可以包括第三方位信息确定单元,用于根据发声部位的形态学特征与目标声音信息之间的匹配度,从拾音器阵列拾取的目标声音信息的至少一个声源方位中,确定目标声音信息的声源的最终方位信息。

可选地,上述第三方位信息确定单元可以包括预测方位概率值获取单元、声源方位值确定单元和选取单元,其中:

预测方位概率值获取单元,用于获取至少一个声源方位的声源方位中各声源方位的预测方位概率值;

声源方位值确定单元,用于根据预测方位概率值和匹配度,确定声源方位所对应的声源方位值,其中,声源方位值用于表征获取的声源方位为目标声音信息的最终方位信息的概率;

选取单元,用于选取对应于最大声源方位值的声源方位作为目标声音信息的声源的最终方位信息。

可选地,附图2示例的驱动模块203可以包括第一转动单元和第二转动单元,其中:

第一转动单元,用于当目标声音信息的声源与机器人的拟人头部等高时,将目标声音信息的声源相对机器人的拟人头部的第一平面夹角发送至机器人的伺服机构,以使机器人的伺服机构按照第一平面夹角向左或向右转动机器人的拟人头部正对发出目标声音信息的声源;

第二转动单元,用于当目标声音信息的声源与机器人的拟人头部不等高时,将机器人的拟人头部相对目标声音信息的声源的俯仰角或机器人的拟人头部相对目标声音信息的声源的俯仰角和目标声音信息的声源相对机器人的拟人头部的第二平面夹角发送至机器人的伺服机构,以使伺服机构按照俯仰角上下转动机器人的拟人头部或按照俯仰角上下转动机器人的拟人头部之后再按照第二平面夹角向左或向右转动机器人的拟人头部正对发出目标声音信息的声源。

从以上技术方案的描述中可知,由于拾取机器人周边的目标声音信息是拾音器阵列,可从多个方向拾取目标声音信息,因而根据这些拾音器阵列拾取的目标声音信息确定目标声音信息的声源的方位信息,其定位结果相对比较准确,能够使得伺服机构转动机器人的拟人头部,准确正对发出目标声音信息的声源,提高机器人与用户的交互效率,也能提升用户的使用体验。

图4是本申请一实施例提供的设备的结构示意图。如图4所示,该实施例的设备4主要包括:处理器40、存储器41以及存储在存储器41中并可在处理器40上运行的计算机程序42,例如交互时的声源定位方法的程序。处理器40执行计算机程序42时实现上述交互时的声源定位方法实施例中的步骤,例如图1所示的步骤S101至S103。或者,处理器40执行计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图2所示拾音器阵列模块201、方位信息确定模块202和驱动模块203的功能。

示例性地,交互时的声源定位方法的计算机程序42主要包括:拾音器阵列拾取机器人周边的目标声音信息;根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息;将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。计算机程序42可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器41中,并由处理器40执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序42在设备4中的执行过程。例如,计算机程序42可以被分割成拾音器阵列模块201、方位信息确定模块202和驱动模块203(虚拟装置中的模块)的功能,各模块具体功能如下:拾音器阵列模块201,用于拾取机器人周边的目标声音信息;方位信息确定模块202,用于根据拾音器阵列201拾取的目标声音信息,确定目标声音信息的声源的方位信息;驱动模块203,用于将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。

设备4可包括但不仅限于处理器40、存储器41。本领域技术人员可以理解,图4仅仅是设备4的示例,并不构成对设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如计算设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器41可以是设备4的内部存储单元,例如设备4的硬盘或内存。存储器41也可以是设备4的外部存储设备,例如设备4上配备的插接式硬盘,智能存储卡(Smart MediaCard,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器41还可以既包括设备4的内部存储单元也包括外部存储设备。存储器41用于存储计算机程序以及设备所需的其他程序和数据。存储器41还可以用于暂时地存储已经输出或者将要输出的数据。

所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即,将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述装置中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中,应该理解到,所揭露的装置/设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个非临时性计算机可读取存储介质中。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,交互时的声源定位方法的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤,即,拾音器阵列拾取机器人周边的目标声音信息;根据拾音器阵列拾取的目标声音信息,确定目标声音信息的声源的方位信息;将目标声音信息的声源的方位信息发送至机器人的伺服机构,以使伺服机构转动机器人的拟人头部正对发出目标声音信息的声源。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。非临时性计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读内存(ROM,Read-Only Memory)、随机存取存储器(RAM,RandomAccess Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,非临时性计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,非临时性计算机可读介质不包括电载波信号和电信信号。以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本申请的具体实施方式而已,并不用于限定本申请的保护范围,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

相关技术
  • 交互时的声源定位方法、设备和计算机可读存储介质
  • 声源定位方法和装置、计算机可读存储介质、电子设备
技术分类

06120112881435