掌桥专利:专业的专利平台
掌桥专利
首页

一种基于声纹到达相位的可旋转摄像装置及其控制方法

文献发布时间:2023-06-19 09:54:18


一种基于声纹到达相位的可旋转摄像装置及其控制方法

技术领域

本发明涉及声音识别领域,特别是涉及一种基于声纹到达相位的可旋转摄像装置及其控制方法。

背景技术

近年来,随着计算机、网络、图像处理以及传输技术的飞速发展,摄像头被广泛的应用到视频直播、远程会议等实时语音视频通信中去。在此类实时通信系统中,主讲人的信息,包括面部表情、肢体动作等,会比其他细节更被远程观众关注。

目前市场上现有的可以追踪人脸的摄像头,大多是以图像处理原理进行追踪。但是该方法不仅存在图像处理计算量大的问题,并且当多人使用时,摄像头容易分辨不清,无法达到追踪主讲人的效果。

发明内容

基于此,有必要提供一种基于声纹到达相位的可旋转摄像装置及其控制方法,以在减小计算量的同时,达到追踪主讲人的效果。

为实现上述目的,本发明提供了如下方案:

一种基于声纹到达相位的可旋转摄像装置,包括:摄像头、旋转模块、控制模块、模数转换模块和麦克风阵列;

所述摄像头设置在所述旋转模块上,所述摄像头、所述旋转模块和所述模数转换模块均与所述控制模块连接;所述麦克风阵列与所述模数转换模块连接;

所述麦克风阵列包括

可选的,所述控制模块包括:

声音信号获取单元,用于获取

判断单元,用于判断所述数字信号是否为人声信号;

滤波单元,用于若所述数字信号为人声信号,则采用数字带通滤波器对所述人声信号进行滤波,得到预设频率下的人声信号;

初始相位确定单元,用于由所述声音信号的到达时间确定各组所述预设频率下的人声信号的初始相位;

双曲线建立单元,用于对于任意两组所述预设频率下的人声信号,由两组所述预设频率下的人声信号的初始相位计算相位偏差,由所述相位偏差和载波频率计算所述相位偏差对应的距离差,并以所述距离差对应的两个所述麦克风的位置为焦点,以所述距离差为差值建立双曲线;

声源位置确定单元,用于将不同组合下得到的多个所述双曲线的交点确定为声源位置;

旋转控制单元,用于根据所述声源位置控制所述旋转模块旋转,以实现所述摄像头对声源的追踪。

可选的,所述双曲线建立单元中所述距离差的计算公式为:

其中,

可选的,所述控制模块为STM32芯片或ARM芯片。

可选的,所述数字带通滤波器的频率范围为100Hz-200Hz。

可选的,所述数字带通滤波器的频率为150Hz。

本发明还提供了一种基于声纹到达相位的可旋转摄像装置的控制方法,包括:

获取

判断所述数字信号是否为人声信号,若是,则对所述人声信号进行数字带通滤波,得到预设频率下的人声信号;

由所述声音信号的到达时间确定各组所述预设频率下的人声信号的初始相位;

对于任意两组所述预设频率下的人声信号,由两组所述预设频率下的人声信号的初始相位计算相位偏差,由所述相位偏差和载波频率计算所述相位偏差对应的距离差,并以所述距离差对应的两个所述麦克风的位置为焦点,以所述距离差为差值建立双曲线;

将不同组合下得到的多个所述双曲线的交点确定为声源位置;

根据所述声源位置控制所述旋转模块旋转,以实现所述摄像头对声源的追踪。

可选的,所述由所述相位偏差和载波频率计算所述相位偏差对应的距离差,具体为:

其中,

与现有技术相比,本发明的有益效果是:

本发明提出了一种基于声纹到达相位的可旋转摄像装置及其控制方法,所述可旋转摄像装置包括:摄像头、旋转模块、控制模块、模数转换模块和麦克风阵列;摄像头设置在旋转模块上,摄像头、旋转模块和模数转换模块均与控制模块连接;麦克风阵列与模数转换模块连接;麦克风阵列包括N个麦克风;模数转换模块包括同步控制器和与同步控制器连接的N个采样电路;一个麦克风对应连接一个采样电路。本发明解决了基于图像处理原理实现追踪的摄像头存在的计算量大的问题,并且可以在多人中分辨主讲人,达到了追踪主讲人的效果。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于声纹到达相位的可旋转摄像装置的结构示意图;

图2为本发明实施例提供的来波方向计算示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例提供的基于声纹到达相位的可旋转摄像装置的结构示意图。

参见图1,本实施例的基于声纹到达相位的可旋转摄像装置,包括:摄像头1、旋转模块2、控制模块3、模数转换模块4和麦克风阵列5。

所述摄像头1设置在所述旋转模块2上,所述摄像头1为现有的摄像头,所述旋转模块2,其内部电机受控制模块3控制,所述旋转模块2可以变更视频采集角度。所述摄像头1、所述旋转模块2和所述模数转换模块4均与所述控制模块3连接;所述麦克风阵列5与所述模数转换模块4连接。

所述麦克风阵列5包括

作为一种可选的实施方式,所述控制模块3包括:

声音信号获取单元,用于获取

判断单元,用于判断所述数字信号是否为人声信号。

滤波单元,用于若所述数字信号为人声信号,则采用数字带通滤波器对所述人声信号进行滤波,得到预设频率下的人声信号。

初始相位确定单元,用于由所述声音信号的到达时间确定各组所述预设频率下的人声信号的初始相位。

双曲线建立单元,用于对于任意两组所述预设频率下的人声信号,由两组所述预设频率下的人声信号的初始相位计算相位偏差,由所述相位偏差和载波频率计算所述相位偏差对应的距离差,并以所述距离差对应的两个所述麦克风51的位置为焦点,以所述距离差为差值建立双曲线。

声源位置确定单元,用于将不同组合下得到的多个所述双曲线的交点确定为声源位置。

旋转控制单元,用于根据所述声源位置控制所述旋转模块2旋转,以实现所述摄像头1对声源的追踪。

作为一种可选的实施方式,所述双曲线建立单元中所述距离差的计算公式为:

其中,

作为一种可选的实施方式,所述控制模块3为STM32芯片或ARM芯片,其拥有一定的运算和逻辑处理能力,可以接受并处理来自模数转换模块4的数据,可以控制旋转模块2内部的电机和旋转模块2上的摄像头1。

作为一种可选的实施方式,所述数字带通滤波器的频率范围为100Hz-200Hz。具体的,所述数字带通滤波器的频率可以为150Hz。

下面对上述实施例的基于声纹到达相位的可旋转摄像装置的工作流程和原理进行详细说明。

该可旋转摄像装置在使用时,声音信息将依次通过麦克风阵列5、模数转换模块4,进入控制模块3,控制模块3处理后,计算出声源的位置,控制旋转模块2旋转摄像头1,达到追踪声音来源的效果。具体为:

a.在摄像头1覆盖区域内,主讲人讲话。

b.麦克风阵列5中,所有独立的麦克风51开始采集信息,把声音信号转换为连续的模拟电信号,并传输到模数转换模块4,根据麦克风的不同,分别为

c.模数转换模块4中,同步控制器41控制所有采样电路42进行采样,获得同一采样时刻下的所有独立麦克风51的数字信号,此时,声音信号转换为离散的数字信号,分别为

d.控制模块3根据获取的数字信号进行分析,获得声源的位置。具体的:

d1.控制模块3对到来数字信号进行分类,因人在说话时声音的强度信息明显较高,而且变化幅度大,所以,数字信号满足此特点时,认为是人声,执行后续步骤;当不满足此特点时,认为是噪声或无声,继续等待,暂时不进行后续步骤。

d2.把d1中认定是人声的信号时,进行数字带通滤波,其数字带通滤波器

d3.步骤d2执行后,可以认为所有麦克风51的信号,其频率为150Hz,因声源基本一致,持续时间短,可以认为所有麦克风51的信号波形一致,但初始相位根据到达时间略有偏差:

其中,

d4.任两组信号进行初始相位比较,获得相位偏差

d5.根据相位差

载波波长

相位差对应的距离差

d6.参见图2的来波方向计算示意图,其中,6表示声源,即信号传输的起点;

相位差对应的距离差

所以,声源的位置应当是以独立麦克风51为焦点,

d7.通过复数个独立麦克风51组合,可以求解声源的位置。

e.控制模块3根据位置信息,输出控制命令到旋转模块2,控制摄像头1旋转,达到追踪声音来源的效果。

本实施例的基于声纹到达相位的可旋转摄像装置,工作时,麦克风阵列采集声音数据,模数转换模块将其转化为数字信号,控制模块通过对数字信号的带通滤波,获取初始相位,继而得到相位差,计算出声源的位置,控制旋转模块,旋转摄像头追踪声源,该可旋转摄像装置既有比图像原理实现追踪功能的摄像头计算量小的优点,又有可以在多人中分辨主讲人的特点。

本发明还提供了一种基于声纹到达相位的可旋转摄像装置的控制方法,包括:

获取

判断所述数字信号是否为人声信号,若是,则对所述人声信号进行数字带通滤波,得到预设频率下的人声信号。

由所述声音信号的到达时间确定各组所述预设频率下的人声信号的初始相位。

对于任意两组所述预设频率下的人声信号,由两组所述预设频率下的人声信号的初始相位计算相位偏差,由所述相位偏差和载波频率计算所述相位偏差对应的距离差,并以所述距离差对应的两个所述麦克风的位置为焦点,以所述距离差为差值建立双曲线。

将不同组合下得到的多个所述双曲线的交点确定为声源位置。

根据所述声源位置控制所述旋转模块旋转,以实现所述摄像头对声源的追踪。

作为一种可选的实施方式,所述由所述相位偏差和载波频率计算所述相位偏差对应的距离差,具体为:

其中,

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

相关技术
  • 一种基于声纹到达相位的可旋转摄像装置及其控制方法
  • 基于人脸和声纹识别的智能监控摄像机及其控制方法
技术分类

06120112347683