掌桥专利:专业的专利平台
掌桥专利
首页

一种基于人工智能的感应灯照明控制方法

文献发布时间:2024-04-18 19:58:26


一种基于人工智能的感应灯照明控制方法

技术领域

本申请一般地涉及灯光控制领域,尤其涉及一种基于人工智能的感应灯照明控制方法。

背景技术

灯具是人们日常生活中必不可少的一部分,在公共场所中的灯具,为了避免能源浪费的情况,常常采用感应灯进行照明;通过监测照明环境的光照强度和声音强度实现灯具开关的控制;然而,这种方法经常出现灯具被错误打开的情况。

目前,公开号为CN108601180A的专利文件公开了一种基于声纹识别技术的电灯声控开关控制方法,采集声音信息并提取声音信息的声纹特征值,将该声纹特征值与预先存好的声纹特征值进行比较,若声纹特征值匹配成功,控制电灯打开。

然而,这种方式,需要将实时采集的声纹特征值与所有预先存好的声纹特征值进行比较,计算量较大,导致感应灯的照明控制具有延迟性;且当预先存好的声纹特征值采集不全面或采集不精确时,同样会出现感应灯打被错误打开的情况,导致感应灯照明控制不准确。

发明内容

为了解决现有技术中的上述技术问题,本申请提供了一种基于人工智能的感应灯照明控制方法,以保证感应灯照明控制的实时性和准确性。

本发明提供了一种基于人工智能的感应灯照明控制方法,包括:采集正确打开感应灯时多种声音的声音信息以构建声音数据集,其中所述多种声音至少包括说话、咳嗽和跺脚的声音,所述声音信息至少包括对应声音的MFCC系数;依据所述声音数据集中任意两个声音信息之间的相关性获取至少一个样本分布向量及其对应的特征值;将所述声音数据集中的所有声音信息投影至一个样本分布向量,得到所述样本分布向量对应的融合样本;基于所述特征值对所有融合样本进行加权求和,得到基准正确开灯声音;采集实时声音,响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,控制所述感应灯打开。

在一些实施例中,所述控制所述感应灯打开还包括:采集错误打开感应灯时多种声音的声音信息以构建错误数据集;获取所述错误数据集中至少一个样本分布向量及其对应的特征值后,得到基准错误开灯声音;计算所述实时声音与所述基准错误开灯声音之间的相似度;响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,且所述实时声音与所述基准错误开灯声音之间的相似度小于错误阈值,则控制所述感应灯打开;其中,所述错误阈值和所述设定阈值之和为1。

在一些实施例中,所述声音信息还包括对应声音的声音频谱、尖锐度、均方根能量和自相关度中的至少一个。

在一些实施例中,所述依据所述声音数据集中任意两个声音信息之间的相关性获取至少一个样本分布向量及其对应的特征值包括:计算所述声音数据集中所有声音信息的平均值,得到平均声音信息;将所有声音信息减去所述平均声音信息得到对应的去中心声音信息;计算任意两个去中心声音信息之间的相关性系数以构建相关性矩阵,其中所述相关性矩阵为M行M列的方阵,M为所述声音数据集中所有声音信息的数量,第i行第j列的数值为去中心声音信息i和去中心声音信息j的相关性系数;计算所述相关性矩阵的特征向量以及对应的特征值,将特征值按照从大到小的顺序排列,并选取前K个特征值对应的特征向量作为样本分布向量。

在一些实施例中,所述选取前K个特征值对应的特征向量作为样本分布向量中,K为满足设定关系式的最小值,所述设定关系式为:

其中,λ

在一些实施例中,所述基准正确开灯声音满足关系式:

其中,λ

在一些实施例中,所述实时声音与所述基准正确开灯声音之间的相似度满足关系式:

其中,S为实时声音的声音信息,

在一些实施例中,所述控制所述感应灯打开还包括:采集照明区域的亮度信息和声音响度信息;响应于所述亮度信息小于设定亮度值,所述声音响度信息大于设定响度值,所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,且所述实时声音与所述基准错误开灯声音之间的相似度小于错误阈值,则控制所述感应灯打开。

本申请实施例提供的上述基于人工智能的感应灯照明控制方法,通过采集正确打开感应灯时多种声音的声音信息以构建声音数据集,依据声音数据集中声音信息的分布构建基准正确开灯声音;依据实时声音与基准正确开灯声音之间的相似度可快速判断实时声音是否为正确打开感应灯的声音,当实时声音与基准正确开灯声音之间的相似度大于设定阈值时,控制感应灯打开,提高感应灯照明控制的实时性和准确性。

进一步地,依据声音数据集中不同声音信息的相关性获取多个样本分布向量,样本分布向量为声音信息分布集中的方向,获取每个声音信息分布集中的方向上的融合样本,以去除声音数据集中所有声音信息的冗余信息和噪声,并按照各个融合样本包含的信息量进行加权求和,得到基准正确开灯声音,基准正确开灯声音能够准确表征正确打开感应灯的多种声音的综合特征。

进一步地,考虑到声音数据集中声音数据的数量限制会使得基准正确开灯声音不精确,为避免由于基准正确开灯声音不精确造成感应灯控制不准确的情况,采集错误打开感应灯时多种声音的声音信息以构建基准错误开灯声音,利用基准正确开灯声音和基准错误开灯声音对实时声音进行双重验证,提高感应灯照明控制的准确性。

附图说明

通过参考附图阅读下文的详细描述,本申请示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本申请的若干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:

图1是根据本申请实施例的基于人工智能的感应灯照明控制方法的流程图;

图2是根据本申请实施例的控制感应灯打开的流程图;

图3是根据本申请另一个实施例的控制所述感应灯打开的流程图;

图4是根据本申请又一个实施例的控制所述感应灯打开的流程图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

应当理解,当本申请的权利要求、说明书及附图使用术语“第一”、“第二”等时,其仅是用于区别不同对象,而不是用于描述特定顺序。本申请的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

根据本申请的第一方面,本申请提供了一种基于人工智能的感应灯照明控制方法。请参阅图1所示,为本申请较佳实施方式提供的基于人工智能的感应灯照明控制方法的流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。

S11,采集正确打开感应灯时多种声音的声音信息以构建声音数据集,其中所述多种声音至少包括说话、咳嗽和跺脚的声音,所述声音信息至少包括对应声音的MFCC系数。

在一个可选的实施例中,在感应灯控制的历史过程中,当有行人通过照明区域时,感应灯会采集到声音数据,并根据采集到的声音数据控制感应灯的开关。但是车辆的汽笛声、下雨天的雨声等声音会使感应灯被错误地打开,故本申请采集历史过程中,采集正确打开感应灯时声音的声音信息,其中,声音信息至少包括正确打开感应灯时声音的MFCC系数;将采集到的所有声音的声音信息作为声音数据集。

其中,可通过拾音器采集正确打开感应灯时的声音数据,并提取声音数据的MFCC系数,得到声音信息;MFCC系数(Mel Frequency Cepstral Coefficents)又为梅尔倒频谱系数,是一种在语音识别中广泛使用的声音特征。

在其他实施例中,所述声音信息还包括正确打开感应灯时声音的声音频谱、尖锐度、均方根能量和自相关度中的至少一个。其中,所述声音频谱包括对应声音在不同频率的声音分量上的强度信息;所述尖锐度为高频成分在声音频谱中所占比例,用于反映对应声音的刺耳程度;所述均方根能量用于反映对应声音的音频能量;所述自相关度用于反映对应声音的周期性。

在其他实施例中,还可在感应灯控制的场景下,模拟能够正确打开感应灯时声音,并利用拾音器采集对应声音的声音信息以构建声音数据集。

可以理解地,当行人通过照明区域时,需要打开感应灯进行照明,故正确打开感应灯的声音至少包括说话、咳嗽和跺脚的声音。根据感应灯照明的场景需求,正确打开感应灯的声音种类也不同,比如,当感应灯用于道路照明时,为保证车辆和行人的安全通行,则正确打开感应灯的声音种类还可包括车辆汽笛声。

如此,得到声音数据集,所述声音数据集包括正确打开感应灯时多种声音的声音信息,且声音数据集中每种声音对应多个声音信息,为后续计算基准正确开灯声音提供数据基础。

S12,依据所述声音数据集中任意两个声音信息之间的相关性获取至少一个样本分布向量及其对应的特征值。

在一个可选的实施例中,所述声音数据集包括所有能够正确打开感应灯的声音信息,由于同种声音的声音信息之间相似程度较大,且不同声音的声音信息之间也会有一定的相似程度,也就是说,所述声音数据集中的声音信息存在大量的冗余信息,为了提取能够正确打开感应灯的所有声音信息的共同特征,应去除声音数据集中声音信息的冗余信息。

可以理解地,在构建声音数据集的过程中,声音信息不可避免地会有噪声,在去除声音数据集中声音信息的冗余信息同时,也会消除声音数据集中的噪声,进一步提高感应灯照明控制的准确性。

具体地,所述依据所述声音数据集中任意两个声音信息之间的相关性获取至少一个样本分布向量及其对应的特征值包括:计算所述声音数据集中所有声音信息的平均值,得到平均声音信息;将所有声音信息减去所述平均声音信息得到对应的去中心声音信息;计算任意两个去中心声音信息之间的相关性系数以构建相关性矩阵,其中所述相关性矩阵为M行M列的方阵,M为所述声音数据集中所有声音信息的数量,第i行第j列的数值为去中心声音信息i和去中心声音信息j的相关性系数;计算所述相关性矩阵的特征向量以及对应的特征值,将特征值按照从大到小的顺序排列,并选取前K个特征值对应的特征向量作为样本分布向量。其中,所述样本分布向量为所述声音数据集中所有声音信息主要的分布方向,且所述样本分布向量为单位向量。

其中,相关性矩阵为M行M列的方阵,可获得M个特征向量,且一个特征向量对应一个特征值,特征值可用于反映所述声音数据集中所有声音信息在对应样本分布向量上的信息量,特征值越大,表示对应样本分布向量上的信息量越大,所有声音信息在对应样本分布向量上分布越集中,也即对应样本分布向量上的信息为所有声音信息的共同特征。所述选取前K个特征值对应的特征向量作为样本分布向量中,K为满足设定关系式的最小值,所述设定关系式为:

其中,λ

其中,去中心声音信息i和去中心声音信息j的相关性系数满足关系式:

其中,h

示例性地,声音数据集中共包括M个声音信息,且一个声音信息包含N个维度,将M个声音信息沿着列方向进行排列,则声音数据集可表示为M×N的矩阵;计算任意声音信息之间相关性系数,得到M×N的相关性矩阵,进而样本分布向量可表示声音信息主要的分布方向,换句话说,样本分布向量为声音信息集中分布的方向。

需要说明的是,本申请与传统PCA不同的是,没有计算不同维度的相关性为声音信息进行降维,而是计算不同声音信息的相关性获取声音信息分布集中的主要方向,从而可以去除所有声音信息的冗余信息和噪声。

如此,依据不同声音信息的相关性获取多个样本分布向量,样本分布向量为声音信息分布集中的方向,为去除所有声音信息的冗余信息和噪声提供基础。

S13,将所述声音数据集中的所有声音信息投影至一个样本分布向量,得到所述样本分布向量对应的融合样本。

在一个可选的实施例中,得到样本分布向量后,对于一个样本分布向量P

Y

其中,A为所有声音信息组成的M×N的矩阵,N为一个声音信息包含的维度数量,P

其中,按照相同的方法获取每一个样本分布向量对应的融合样本,可将所有声音信息组成的M×N的矩阵转换为K×N的矩阵,即从M个维度为N的声音信息中提取所有声音信息的共同特征,得到K个维度为N的融合样本,即融合样本可去除声音数据集中所有声音信息的冗余信息和噪声,反映所有声音信息的共同特征。

S14,基于所述特征值对所有融合样本进行加权求和,得到基准正确开灯声音。

在一个实时例中,特征值能够反映声音数据集中所有声音信息在对应样本分布向量上的信息量,特征值越大,对应样本分布向量上的信息量越大,所有声音信息在对应样本分布向量上分布越集中;故特征值可反映对应样本分布向量上融合样本的信息量,即不同融合样本包含的信息量不同。依据特征值对所有融合样本进行加权求和,得到基准正确开灯声音,所述基准正确开灯声音满足关系式:

其中,λ

如此,依据特征值对所有融合样本进行加权融合,得到基准正确开灯声音,基准正确开灯声音能够准确表征正确打开感应灯的多种声音的综合特征。

S15,采集实时声音,响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,控制所述感应灯打开。

在一个实施例中,在实际控制场景中,在照明区域内部署声音采集装置,比如拾声器;声音采集装置采集实时声音,计算所述实时声音与所述基准正确开灯声音之间的相似度,具体地,所述实时声音与所述基准正确开灯声音之间的相似度满足关系式:

其中,S为实时声音的声音信息,

其中,将实时声音和基准正确开灯声音视为特征空间中的特征向量,余弦相似度计算的是实时声音和基准正确开灯声音之间的方向相似度,当实时声音和基准正确开灯声音的方向重合时,余弦相似度达到最大值1;距离相似度计算的是实时声音和基准正确开灯声音之间模长的相似度,当实时声音和基准正确开灯声音的模长相等时,距离相似度达到最大值1;即实时声音与基准正确开灯声音之间的相似度综合了方向和模长两个方面,当方向和模长均相等时,实时声音与基准正确开灯声音之间的相似度达到最大值1。

在一个实施例中,请参见图2,为根据本申请实施例的控制感应灯打开的流程图。响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,表示实时声音为正确打开感应灯的声音,则控制所述感应灯打开。其中,设定阈值为0.65。

其中,在控制所述感应灯打开之后,设定时间间隔后,所述感应灯自动关闭。

如此,仅需要计算实时声音与所述基准正确开灯声音的相似度,无需对多个预先存好的声纹特征值进行匹配,保证感应灯照明控制的实时性,且基准正确开灯声音包含正确打开感应灯时多种声音的共同特征,可保证感应灯照明控制的准确性。

在另一个实施例中,请参见图3,为根据本申请另一个实施例的控制所述感应灯打开的流程图。所述方法还包括:采集错误打开感应灯时多种声音的声音信息以构建错误数据集;获取所述错误数据集中至少一个样本分布向量及其对应的特征值后,得到基准错误开灯声音;计算所述实时声音与所述基准错误开灯声音之间的相似度;所述响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,控制所述感应灯打开,包括:响应于所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,且所述实时声音与所述基准错误开灯声音之间的相似度小于错误阈值,控制所述感应灯打开。

其中,所述“获取所述错误数据集中至少一个样本分布向量及其对应的特征值后,得到基准错误开灯声音”的方法与步骤S12至步骤S14中得到基准正确开灯声音的方法相同。

其中,所述错误阈值和所述设定阈值之和为1,例如,所述设定阈值的取值为0.65,所述错误阈值的取值为0.35。

考虑到声音数据集中声音数据的数量限制会使得基准正确开灯声音不精确;为避免由于基准正确开灯声音不精确造成感应灯控制不准确的情况,本申请进一步采集错误打开感应灯时多种声音的声音信息以构建基准错误开灯声音,利用基准正确开灯声音和基准错误开灯声音对实时声音进行双重验证,即所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,且所述实时声音与所述基准错误开灯声音之间的相似度小于错误阈值时,控制所述感应灯打开,提高感应灯照明控制的准确性。

在又一个实施例中,请参见图4,为根据本申请又一个实施例的控制所述感应灯打开的流程图。进一步采集照明区域的亮度信息和声音响度信息;响应于所述亮度信息小于设定亮度值,所述声音响度信息大于设定响度值,且所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,控制所述感应灯打开。

如此,即使所述实时声音与所述基准正确开灯声音之间的相似度大于设定阈值,也只有在黑暗环境且声音响度信息较大时,才会控制所述感应灯打开,避免能源浪费。

本申请实施例提供的上述基于人工智能的感应灯照明控制方法,通过采集正确打开感应灯时多种声音的声音信息以构建声音数据集,依据声音数据集中声音信息的分布构建基准正确开灯声音;依据实时声音与基准正确开灯声音之间的相似度可快速判断实时声音是否为正确打开感应灯的声音,当实时声音与基准正确开灯声音之间的相似度大于设定阈值时,控制感应灯打开,提高感应灯照明控制的实时性和准确性。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

相关技术
  • 一种微波感应灯进入不同模式的测试方法及微波感应灯
  • 一种基于SPI的RGB灯控制系统及其控制方法
  • 一种基于人体感应的照明控制方法及照明灯具
  • 一种基于人体感应的照明控制方法及照明灯具
技术分类

06120116486772